英國電腦科學家利用機器學習讓唇語解讀更精確，可協助聽力或語言障礙者溝通

圖片來源:

UEA大學

英國東安格利亞大學（University of East Anglia，UEA）的電腦科學家研發讀唇語技術，可以協助聽力或語言障礙患者溝通，甚至是協助解決犯罪。UEA電腦科學家Helen Bear表示，這項視覺化語音辨識技術可以應用在聲音不夠好的場所，來判斷談話內容。

Helen Bear與UEA電腦科學院教授Richard Harvey共同研發機器讀唇語分類系統，並透過不同的講話影片來訓練機器讀唇語分類系統的演算法，以辨識不同發音的唇形。

此系統使用的讀唇語演算法可以區分不同的發音，讓電腦能夠辨識「p」、「b」和「m」的發音唇形，提供更精確的翻譯，還可以在沒有談話上下文的情況下，或是沒有音訊的影片，如監視器的影像，也能辨識談話者所使用的單字。

Helen Bear表示，我們仍在學習視覺化語音的科學，以及建立讀唇語技術的防呆辨識模型，目前這項技術已經用來辨識足球員在球場上高聲呼喊的詞語或對話，而一個良好的讀唇語機器可以是影音識別系統的一部分。另外，Helen Bear也在上海IEEE聲學、語音和信號處理國際會議（ICASSP）上發表這項研究成果。

熱門新聞