圖片來源: 

UEA大學

英國東安格利亞大學(University of East Anglia,UEA)的電腦科學家研發讀唇語技術,可以協助聽力或語言障礙患者溝通,甚至是協助解決犯罪。UEA電腦科學家Helen Bear表示,這項視覺化語音辨識技術可以應用在聲音不夠好的場所,來判斷談話內容。

Helen Bear與UEA電腦科學院教授Richard Harvey共同研發機器讀唇語分類系統,並透過不同的講話影片來訓練機器讀唇語分類系統的演算法,以辨識不同發音的唇形。

此系統使用的讀唇語演算法可以區分不同的發音,讓電腦能夠辨識「p」、「b」和「m」的發音唇形,提供更精確的翻譯,還可以在沒有談話上下文的情況下,或是沒有音訊的影片,如監視器的影像,也能辨識談話者所使用的單字。

Helen Bear表示,我們仍在學習視覺化語音的科學,以及建立讀唇語技術的防呆辨識模型,目前這項技術已經用來辨識足球員在球場上高聲呼喊的詞語或對話,而一個良好的讀唇語機器可以是影音識別系統的一部分。另外,Helen Bear也在上海IEEE聲學、語音和信號處理國際會議(ICASSP)上發表這項研究成果。


Advertisement

更多 iThome相關內容