圖片來源: 

Google

美國伊利諾大學香檳分校(University of Illinois Urbana-Champaign,UIUC)本周發表了語音無障礙專案(Speech Accessibility Project),並宣布該專案已取得了來自Amazon、蘋果、Google、Meta與微軟等五大科技業者,以及其它非營利組織的支持,以讓語音辨識能夠包容更多樣化的語音模式,造福更多的殘障人士。

主導該專案的UIUC電子暨電腦工程教授Mark Hasegawa-Johnson表示,能夠利用語音與裝置交流或操作裝置,對數位經濟時代的任何人都是重要的,語音介面應該支援所有人,包括殘障人士在內。

Hasegawa-Johnson指出,這是一個困難的任務,因為它需要龐大的基礎設施,最好是得到由領先技術業者所支持的基礎設施,因此他們已經建立一個跨學科的團隊,邀請了語言學、語音AI、安全及隱私等各方面的專家,以協助面對此一挑戰。

此一專案的源由來自於現代的語音辨識系統有所不足,例如語音助理或翻譯工具並不總是能辨識那些障礙人士的各種語音模式,像是漸凍人/硬化症、帕金森氏症、腦性麻痺或唐氏症,不管是這些或其它社群的許多人,可能都無法自最新的語音辨識工具中受益。

由於科技業者可藉由人工智慧與機器學習技術,來提供更具包容性的語音辦識能力,語音無障礙專案即負責蒐集代表這些不同社群的語音樣本,研究人員計畫付費招募自願者來貢獻語音樣本,建立一個匿名的資料集,以用來訓練機器學習模型,讓各種模型更能理解不同的語音模式,且初期將鎖定美國英文。

除了五大科技業者都同意在技術上支援該專案之外,專門幫助帕金森氏症病患的 Davis Phinney Foundation,及罹患硬化症的前美式足球員Steve Gleason也都承諾將支持此一專案。

熱門新聞

Advertisement