當電腦應用在生活中越來越普及,而中文輸入法對許多人仍顯困難時,中文的語音辨識技術就顯得十分有用。

工業技術研究院電腦與通訊工業研究所(電通所)有個前瞻技術中心,他們在中文語音技術方面有不少研發項目。在這次資訊月的產業科技館中,就展示了三套系統,並且已有廠商運用這些技術製成產品上市。

這三套系統分別是「8051語音辨識系統」,「中文文字轉語音系統」和「2.4Kbps語音編碼系統」。

當電腦應用在生活中越來越普及,而中文輸入法對許多人仍顯困難時,中文的語音辨識技術就顯得十分有用。電通所所研發的這套語音辨識系統的核心技術,可以應用於多國語言,提供線上使用者語音資料庫的訓練與建立,並可接受單音字或短詞的語音辨識。

現場有一套「小騰子聲動魔法書」,就採用了這套核心技術。這套教育光碟可以完全以聲控的方式來操控畫面,教學內容是國字與日常生活語彙的學習,號稱真正是眼耳手心口五到的充份學習。螢幕上所有指令和字詞,讀給電腦聽,它就能執行。

語音辨識系統,還可以應用在聲控產品,互動式玩具、語音遙控器;和電腦語音輸入系統、以及電話語音撥號系統等。

中文文字轉語音系統,也就是中文語音合成系統,它的關鍵技術在於讓電腦能夠合成像真人說話般自然且具抑揚頓挫感的聲音。目前電通所已做到可以即時把電腦內的中文檔案、或是當場由鍵盤輸入的中文資料讀出來的程度,聲音的品質不錯。

在相關的產品應用方面,目前電通所是研發了一套「EMail Reader」電子郵件隨聽系統,讓使用者可以撥電話到自己的電腦上,聽取系統把所收到Email的標題或內容讀給你聽。不過這套軟體必須配合一塊dialogic D/41E卡,讓電腦與電話線連起來,才能轉email文字檔為合成語音。可惜的是目前還未有產品上市。

2.4Kbps語音編碼系統則是將語音訊息壓縮與還原的技術,可以應用在聲音儲存設備,如數位答錄機;或是網際網路上的語音郵件、網路電話等需要傳送聲音的軟硬體技術上。

熱門新聞

Advertisement