日立週一(10/6)研發可在大規模錄音資料中快速搜尋日文關鍵字音源的搜尋技術,並實證2000小時的錄音中只要3秒即可完成搜尋,今後將廣泛運用此技術於客服中心或影音媒體。

日立的新技術是把錄音資料的聲音轉換為編碼符號,接著透過索引的方式保存各符號,如此各符號出現在哪個時間就一目了然,再加上搜尋時自動過濾刪除不必要的索引項目後,就能找到符合條件的音源資料。

處理上述搜尋後,接著還要將每個人不同的說話腔調、音量等特徵轉換為數值後再進行兩次階段搜尋,藉此提升精確度。在總計三次的搜尋中卻只要3秒時間,都要歸功於日立整合在此技術中的高速搜尋技術。

這項搜尋技術將參加10/8於澳洲舉辦的IEEE訊號處理委員會2008國際多媒體訊號處理研討會,而實驗中用來辨識聲音特徵與評估系統效能的工具則是使用東京工業大學、日本獨立行政法人國語研究所&資訊通信研究機構所開發的「日文對話語言資料庫」。(編譯/張嵐霆)

熱門新聞

Advertisement