科幻電影中常見到人類直接用語音和電腦溝通的畫面,過去語音科技發展受限於硬體,然而近年硬體水準已漸漸達到語音即時輸出的需求。聲碩科技專注在研發中文語音技術,新成立的「語音科技研究中心」將扮演語音核心技術元件提供者,將學術單位的研究成果導入產業界,並發展語音IC,可望晉身為海峽兩岸中文語音科技的研究中心。

中文語音科技走入人類生活已漸露曙光,聲碩科技今天(8/20)宣布成立「語音科技研究中心」,將結合學界研究、研發技術與產品應用三大領域,藉上游到下游一貫整合,推動本土中文語音科技產業發展。

科幻電影中常見到人類直接用語音和電腦溝通的畫面,過去受限於硬體技術,電影中的情境似乎遙不可及,然而近年硬體水準已漸漸達到語音即時輸出的需求,語音技術在經過十多年的孕育之後,也日臻成熟。聲碩科技專注在研發中文語音技術,新成立的「語音科技研究中心」將扮演語音核心技術元件提供者,將學術單位的研究成果導入產業界。

聲碩科技總經理楊大衛表示,台灣不少研究單位如國科會,投入語音科技開發已有十多年歷史,但研究成果多留在實驗室當中,並未落實到一般生活應用。因硬體的運算能力漸漸能應付語音運算所需,中文語音技術發展至今,已進入開花結果的階段,然而對大部分的軟硬體業者來說,語音技術是另一個困難的領域,因此聲碩成立「語音科技研究中心」,整合中文語音科技人才研究成果,將技術商品化,並聯合相關資訊產業開發各種語音應用產品。

楊大衛解釋,聲碩的「語音科技研究中心」研究重點可分為四大項,「語音輸入」提供一般電腦使用者以語音代替鍵盤的輸入方式,「語音命令」則能夠用語音直接操作電腦或其他設備,「電話語音」則可以讓人直接用口語在電話中和資料庫溝通,省卻繁雜的按鍵操作系統,「語音引擎」則提供語音技術核心元件,各種應用產品只要套上語音引擎系統,即可啟動語音操作功能。

目前聲碩在「語音輸入」方面有「說亦通」系列問世,「語音命令」方面則有「說會通」,楊大衛表示,「電話語音」目前鎖定在股市查詢系統,預計明年可正式發表,「語音引擎」則還在研發當中,未來將提供各種語音功能套件,授權給資訊業界開發相關產品,如電信、家電、消費性電子等,以增加產品的附加價值,並讓更多人享受語音科技的成果。
今天聲碩也展示「電話語音」在股市系統的運用,使用者只要說出「我要xx股票今天的價格」,系統即會以語音回覆所有相關情報,甚至使用者說「謝謝」時,系統都會回答「不客氣」,十分人性化。

楊大衛透露,未來聲碩的研究方面將擴展到語音IC研究,也就是透過語音IC與各種電子產品結合,走入日常生活。此外,也希望將「語音科技研究中心」發展為海峽兩岸中文語音科技的研究中心,並走向多個語言化,除了中文繁簡體之外,逐步加入其他國家的語言。

不少中文連續語音輸入軟體選在今年問世,不過所採用的辨識核心可分為「IBM」和「聲碩」兩大陣營,IBM 的ViaVoice核心技術開發已有27年的歷史,聲碩則是技轉自台大教授李琳山主導的國科會「金聲三號」計畫。

目前擔任計算語言學會理事長,中時也是中研院研究員的李琳山教授表示,台灣的語音技術和世界上其他國家比起來不遑多讓,很有競爭的機會,IBM 的ViaVoice是以拉丁語系的核心套上中文,從長遠來看,針對華文語系開發的本土技術更符合中文的語言結構,如一字一音、多同音字、字詞間關聯等,辨識效果會更好。

李琳山表示,目前大陸也有不少研究單位投入中文語音研發,如北京清華大學、哈爾濱科技大學、中科院自動化所等,但還沒有具體成果問世。

聲碩科技成立於1998年5月,前身則為大時科技的語音事業部,大時科技看好語音科技未來發展,因此將該部門獨立為新公司,是國內少數具有語音科技研發技術的業者。

聲碩科技聯絡電話:(02)2739-5778

熱門新聞

Advertisement