今年是臺灣AI應用快速起飛的一年,不只超過4成企業要用,消費市場中的AI產品接連出籠,語音助理,智慧喇叭紛紛登臺。但是,這些AI消費產品,企業AI技術,大多源自國外廠商,甚至有不少臺灣品牌的智慧喇叭,用的卻是來自中國的AI語音引擎,所以,講起中文來,帶點捲舌音,一早打招呼用的是「早上好」。

臺灣頂尖在地AI技術力在哪?我們問了自己這個問題,所以,從年初至今,一連製作了好幾個封面故事來探討這個問題。

2月中的「為何語音助理的中文不夠臺」封面報導,追蹤臺灣的中文語音引擎技術在哪裡?找到了臺灣AI實驗室的雅婷App,語音辨識不輸國外,連鄉民用語都能分辨。還有借力使力的老牌音響商淇譽電子,引進工研院技術團隊,搶進了醫用智慧喇叭市場,以及長年投入的中文自然語言處理技術研究的中研院中文詞知識庫小組,要來打造百萬詞規模的本土語音應用軍火庫。

接著,4月中,聚焦今年最夯AI的產業:醫療業,製作了「AI如何成為醫生第三眼」封面報導,不只剖析醫療影像AI爆紅關鍵,更披露了三家大型醫院AI應用實例,臺北榮總的MRI影像腫瘤輔助診斷系統,準確率高達95%。而北醫附醫則打造了全球首套肺癌病灶語意描述資料庫,要讓AI不只是找出病灶位置,還能自動描述病灶的特徵。中國醫藥大學附設醫院的乳房超音波AI輔助診斷系統,則能分辨出極小的初期病灶良惡性程度,提早3年發現可以早治療。還特別介紹了一家專門挑戰超高難度數位病理AI的雲象科技,他們與林口長庚醫院合作開發的鼻咽癌AI偵測模組,準確率更達97%。

7月初的AI封面故事「臺灣臉部辨識技術力」,更是格外讓人興奮。老牌影音軟體商訊連科技的臉部辨識技術,準確度名列全球臉部辨識20強,速度更是第3快。而電信龍頭中華電信更是投入人臉辨識10年了,百萬臉孔訓練的辨識引擎在實驗室準確率測試達到99%。臺大資工系教授徐宏民的CMLab實驗室團隊,去年更在全球偽裝人臉辨識競賽奪冠,識破上萬張各種偽裝的臉部照片,更是唯一達到9成辨識率的團隊,遠遠超越了美、中、俄的研究團隊。

不論是中文語音辨識引擎、醫療影像辨識技術或臉部辨識引擎,都面臨同樣的挑戰,就是在地化資料的影響。

中華電信用百萬外國人臉訓練的99%辨識引擎,初次自家員工測試,辨識率竟然不到8成,但多加幾千張臺灣人臉來訓練後,準確率又回升了一成。訊連更是為了讓在地辨識的準確率,從98.9%提升到99.8%,不惜追加訓練了百萬張亞洲人臉。就連中國信託也決定下海,花了4個月從無到有研發一套AI臉部辨識引擎,還取得國際臉部辨識資料庫排名第10的佳績,未來還想能分辨物體和商品。

不只深度報導,我們也展開了一系列臺灣頂尖AI技術力的案例追蹤,半個月前介紹了一家臺灣AI新勢力Deep01的腦出血輔助判讀AI,不用30秒能從上百張腦部電腦斷層掃描(CT)中找到出血點,準確度不輸國外剛通過美國FDA核准的腦出血AI產品,臺大醫院等6家教學醫院決定加入臨床測試。

最近則拜訪了自然輸入法之父許聞廉,這一款問世快30年但仍舊是許多人至今慣用的中文輸入法(我也是其中之一),早在發明之初,就結合了中文語意分析技術,從700萬個中文詞中,歸納出近萬條規則供自動選字、自動校正之用。

數十年在中文自然語意理解的研究功力,去年,許聞廉與研究團隊,設計了新的機器學習語言模型,打造出一套具備深度中文理解能力的全新問答系統,可以看懂用中文描述的小學三年級數學題,不只能看懂每一個句子給出的假設條件,還能理解句子背後隱藏的意圖,即使換個問法也難不倒它。這是目前機器學習研究最難的挑戰,許聞廉團隊突破了,未來還將支援英文數學題的解題。

半年來,我們已報導了不少頂尖、甚至早已揚名全球AI圈的臺灣在地技術團隊和企業,但我們想要揭露更多,讓大家更看見,臺灣在地AI技術力,的確不輸全球,也歡迎大家來分享。

專欄作者

熱門新聞

Advertisement