【臺灣第一代AI專家解密】電腦能翻103種語言，為何Google Home仍不會說中文？

Google臺灣董事總經理簡立峰

圖片來源:

iThome

不過才過了2、3年，科技產業已經從行動第一風潮，現在轉向了AI第一的氛圍。尤其去年AlphaGo打敗了世界圍棋冠軍，讓人們開始擔心起，AI跟人類之間出現的競爭關係，AI會不會取代人類的聲音似乎多了起來。

其實，「AI已經發展了30年，並非是新的議題。」Google臺灣董事總經理簡立峰笑著說，例如Gmail內建已久的垃圾信件過濾就是機器學習的應用。他可說是臺灣第一代人工智慧專家，早在1993年就和他的老師臺大電機系教授李琳山共同發表了中文語音辨識設備，簡立峰後來更因大量中文資訊檢索研究的貢獻，被稱為中文搜尋第一人。

但是，為何這一波AI科技影響會這麼大？簡立峰認為，深度學習技術帶來機器學習演算法上的突破，最大關鍵是可以善用大量資料。

類神經型網路的機器學習技術推出多年，但過去就算有大量資料，學習模型不見得會有明顯改善，甚至讓過去的學者以為，資料得無限多才能有好結果。

但「這幾年發現，資料量大非常重要，可是不需要到無限大。」簡立峰指出，只要學習演算法在特定理論架構和經驗值的調校下，就能有很大的進步。Google也將深度學習經驗，開發出了Tensorflow深度學習框架開源釋出，進而催生了大量深度學習應用，來加速機器學習和人工智慧的發展。

目前機器在不少領域如文字辨識，影像辨識已經可以媲美人的能力，「當一件事無法判斷是人做的還是機器做的，代表AI可以做到不錯的程度。如機器翻譯已有相當品質了。」簡立峰說。

2006年，Google來臺設立據點，第一位員工就是簡立峰，他進入Google的前3個月，就參加了當時Google的機器學習研發小組，是這個團隊的第四位科學家，就是從事機器翻譯技術的研發。相較於現在，「我非常清楚，一開始機器翻譯的品質有多差，幾乎不敢推出產品。」他說，隨著大量Google搜尋累積的大量資料，和群眾建議修改的改善，才讓大幅改善了機器翻譯的品質。

因為全球網路多達50%的內容是英文，但英文使用者只占20％，要讓更多人有能力搜尋更多資料，內容自動翻譯是關鍵，這也是Google開始重視機器翻譯技術的關鍵。目前，Google翻譯已經可以支援103種語言。每天要提供超過10億次翻譯請求，每月常用的使用者超過10億人，而臺灣更是Android版Google翻譯用戶成長最快的地區，過去一年來使用規模成長了2倍。

10年前，Google利用同樣網路內容的不同語言版本，來訓練機器學習模型，例如同一個網頁有英文和日文版，就可以將句子切割成小塊的語言單位，例如字、詞或片語，再來進行逐字或逐詞的翻譯，最後再把每一個翻譯過的詞，拼成想要翻譯的語言的句子。Google用這個方法翻譯了數十億筆網路文件。

深度學習讓機器翻譯語句更通順，更像人工翻譯

Google翻譯產品經理Julie Cattiau稱這是一種片語式機器翻譯（Phrase-Based Machine Translation），可行但翻譯後的句子是詞句分離且片段的。直到2015年9月，Google開始用TensorFlow深度學習框架來改善機器學習。2016年9月時更宣布完成了Google神經機器翻譯系統（Google Neural Machine Translation，簡稱GNMT），可以將整句話視為一體來翻譯，能利用數百萬個語句來訓練翻譯模型，讓機器翻譯出語意連續且更通順的句子，讓機器翻譯品質更接近人工翻譯一步。

Google在2016年9月推出利用GNMT技術的中英對譯服務，到今年5月已有超過41個語言組，採用GNMT來改良翻譯品質。Julie Cattiau表示，目前Google翻譯可以支援103種語言翻譯，等於有103╳103超過上萬個語言組（中翻英和英翻中視為2個語言組），每次訓練出一個語言組所需的GNMT模型，需用準備上億筆訓練資料，使用8個Google處理器，花2～3周時間才能完成。

多元語言翻譯已成為可能，已有10種語言組採用

所以，Google去年11月時，更進一步開始打造一套多元語言翻譯系統稱為Zero-Shot，例如只要使用英日翻譯、韓英翻譯的訓練後，就可以讓系統自動產生日韓的翻譯模型。Zero-Shot的運作關鍵是運用大量多語語句素材，來找出相同語義的不同語言用詞，就可以依據語義來進行翻譯，例如用英翻日和韓翻英的語料，找出「吃飯」這個語義的日文、英文、韓文用詞，就可以進行日韓、韓日的翻譯，而不需要日翻韓的語料。目前，Google已有10組語言使用Zero-Shot翻譯訓練方式。

但是，儘管Google機器翻譯技術發展到如此境界，已經可以翻譯上百種語言，Google去年發表的Google Home智慧喇叭卻遲遲無法支援中文，甚至還不知道能夠推出的時程。

簡立峰解釋：「翻譯跟對話是兩種截然不同的挑戰。」機器翻譯常見的作法是，對一句英文找出幾百種中文翻譯用法，再從中找出使用率最高的一種。「翻譯可說是一種選擇題。」只要統計出不同語言詞句之間的關係，就能做得到，但「機器無法真的理解。」他說。

舉例來說，「把燈打開，不夠亮，再開一點」這樣簡短的幾句話，雖然第二句「不夠亮」中缺了主詞，但人可以理解這是指「燈」的亮度，可是對電腦而言，要知道文句中沒有顯示的主詞是燈，甚至是哪個位置的燈，「難度非常高。」簡立峰說：「越簡短的句子，省略越多，機器理解的難度越高。」

除了技術問題，另一個挑戰是用來訓練理解用的資料很難取得。因為生活空間很少保留這類對話資料，儘管像Google Home可以支援英文的理解，但要轉換支援另一個語言，就需要重新蒐集資料，因此更難像機器翻譯那樣可以支援到103種語言。而更進一步讓機器進行對話的難度更高，得讓機器理解對話的前後文關係才行。

簡立峰表示：「AI不能做什麼，比可以做什麼的議題更重要。」目前，AI可以發揮作用的是在特定領域，要累積大量資料，且這個領域的行為可以預測，可以透過資料訓練和學習來累積知識，才能發揮作用。

機器學習不能學所有的事，而是學習有規範的資訊

另外，人類還有許多種能力，無法透過資料來學習，例如腦中決策、理解、判讀和聯想能力等。像推理能力這幾年研究進展還很有限，尤其這類領域幾乎沒有資料可用於訓練，不容易有突破。

不過，透過資料訓練出人不能理解的知識，例如垃圾郵件攔截，已經可以產生智慧化的服務，已經可以具有商業應用價值，「機器學習等於是大數據的再延伸，」他說，利用資料探勘加上類神經技術後，可以有更大的進展。

「缺乏訓練資料，知識不知如何產生，偏重語意理解的領域，這對AI來說還是很難！」簡立峰強調，不能過度將機器學習視為可以解決人工智慧的所有問題，「機器學習不能學所有的事，而是學習有規範的資訊。」

100項 IT人不可不知的AI發展

No.017 深度學習技術開始讓機器翻譯更通順，接近人工翻譯

No.018 Google多元語言翻譯引擎能自動翻譯新語言

No.019 機器無法學所有的事，只能學習有規範的資訊

相關報導 AI 100（上） AI 100 （下）

熱門新聞