圖片來源: 

攝影_王宏仁

Google今日(28日)趕在AWS年度大會re:Invent登場前,在日本東京舉辦#MadeWithAI活動,介紹Google在AI技術上的發展和新進展,Google在過去就持續投入AI領域的研究上,近幾年更是將AI技術帶入自家的產品,Google資深研究員Jeff Dean揭露,Google發展AI的3大方向即是使產品更有用、協助他人創新、解決人類的挑戰。

Jeff Dean表示,AI的概念在電腦科學的領域已經存在超過50年,主要是要讓電腦擁有類似人的智慧,過去的演算法通常是用規則模式(Rule-based)來編寫,但是在近10~20年,開發人員慢慢地發現不是所有的事都有規則可循,就像要辨識圖像中的動物是獵豹還是美洲豹的問題,很難用規則的方式來區分。

因此,機器學習成為打造問題解決系統的新方法,是AI技術的一大部分,藉由匯入大量的資料集,經過不斷學習找出模式(Pattern),讓電腦變得更聰明進而產生預測,今年打敗人類棋王的電腦圍棋程式AlphaGo即是用機器學習讓電腦學習大量的棋譜,找出下棋的模式。

其中,目前最熱門的一種機器學習是類神經網路,由於計算能力的增長促使類神經網路模型更加準確,類神經網路是模擬人腦的運行,透過一層層的處理和辨識,理解出模式,舉例來說,圖像辨識的任務就是先給予電腦大量的圖像,並將圖像標上標籤(Label),經過多次學習,類神經網路就能透過圖片的特徵來辨識影像。

Jeff Dean表示,類神經網路能夠處理圖像、語音和文字等,他舉出目前機器學習的多個應用,像是辨識圖片物件、語音轉文字、文字翻譯,以及匯入一張圖片,電腦能自動產生一段對影像的描述。

將AI技術帶入自家產品

Google除了開發AI技術,也將AI技術帶到了自家產品上,包括Google Photos、智慧型手機Pixel相機、Google Assistant、Google翻譯、Google地圖等,舉例來說,使用者能夠在Google Photos中透過關鍵字自動搜尋相關的圖片,即是使用深度學習自動辨識圖片中的物件,Pixel相機則是由於機器學習演算法能夠自動辨識圖像的遠近,因此不需要透過光圈就能創造出景深的效果,而Google Assistant能夠理解自然語言與人類互動,成為人類的助手。

Jeff Dean表示,Google翻譯更是在近幾年因為機器學習有更大的進展,目前已經可以提供97組語言翻譯,翻譯的結果也越來越準確,未來還可能結合耳機,讓使用者透過耳機和Google翻譯,在對話的過程中,同步聽見翻譯結果。

Google在語言的研究上也有新的進展,Google語言研究計畫總經理Linne Ha表示,全球有6千種語言,其中超過400種語言有100萬以上的人在使用,還有許多不同的方言,但是網路上卻有超過50%都是英文網頁,這樣的不平衡會造成知識取得不易,因此,Google透過深度學習,在今年能夠辨識的語言新增了20種語言。

除此之外,Google還正在為較少資源的語言,建立文字轉語音的系統,稱為Unison專案,每個語言收集約10位講該語言的人聲,每位講45分鐘,大約2千個片語,經過系統處理創造出一個平均的聲色,目前Google已經建立孟加拉語、高棉語、尼泊爾語、僧伽羅語、爪哇語、印尼的巽他語。

「Google語言研究下一步是方言,」Linne Ha表示,未來Google要打造可以辨識不同腔調的語音,像是新加坡英文,甚至,Linne Ha還揭露了目前Google正在發展雙語的語言辨識系統,第一個是廣東話。

用機器學習框架TensorFlow打造出多元應用

Google在2015年以Apache2.0授權模式,開源釋出機器學習框架TensorFlow,即是希望提供AI工程師、某些領域的專家和一般使用者開源的AI工具,讓大家都可以使用AI技術創造新應用,TensorFlow在2年內已經成為最熱門的機器學習框架,目前,TensorFlow已經被用在節能、環境保育和健康醫療等領域上,例如,Google機房與DeepMind合作打造深度學習模型有效降低機房能源,Google研究團隊也運用TensorFlow來打造乳癌和糖尿病視網膜病變辨識系統。

除了Google自家的產品和應用之外,另一個值得注意的是,日本百年食品大廠Kewpie過去也透過TensorFlow,建立生產線原料檢查系統,辨識生產線上不合格的馬鈴薯塊,現在更進一步,以100萬個馬鈴薯塊當作資料集,系統經過不斷學習,用AI技術選出優良的馬鈴薯塊,Kewpie食品廠產品線負責人Takeshi Ogino也親自到場展示將在2個月後完成的雛型機器運作影片。

環境保育的應用上,也有紐西蘭的生態學家Victor Anton透過TensorFlow建立辨識紐西蘭鳥類叫聲的系統,因為紐西蘭擁有眾多特有種鳥類但是目前瀕臨絕種,為了採取復育的行動,Victor Anton打造了圍欄保護區並裝設錄音裝置,掌握各種鳥類的行蹤,Victor Anton花了1年的時間,收集約1萬5千個小時的鳥類叫聲音檔,人類可能要花上2年的時間才能聽完,因此,Victor Anton將聲音轉為光譜圖再辨識出是哪一個種類的鳥類,建立完的辨識模型經過次訓練即可產生分類結果。

Google AI發展的下一步

Jeff Dean表示,讓AI普及化的挑戰在於提供不同領域的專家機器學習技術,並讓AI成為更公平的工具,「人才的確是一大挑戰!」Jeff Dean坦言,在2012年Google內部的工程師只有少於1千人有機器學習的背景,為了加速AI技術開發,Google建立一套AI訓練系統訓練人才,提供內部工程師機器學習課程,目前完成機器學習訓練的工程師已經超過1萬8人,Jeff Dean更宣布:「Google會在明天年初將機器學習線上課程免費釋出!」提供大家學習機器學習技術的管道,課程與Google內部培訓的課程為同一套,目前Google尚未公布確切釋出的時間,不過,以明年初時間推估,Google可能會在明年3月舉辦的Next大會中發表。

在研究方面,Google正在打造機器學習的自動化流程,透過兩個網路相互回饋自動學習,針對特定任務進行訓練,找出最佳的模型,目前約有1萬5千個模型不斷地進行自動化訓練。

熱門新聞

Advertisement