臉書AI研究院團隊用12個資料集,以ViLBERT模型為基礎,開發出一套電腦視覺+自然語言的預訓練模型,可有效解不同類型的任務。

重點新聞(1220~1226)

臉書AI研究院    電腦視覺     自然語言  

12合一!臉書AI研究院用一套ViLBERT模型,搞定不同類型資料集的ML訓練任務

電腦視覺結合自然語言的任務有許多種,比如影像問答、圖說影像檢索等,通常,每種任務都有各自的解法,但這些解法所用的技術,相似度非常高。

於是,臉書AI研究院聯合喬治亞理工學院、奧勒岡州立大學,設計一套預訓練模型,可用來解決不同類型的電腦視覺與自然語言任務,讓開發者不需要針對每個任務,重新訓練模型。團隊以電腦視覺與自然語言預訓練模型ViLBERT為基礎,利用12個資料集來訓練模型,並聚焦於四大方向:影像問答(比如圖中小孩穿的衣服是什麼顏色?)、指稱表達(比如以不同顏色的框線,表達圖中不同物體)、多模態驗證(比如敘述圖中任務的動作,並判斷對錯),以及圖說影像檢索(也就是以文字總結影像內容)。在資料集部分,團隊採用了3個影像問答資料集(VQAv2、GQA和VGQA),2個影像檢索資料集(COCO和Flickr30K),5個指稱表達資料集(RefCOCO, RefCOCO+, RefCOCOG, Visual7W, and GuessWhat),以及2個多模態驗證資料集(NLVR2和SNLI-VE)。

測試結果發現,不僅光單一個新模型就能應付不同類型的任務,還將所需的30億個參數,減少至2.7億個,而且任務表現還平均提升了2.05分。(詳全文)

  國發會     景氣循環    預警系統  

景氣不佳先知道!國發會擬研發景氣AI預警系統

國發會主委陳美伶日前在年終記者會上指出,為更精準掌握景氣循環,國發會研擬打造一款景氣循環轉折預警系統。國發會表示,景氣循環是指總體經濟循環波動的現象,完整周期包括了谷底至高峰的擴張期,以及高峰至谷底的收縮期。目前,臺灣已經過14次景氣循環,第14次高峰為2014年10月,谷底則是2016年2月。目前處於第15次景氣擴張期。

但是,雖然第14次谷底是在2016年2月,國發會卻在2018年3月才發布,整整遲了2年之久。為改善這個問題、精準掌握景氣變化,國發會研究單位已與智庫合作,要透過巨量資料分析和AI,來發展景氣預警系統。(詳全文)

  台杉投資    AI科技基金    國發會 

國家級投資公司將啟動AI科技基金募資,規模至少60億

由國發會率領民間團體成立的國家級投資公司台杉投資,近日已與美國重量級創投業者洽談投資事宜,並籌畫成立AI科技基金,募資對象包括政府、金融投資機構和電子五哥等科技大廠,聚焦於產業AI化發展,預計2020年下半年啟動,規模60億元起跳。

台杉總經理翁嘉勝表示,AI科技基金將是台杉第四檔創投基金,前三檔依序為物聯網基金、生技基金,以及目前正在規畫的國際生技創投基金。他指出,就AI科技基金來說,台杉希望與矽谷建立連結,目前已與多家國際級AI技術團隊和創投洽談,瞄準技術研發,希望能讓對方在臺成立研發中心,讓臺灣成為亞洲AI樞紐。(詳全文)

  震旦    AI面試       求職  

震旦辦公雲推AI面試系統,靠AI分析求職者自拍影像為人格特質打分數

震旦集團旗下辦公雲日前推出AI面試系統,透過AI分析求職者自拍影像,來歸納人格特質,協助人資單位評估合適的人選。進一步來說,這個AI面試系統為鳳凰互動開發的HRDA,可根據求職者的影片,分析86個微表情,並利用MFCC演算法取得聲音的特徵、語速,結合新修訂的人格量表,利用CNN抽取特徵,歸納出開放性、責任心、外向性、親和性、情緒穩定性五大人格特質。

AI完成人格分析後,人資部門、業務單位主管便能從後臺的管理系統,檢視每位求職者錄製的影像,以及AI的人格特質評分結果。此外,人資還可自訂徵才題目,或是從AI面試系統內建的題庫選題。震旦辦公雲副總經理林敬寶表示,AI面試系統可節省企業人資單位在初選求職者的流程。(詳全文)

  Pixel    語音轉文字     Google  

Pixel手機如何精準聽打?Google揭露關鍵語音轉文字技術

Google近日揭露Pixel手機上新型錄音App Recorder背後的技術。Recorder不只能將語音轉譯為文字,還可視覺化顯示聲音的類別,並建議標題標簽給用戶。

Google指出,Recorder透過裝置上的語音自動辨識模型,即時轉譯為文字,可將單詞對應到時間戳記來形成對話索引,方便用戶尋找特定內容與放播放時間點。不只如此,為更進一步簡化搜尋功能,Google將錄音中的聲音以波型表現,用不同顏色來表示不同聲音類型,比如狗叫或樂器演奏。

而在錄音的當下,Recorder也即時分析內容,以便在錄音結束時,提供標題建議。Recorder以對話資料以及字詞頻率和特性等文字特徵訓練決策樹,計算單詞和雙字詞分數,在濾掉禁用詞與髒話,最後輸出前三名的結果,做為參考。(詳全文)

中原大學     智慧農業      物聯網  

中原大學結合物聯網與AI模型,打造農場智慧管理系統

中原大學日前展示自家團隊開發的AIoT智慧農業監控系統,融合了自行研發的即時影像監測、自動化種植和遠端數據監視等功能,可助農民遠端監測,透過手機或電腦即可預估收成時間,以及作物健康狀態。

進一步來說,這套系統由中原大學電子系教授鍾文耀領軍,以自己最擅長的積體電路和系統設計,結合化工系微藻養殖、應術系大數據分析團隊的特長,開發而成。鍾文耀指出,該系統整合了光照度、光日照量累積值、二氧化碳、溫度和濕度感測器,以及手持式感測系統和無線傳輸的溫室感測系統,可收集多種參數,農民也可依據不同環境和對象,選擇不同系統來建立生產履歷,並掌握作物動態、預估收成時間。未來,團隊希望能加強室外電源自給的監控、遠距無線傳輸技術,讓系統可在室外不同天氣條件下,也能保持監控功能。(詳全文)

長榮航空   客服機器人     自然語言  

長榮航空推出AI客服機器人,500項資訊一觸可及

長榮航空日前推出AI客服機器人EVA,整合了自家訂位票務、班機抵達離境時刻表、購票、行李額度查詢、特殊需求和機場運行等多達500項資訊,透過自然語言處理(NLP)技術,來精準回答使用者在官網或App上的文字來查詢。

長榮航空指出,EVA是以3萬句對話訓練而成,包括中英夾雜的旅行語句。研發團隊表示,要是EVA無法回答問題,也可在上班時間,轉由客服真人回答。EVA上線後,團隊將持續觀察回答問題的狀態,持續拓展EVA的專業知識,未來視需求,不排除新增其他語言版本或其他媒體版本。(詳全文)

語音助理    智慧家庭     網路協定  

語音助理三巨頭和Zigbee聯盟成立工作小組,要打破智慧家庭產品不互通的隔閡

Amazon、Apple、Google和無線網路協定聯盟Zigbee宣布組成智慧家庭產品工作小組Connected Home over IP,要共同設計和推動免授權金的連線標準,以提升智慧家庭產品之間的相容性。官方表示,Zigbee聯盟背後的多家企業,包括IKEA、三星、施耐德和Signify等也將加入工作小組,一起制定新協定。

這個工作小組的目標,是要透過建立網際網路協定,來打通智慧家庭裝置、行動應用程式和雲端服務之間的通訊,並定義一套網際網路協定技術規範。這個工作組將採開源方式,建立統一連線協定,並透過各成員的智慧家庭技術,來加速協定開發。(詳全文)

無人飯店     大數據      旅宿新零售  

臺灣無人飯店技術連日本老飯店都想用,首發瞄準大阪

國產的無人飯店技術即將輸出日本,日本老牌大型飯店集團WBF日前來臺宣布,將採用臺灣旅宿科技新創敦謙智能的無人旅店技術,打造日本在地化的無人酒店,第一站示範場域將落腳WBF大阪店,未來還要擴張到日本全國其他分店。

日本WBF集團社長近藤雅之表示,看上敦謙智能的自主開發能力和穩定的商業模式,計畫採用他們打造的PMS管理平臺、QR Key、AI機器人和智能置物櫃等軟硬體,未來還要將這套系統導入全日本分店。敦謙智能創辦人吳秉庭也揭露,導入初期的前兩個月,將以訓練系統和機器人為主,同時進行飯店人員訓練,與機器人一起服務顧客、之後還需3至6個月進行數據分析、優化系統和服務調整,才會正式轉型無人旅館。(詳全文)

攝影/蘇文彬

圖片來源/臉書AI研究院、Google、中原大學

 AI趨勢近期新聞 

1. Khan Academy更新線上學習服務棄Python擁抱Go

2. MIT與IBM打造能根據主題來推薦文件的AI模型,可快速分析百萬種可能性

3. 輔大人工智慧發展中心正式成立,瞄準癌症判讀和運動治療

資料來源:iThome整理,2019年12月

 
 
 
 


Advertisement

更多 iThome相關內容