AI趨勢周報第87期：蘋果發表Core ML 3，可在裝置上執行機器學習運算

重點新聞(0531～0606)

蘋果 Core ML 3 機器學習

蘋果發表Core ML 3，可在裝置上執行機器學習運算

蘋果於今年度WWDC大會上發表最新版iOS機器學習框架Core ML 3，不僅支援更多種即時機器學習模型的加速，也支援超過100層的類神經網路模型，更可以於裝置上執行機器學習運算。Core ML是蘋果2年前推出的機器學習框架，iOS開發者可藉此打造智慧手機App。蘋果指出，這次發表的第3版，可讓手機App使用先進的模型，來呈現更好的視覺理解、自然語言和語音體驗。更重要的是，開發者能透過「模型個人化」功能，在裝置上更新機器學習模型。

同時，蘋果也推出Create ML，這是一款新的機器學習模型開發、訓練、部署App，使用者不需具備任何機器學習技能、也不需要寫任何程式，就能透過這款App來開發ML模型。此外，Create ML可以同時利用不同資料集來訓練多種模型。（詳全文）

蘋果 SwiftUI 開發框架

蘋果推出SwiftUI開發框架和ARKit 3，提供新一代開發體驗

蘋果於今年WWDC大會上推出SwiftUI開發框架，是一款直覺式UI框架，使用了簡單易懂的宣告式程式碼，可讓開發者打造複雜的UI應用程式。蘋果表示，SwiftUI提供許多自動化功能，包括版面配置、黑暗模式、可用性、由右至左的語言支援等。此外，藉由SwiftUI API，開發者可在蘋果的各種平臺上建置App，像是iOS iPadOS、macOS、watchOS和tvOS等平臺。

而ARKit 3是一套AR應用程式開發工具，透過動作捕捉（Motion Caputre）功能，開發者可將人物的動作整合至自己的App中；人物遮擋（People Occlusion）功能則能更自然地將AR場景至於人物身前或背後。此外，ARKit 3還可讓前鏡頭追蹤最多3個臉部，也支援多人協作開發。（詳全文）

Google 深度學習 影像深度

Google以深度學習重建動態人物影片的深度資訊

Google發表了最新的電腦視覺研究，能透過深度學習來預測影片中人物與場景的深度資訊。Google表示，該研究是第一個能處理攝影機和物體同時移動的影片。研究員使用了2千支YouTube影片，皆為以手持攝影機拍攝人類各種靜止姿勢的影片，並以監督式學習來訓練模型，讓模型學習人類靜止的自然姿勢。由於整個場景都是靜止的，只有攝影機在移動，因此Google可取得整個場景精確的深度資訊。

接著，Google將影片畫面中的人物遮罩、RGB圖像、省略人物影像的初始影片等三者，作為深度學習神經網路的輸入值，來產生深度圖（Depth Map），進一步預測人體型態和姿勢。該成果除了可處理相機與人物隨意運動的影片，找出人物和場景的深度值，也可為影片加入3D感知特效，也能進一步重置為立體的影片，或是做出搖擺攝影機的功能。（詳全文）

AWS 文件內容萃取 Textract

AWS正式推出自動萃取文件內容服務Textract

AWS推出自動萃取文件內容服務Textract，利用機器學習技術和光學字元辨識（OCR）技術，能自動萃取表格和表單等文件中的文字與數據，比如名稱、稅單上的身分證字號或是庫存報告中的產品SKU，這個過程不需要人工審核，也不需要制定特定的資料格式。

進一步來說，Textract服務以API方式提供，使企業不需要具ML技術背景，就能使用。Textract API支援多種圖像格式，比如掃描檔、PDF、照片，企業還可以在資料庫和分析服務中使用該API，包含AWS的Elasticsearch服務、DynamoDB、Athena，還有其他機器學習服務，像是理解服務Comprehend、醫療資訊理解服務Comprehend Medical、翻譯服務Translate、ML自動建置和部署工具SageMaker。Textract服務目前在美國東部和西部地區、歐洲已推出，預計近期擴展到其他地區。（詳全文）

大阪大學 自然語言處理 牙齒矯正

大阪大學發表自然語言處理AI，來編寫病人牙齒矯正建議

大阪大學研究員日前發表一項研究，以自然語言處理（NLP）技術設計一套可以設計牙齒矯正建議的AI系統。研究員指出，牙科醫生通常花太多時間在書寫牙齒治療報告工作上，而大阪大學希望藉AI來改善這個問題，首先從牙尺矯正開始。

為了訓練AI，研究員首先建立含有990個牙齒治療文件的資料集，根據每種牙齒矯正條件和問題，分為423類，並將文件中所有句子分割為單字，來作為訓練用的語料庫。而訓練好的AI系統，可從患者的就醫紀錄中萃取X光影像、牙齒3D模型以及診斷結果（按優先順序排列），並重新組織醫療紀錄中的每個條件，再交叉比對系統內建的400多種標籤。之後，系統會針對每個問題產生相關句子，以及優先治療的建議。（詳全文）

三總 醫療AI 物聯網

三總成立人工智慧暨物聯網發展中心，瞄準精準醫療

為轉型為AI醫院，三軍總醫院（簡稱三總）近日成立人工智慧暨物聯網發展中心，要利用物聯網裝置和資訊部門的AI技術，來發展各種醫療影像AI和醫療病歷判讀系統。

目前，三總已自行研發出一套心電圖AI判讀系統，其中的AI模型是以院內數萬張心電圖來訓練而成，準確率達9成以上，可從患者心電圖波形來判別是否患有特定疾病。此外，三總也進行其他醫療影像AI研究，比如胸部X光AI判讀、眼底鏡AI判讀等。三總AI中心的另一個目標，則是要建置醫療病歷判讀AI，透過自然語言處理技術，來協助判讀如出院病歷摘要等文件。三總也表示，未來計畫於2021年成立國軍影像及分析中心，來整合全國軍醫院醫療影像，發展更多醫療AI應用。（詳全文）

DeepMind 強化學習 策略遊戲

不同AI代理人也能互相合作！DeepMind成功訓練一支AI玩家隊伍來玩奪旗策略遊戲，表現與人相當

DeepMind最近發表強化學習應用新進展，訓練出一支能互相合作的AI玩家隊伍，能在複雜多人連線3D遊戲《雷神之鎚III競技場》中的奪旗競賽場景與人類玩家對戰，表現還不相上下。

進一步來說，DeepMind首先利用45萬回合的奪旗場景來訓練一群AI玩家，雖然AI玩家一開始只是隨機行動，但經過一次次嘗試後，AI玩家學會互相合作、找出最佳策略，DeepMind研究員Wojciech Czarnecki甚至表示，這些AI玩家能適應擁有任意技能的隊友。而DeepMind所採用的強化學習，讓每個AI玩家都會學習自己的內部獎勵訊號，使AI產生各自的內部目標，此外，DeepMind也將AI玩家執行遊戲的時間區段，分為快、慢兩種，來改善AI使用記憶體和產生一致行動序列的能力，最終能組隊與人類玩家對戰。這項研究，顯示了多代理人（multi-agent）訓練在AI領域開發上的潛力。（詳全文）

Google地圖 ML 餐點

Google地圖融入ML，使用者要找熱門餐點更容易

Google日前在地圖服務中，新增了熱門餐點的資訊，提供用戶點餐時的參考。該熱門餐點的功能利用了機器學習技術，將地圖服務中用戶提供的餐點名稱，與相關的圖片和評論配對，找出該餐廳最受歡迎的餐點。

用戶查詢一家餐廳後，在餐廳的總覽頁面就能瀏覽熱門的菜單，點擊查看「更多」之後，還能針對每個推薦的餐點查看圖片和評論，若評論不是用預設的語言書寫，Google地圖也能翻譯評論，若用戶想為下一個來餐廳的人提供意見，只要拍下餐點照片，並寫上餐點名稱，就能夠讓其他用戶更了解該餐廳的餐點資訊。該功能目前已推出Android版本，iOS版本將於未來數個月推出。（詳全文）

圖片來源／蘋果、Google、AWS、DeepMind

AI趨勢近期新聞

1. Google用新方法縮放網路模型，提高準確率卻不會犧牲效能

2. WWDC：具備暗黑模式的iOS 13預覽版出爐，加強相機、照片與地圖程式功能

3. Nvidia計畫於Clara AI平臺推出醫療AI模型市集

資料來源：iThome整理，2019年6月

重點新聞(0531～0606)

熱門新聞