AI趨勢周報第167期：臉書新模型融合自監督和Transformer，不需標註資料還能揪出複製圖

臉書最近發表一款新演算法DINO，結合了自監督學習、不需標註訓練資料的優點，以及Transformer架構的自我注意力機制優勢。用DINO訓練出來的模型，不需任何標註資料，就能辨識圖片和影片中的物件，也能進行語意分割。特別的是，模型還能揪出複製圖，準確率達96.4%。

圖片來源:

臉書

重點新聞(0430～0506)

臉書 自監督學習 Transformer

臉書新模型融合自監督和Transformer，不需標註資料還能揪出複製圖

臉書聯手法國國家電腦科學研究院Inria，共同設計一套新訓練方法DINO，融合了自監督學習（Self-supervised learning）和Transformer的注意力機制優點，來訓練電腦視覺模型Vision Transformer（ViT），不需要標註資料就能完成訓練。用這個方法訓練出來的模型，能準確辨識圖片和影片中的物件，也能進行語意分割，完全不需標註資料。

臉書指出，近幾年AI突破性的成就來自兩大技術，也就是自監督學習和Transformer。自監督學習的好處是，AI模型能從未標註的資料中學習，省下標註所需的人力和時間成本。而Transformer的優點是，AI模型可從輸入值中，將注意力聚焦於所選的區域，來更有效率地推論。

於是，臉書結合這兩大技術，設計出DINO演算法。他們將自監督學習的兩大優點：老師網路（Momentum teacher）和多剪裁訓練（Multicrop training）整合到DINO框架中，來搭配ViT的自我注意力優勢。團隊發現，融合自監督學習和Transformer的DINO，對視覺世界的理解和人類很像，能辨識出物件的部分組成和圖片中的共同特徵；他們以ImageNet不同類別的影像來測試，發現DINO會以人能理解的方式，來分類影像，將相似的類別擺在一起。

這個方法，能讓模型快速執行k-NN分類任務，且不需要繁瑣的微調或學習分類器。在ImageNet的測試中，團隊也發現DINO比其他自監督學習模型還要好，而且，DINO還有能力識破複製圖和本尊的差異，未來可用於版權保護的偵測器上。（詳全文）

AWS DeepRacer 迷你賽車

擴大推廣AI賽車活動，AWS決定開源迷你賽車DeepRacer模擬器

AWS宣布要開源迷你賽車DeepRacer的裝置軟體，開發者可進一步擴展DeepRacer功能，讓賽車裝置可執行更多行為。DeepRacer是一個雲端虛擬賽車模擬器，開發者可在雲端上訓練、調校ML模型，並載入到1/18大小的迷你自駕車，讓它在設計好的軌道中行駛，克服各種轉彎與直線道路組合。

DeepRacer所使用的機器作業系統ROS是用Ubuntu開發，而開源DeepRacer程式碼，可讓有Linux程式開發能力的開發者，創造出新的車輛用途，實現更多創意。開發者也可在社群媒體中，用#deepracerproject標籤分享自己的開發專案，AWS會將這些專案收集到DeepRacer GitHub Organization中，並在之後的部落格介紹。（詳全文）

MIT 電腦視覺 材料壓力

MIT新材料分析AI工具，靠一張外觀照片就能估算出材料壓力

麻省理工學院（MIT）開發一套AI，可用電腦視覺辨識材料內部結構圖，來快速計算材料部份特性，像是應力（Stress）與應變（Strain）值，省下繁瑣的物理計算。

MIT指出，一般來說，工程師需耗費大量時間來計算材料內力，就算有電腦輔助，還是會遇到長達數天甚至數月的模擬問題。為解決問題，研究團隊看上生成對抗網路（GAN），先使用上萬組圖像訓練網路，這些圖組由兩張圖組成，一張描繪材料內部在機械作用下的微觀結構，另一張則以顏色編碼標示該材料的應力和應變數值，讓AI網路反覆迭代，算出材料的幾何形狀和其所產生應力之間的關係。這個方法，讓AI只要看一張圖片，就能預測材質的內力，解決過去需要撰寫程式碼，求解偏微分方程式的麻煩。（詳全文）

美國衛生部 AI策略 資料共享

美國衛生部揭露未來醫療AI布局

美國衛生部AI長Oki Mek日前揭露美國衛生部未來醫療AI佈局，要執行今年1月提出的AI策略，共有4大目標，包括成立AI委員會和AI實踐社群、做好AI治理和法遵，以及建立沙盒，來衡量AI成效和成本。

進一步來說，美國衛生部一年有1.3兆美金預算，若以GDP排名來看，相當於全球第13大國。這個資金雄厚的衛生部，還有8萬多名職員來維持運作。在4大目標中，成立AI委員會的用意是做好AI發展所需的團隊合作。」再來，建立AI實踐社群是要交換AI實作心得、制定醫療AI規則，還要以此克服醫療AI的兩大難題，也就是資料取得和資料準備。

而第3個目標是要確保醫療AI不違背法規，比如資料隱私、資安、程式碼偏差等。最後一個目標則是建立研發能力R&D，除了要建立沙盒實驗環境，還要藉機集中化管理一些作業，比如AI工作管線（Pipeline）和框架，並將一些該去中心化的作業去中心化。Oki Mek更強調，衛生部也想藉AI策略，來改變人們不想分享資料的心態。「沒有資料，就沒有AI，」衛生部希望在合法的前提下，來與相關組織共享資料。（詳全文）

商之器 UDE App 醫療影像

商之器UDE App讓iPad Pro化身行動醫療影像伺服器，離線也能判讀影像

國內從事醫療影像儲存與傳輸及雲端醫療平臺開發的商之器，近期展示一款UDE App，能將iPad Pro平板電腦當成行動醫療影像伺服器，可在離線狀態下檢視乳房攝影影像，並由AI模型來輔助揪出乳房腫瘤。這個做法，可將原本需要2周以上的篩檢流程縮短為1周左右，目前已有一家北部醫學中心準備採用。

這套UDE App不僅獲得美國FDA第二級認證，也通過臺灣TFDA認證。商之器解釋，這款乳癌判讀AI是去年與資策會聯手開發，結合iPad Pro內建的CoreML技術，即使不連網，也能即時進行AI判讀，商之器表示，今年不只在國內落地UDE App，還要推廣到國外。（詳全文）

甲骨文 分析雲 機器學習

甲骨文推出分析雲，強化ML可解釋性和自然語言搜尋資料特色

甲骨文日前推出分析雲服務（ Oracle Analytics Cloud），強化了機器學習（ML）模型的可解釋性，使用者可查看影響模型決策的原因說明，比如，銀行拒絕給特定對象申請貸款，使用者可查看占比最重的原因。此外，使用者也能手動微調模型，來查看產出結果和變化。

而且，甲骨文分析雲也採用自然語言處理（NLP）技術，讓使用者用說的或打字就能查找所需的資訊，分析雲也會以自然語言方式回答。這是因為，甲骨文自建一套自然語言生成（NLG）引擎，可根據問題來掃描資料、圖表等，再組成答案給使用者。目前，該功能支援28種語言。

除此之外，甲骨文分析雲還有其他特點，包括自動化資料前處理、文本分析、關聯分析、圖表分析和客製化的地圖分析。其中，自動化資料前處理的意思是，由內建的資料分析引擎來對使用者資料掃描、取樣，找出潛在的資料質量問題，並主動通知使用者，比如對信用卡資訊等敏感訊息進行混淆處理等。除了這些特點，甲骨文分析雲也推出行動版應用程式，使用者也能在行動版上使用這些功能。（詳全文）

攝影／蘇文彬

圖片來源／MIT、AW、臉書、Nvidia、商之器、甲骨文

AI趨勢近期新聞

1. 疫情升溫！AI Labs社交距離App告訴你防疫最佳距離

2. 臉書發表半監督式學習新模型，影像辨識表現再突破

資料來源：iThome整理，2021年5月

重點新聞(0430～0506)

熱門新聞