AI趨勢周報：Google AI釋出氣味圖譜，要來預防蟲媒傳染病

圖片來源:

Google

重點新聞(0909～0915)

本周盤點多個AI領域應用，如Google用ML打造出分子氣味圖譜，可「定位」分子的氣味，進而找出驅蟲劑有效分子、防治蟲媒傳染病；法國則用AI從空拍圖鎖定泳池住家、計算大小，再比對地產登記系統、揪出未登記逃漏稅的住家；紐約時報用ML來自動計算「訂閱牆」額度，讓不同讀者有不同額度的免費文章可看；甚至OpenAI的文生圖模型DALL-E，也多了新的延伸繪畫功能，自動畫出原圖沒有的部分。AI研究也有不少進展，比如DeepMind訓練AI踢足球、Meta新AI可解碼大腦3秒活動的對應語音；美國白宮最近宣布，2025年底前，所有政府資助的研究論文及數據都得在線上免費公開，AI大師吳恩達看好，這將促進更多AI新進展。

Google 氣味 蟲媒傳染病

Google AI釋出氣味圖譜，要來預防蟲媒傳染病

Google AI研究院近日釋出一款機器學習產生的氣味地圖，涵蓋上千個分子與相對應的氣味，可用來預測無形分子的氣味，甚至要進一步發展為全球性的疾病預防工具，來對付如昆蟲傳播等類型疾病。

進一步來說，團隊先是在2019年開發一套GNN模型，來探索數千個與氣味標籤（如花香、薄荷味）配對的分子，讓模型了解分子結構與組成每個氣味標籤的機率關係。這次，他們進一步打造主要氣味圖譜（POM）模型，可辨識每個氣味分子的向量表徵；POM具感官圖譜特性，能產生與相似氣味對應的2個相近點，並讓使用者預測、找出該分子所產生的新氣味。

Google測試發現，POM可預測人類味覺感知，也能預測動物味覺。為得知POM能否用於蚊子、蜱蟲疾病預防，團隊以2大數據集（含早期美國農業部實驗數據、TropIQ蚊子實驗數據）重新訓練模型，發現模型可預測出幾乎所有分子的驅蚊性，其中10個分子的驅蚊力至少與大多數驅蟲劑中的活性成分DEET一樣高。Google認為，該模型可幫助開發更便宜、更持久且更安全的驅蟲劑，降低瘧疾等昆蟲傳播疾病的發生。（詳全文）

游泳池 電腦視覺 稅收

私建游泳池想逃稅？法國政府用AI一眼揪出得補稅的地產

在法國，民眾家裡有游泳池、地產價值就會增加，就得繳稅。然而，並不是所有住家都會誠實登記游泳池並繳稅。於是，法國政府部署一款AI工具，來揪出未登記泳池的住家，並補繳稅。

該工具先以電腦視覺AI辨識空拍圖、計算泳池大小，再交叉比對當地政府的地產登記資料，來確認該泳池是否登記，若未登記，則會標註警示並要求補登記。該工具由Google與巴黎顧問公司Capgemini開發，去年10月於法國9個行政區先上路，共標註了20,356個可疑的泳池住家，其中94%確實未登記；該工具光1年就替政府淨賺1千萬歐元稅收。法國政府計畫在本月擴大到全國使用，預計2023年泳池稅收可達4千萬歐元。他們也打算，未來要新增涼亭和陽臺等2類地產辨識類別。

其實，光是歐盟，至少已有17個國家用AI來協助收稅，包括辨識出應審查的納稅人、自動從電商網站抓取納稅人資料，以及驅動Chatbot來協助納稅人上傳資料等。去年，美國則上線一款AI工具，透過分析退稅、銀行對帳單、財產記錄和社交活動，來揪出詐欺犯。（詳全文）

紐約時報 訂閱制 動態量測

讀者可看幾篇免費文章？紐時要用ML自動決定

紐約時報自2011年開始實施註冊牆和付費牆（Paywall）機制，讓民眾點閱一定數量的免費文章後，先跳出註冊視窗，民眾註冊後就能閱讀更多免費文章，但到一定數量後，紐時網頁就會跳出訂閱視窗，來說服讀者付費訂閱。長久以來，所有讀者的免費文章數量都是一樣的，但紐時資料科學家Rohit Supekar認為，付費牆應因人而異，要依讀者特性來提供不同額度的免費文章才對。

因此，他與團隊開發因果機器學習模型Dynamic Meter（動態量錶），根據民眾註冊後的瀏覽習慣，即訂閱傾向和參與度，來判斷要給個別讀者，多少篇免費閱讀的文章。該模型可分為2個類似S-learner元學習模型的基礎學習器，用來預測讀者訂閱傾向和頁面點擊數，並決定要給多少篇免費文章。團隊利用歷史資料測試發現，動態量錶可讓團隊依業務目標調整策略，比隨機策略得到更多參與度和轉換率的提升。（詳全文）

TensorFlow Transformer 決策森林

TensorFlow 2.10版出爐了

開源深度學習框架TensorFlow最近釋出2.10版，其中亮點包括函式庫Keras的優化、優化器API的更新，以及用來生成音檔資料集的新程式。就Keras優化來說，目的是要使用者更輕鬆開發Transformer模型，比如擴充和統一對Keras注意力層的掩碼處理功能，並新添因果注意力和內隱掩碼2種功能。此外，新版也將Keras初始化器調整為無狀態和確定性，並以oneDNN強化性能，還擴展了Windows的GPU支援。此外，隨2.10版更新的還有Tensorflow決策森林（TF-DF）1.0版，是個成熟穩定的函式庫了。（詳全文）

DeepMind 增強式學習 踢足球

DeepMind訓練AI踢足球

DeepMind開發新AI，可學習人類動作、組成虛擬足球隊。他們在科學期刊《Science Robotics》公布一篇論文，解釋自家NPMP模型如何從人或動物動作中學習複雜技能，並以代理程式或實體機器人，將技能體現出來，像是踢足球。

NPMP是一組通用的運動控制AI模型，可將當下的運動意圖轉化為低階控制訊號。該模型包含了編碼器和低階控制器，可分別把未來動作軌跡壓縮進運動意圖，並依代理程式狀態及現有運動意圖，產生下個動作。DeepMind表示，他們的方法讓「球員」從追球技能開始學習合作，包括靈敏的移動、傳球及分工。球員們展現出靈敏的高頻運動控制，及摻雜預期隊友行為的長期決策，形成足球的團體戰。（詳全文）

Meta 語音讀腦

Meta新AI可解碼大腦3秒活動的對應語音

Meta開發一套新模型，可在3秒的大腦活動中，從793個單字字彙表中，解碼出相對應的語音片段，前10名單字的準確率高達73％，涵蓋了大部分日常用字。這套AI的特別之處，在於非侵入條件下，從大腦活動中解碼語音。

Meta先以比對學習技術訓練模型，再用該模型對齊大腦活動紀錄和語音，來判斷語音。進一步來說，團隊使用自家開發的模型wave2vec 2.0，來辨識聽有聲讀物受試者大腦中的語音表達，也就是非侵入性的腦電圖和腦磁波儀紀錄。結果顯示，wav2vec 2.0能從語音，自動生成與大腦一致的語音表示，將大腦模型的輸出和語音的深度表示對齊，以此對出大腦訊號對應的語音。（詳全文）

OpenAI DALL-E 延伸繪畫

只有肖像不過癮，DALL-E模型新功能幫忙畫出下半身

OpenAI為文生圖模型Dall-E新添Outpainting延伸繪畫功能，可根據給定圖像的風格和視覺元素，延伸畫出原始圖像邊界以外的內容，使用者也能以自然語言描述，引導圖中的故事往新方向發展。

OpenAI以《戴珍珠耳環的少女》為例，除了頭像之外，DALL-E延伸畫出了下半身和所處空間，將原圖的視覺元素如陰影、反射和材質等風格，都保留、呈現在延伸的繪畫中。OpenAI表示，目前超過100萬人使用 DALL-E，而新功能將進一步擴展使用者創造力。（詳全文）

吳恩達 論文開放

吳恩達：美論文開放政策將催生更多AI新進展

幾周前，美國白宮簽署備忘錄，要求政府資助的所有研究論文及相關數據，都得在2025年底前，在線上免費公開。AI專家吳恩達讚許這項政策，他表示，AI研究論文難得在幾年前，就已轉向免費公開的方向發展，特別是線上免費論文資料庫arXiv收錄全球大量的AI研究論文。他分析，論文發布有3個途徑，一是期刊論文，通常較長且嚴謹編輯、得經過同儕評審，會議論文（如NeurIPS和ICLR）則較短、不如前者嚴謹編輯，因此發布速度較快，而在arXiv上發布論文，則不需經同儕評審，可立即接觸到有興趣的研究者。

這種快速發布、傳播的好處，讓研究者的投稿習慣從期刊，逐漸轉向會議和arXiv。雖然研究論文數量暴增，但想法的傳播，促成AI快速發展。雖然如此，吳恩達表示，當他要將AI應用至醫療、氣候變遷和其他領域時，仍會遇到惱人的期刊付費牆（Paywall），而白宮這項政策，可望打破這堵牆。他希望，AI和其他學科能因此更加速發展。（詳全文）

圖片來源／Google、Le Parisien、紐約時報、DeepMind、OpenAI

AI近期新聞

1. PyTorch基金會成立，將管理深度學習框架PyTorch未來發展

2. GitHub研究Copilot可加速55％開發速度

3. 美擴大AI晶片出口中國禁令

資料來源：iThome整理，2022年9月

熱門新聞