重點新聞(0909~0915)
本周盤點多個AI領域應用,如Google用ML打造出分子氣味圖譜,可「定位」分子的氣味,進而找出驅蟲劑有效分子、防治蟲媒傳染病;法國則用AI從空拍圖鎖定泳池住家、計算大小,再比對地產登記系統、揪出未登記逃漏稅的住家;紐約時報用ML來自動計算「訂閱牆」額度,讓不同讀者有不同額度的免費文章可看;甚至OpenAI的文生圖模型DALL-E,也多了新的延伸繪畫功能,自動畫出原圖沒有的部分。AI研究也有不少進展,比如DeepMind訓練AI踢足球、Meta新AI可解碼大腦3秒活動的對應語音;美國白宮最近宣布,2025年底前,所有政府資助的研究論文及數據都得在線上免費公開,AI大師吳恩達看好,這將促進更多AI新進展。
Google 氣味 蟲媒傳染病
Google AI釋出氣味圖譜,要來預防蟲媒傳染病
Google AI研究院近日釋出一款機器學習產生的氣味地圖,涵蓋上千個分子與相對應的氣味,可用來預測無形分子的氣味,甚至要進一步發展為全球性的疾病預防工具,來對付如昆蟲傳播等類型疾病。
進一步來說,團隊先是在2019年開發一套GNN模型,來探索數千個與氣味標籤(如花香、薄荷味)配對的分子,讓模型了解分子結構與組成每個氣味標籤的機率關係。這次,他們進一步打造主要氣味圖譜(POM)模型,可辨識每個氣味分子的向量表徵;POM具感官圖譜特性,能產生與相似氣味對應的2個相近點,並讓使用者預測、找出該分子所產生的新氣味。
Google測試發現,POM可預測人類味覺感知,也能預測動物味覺。為得知POM能否用於蚊子、蜱蟲疾病預防,團隊以2大數據集(含早期美國農業部實驗數據、TropIQ蚊子實驗數據)重新訓練模型,發現模型可預測出幾乎所有分子的驅蚊性,其中10個分子的驅蚊力至少與大多數驅蟲劑中的活性成分DEET一樣高。Google認為,該模型可幫助開發更便宜、更持久且更安全的驅蟲劑,降低瘧疾等昆蟲傳播疾病的發生。(詳全文)
游泳池 電腦視覺 稅收
私建游泳池想逃稅?法國政府用AI一眼揪出得補稅的地產
在法國,民眾家裡有游泳池、地產價值就會增加,就得繳稅。然而,並不是所有住家都會誠實登記游泳池並繳稅。於是,法國政府部署一款AI工具,來揪出未登記泳池的住家,並補繳稅。
該工具先以電腦視覺AI辨識空拍圖、計算泳池大小,再交叉比對當地政府的地產登記資料,來確認該泳池是否登記,若未登記,則會標註警示並要求補登記。該工具由Google與巴黎顧問公司Capgemini開發,去年10月於法國9個行政區先上路,共標註了20,356個可疑的泳池住家,其中94%確實未登記;該工具光1年就替政府淨賺1千萬歐元稅收。法國政府計畫在本月擴大到全國使用,預計2023年泳池稅收可達4千萬歐元。他們也打算,未來要新增涼亭和陽臺等2類地產辨識類別。
其實,光是歐盟,至少已有17個國家用AI來協助收稅,包括辨識出應審查的納稅人、自動從電商網站抓取納稅人資料,以及驅動Chatbot來協助納稅人上傳資料等。去年,美國則上線一款AI工具,透過分析退稅、銀行對帳單、財產記錄和社交活動,來揪出詐欺犯。(詳全文)
紐約時報 訂閱制 動態量測
讀者可看幾篇免費文章?紐時要用ML自動決定
紐約時報自2011年開始實施註冊牆和付費牆(Paywall)機制,讓民眾點閱一定數量的免費文章後,先跳出註冊視窗,民眾註冊後就能閱讀更多免費文章,但到一定數量後,紐時網頁就會跳出訂閱視窗,來說服讀者付費訂閱。長久以來,所有讀者的免費文章數量都是一樣的,但紐時資料科學家Rohit Supekar認為,付費牆應因人而異,要依讀者特性來提供不同額度的免費文章才對。
因此,他與團隊開發因果機器學習模型Dynamic Meter(動態量錶),根據民眾註冊後的瀏覽習慣,即訂閱傾向和參與度,來判斷要給個別讀者,多少篇免費閱讀的文章。該模型可分為2個類似S-learner元學習模型的基礎學習器,用來預測讀者訂閱傾向和頁面點擊數,並決定要給多少篇免費文章。團隊利用歷史資料測試發現,動態量錶可讓團隊依業務目標調整策略,比隨機策略得到更多參與度和轉換率的提升。(詳全文)
TensorFlow Transformer 決策森林
TensorFlow 2.10版出爐了
開源深度學習框架TensorFlow最近釋出2.10版,其中亮點包括函式庫Keras的優化、優化器API的更新,以及用來生成音檔資料集的新程式。就Keras優化來說,目的是要使用者更輕鬆開發Transformer模型,比如擴充和統一對Keras注意力層的掩碼處理功能,並新添因果注意力和內隱掩碼2種功能。此外,新版也將Keras初始化器調整為無狀態和確定性,並以oneDNN強化性能,還擴展了Windows的GPU支援。此外,隨2.10版更新的還有Tensorflow決策森林(TF-DF)1.0版,是個成熟穩定的函式庫了。(詳全文)
DeepMind 增強式學習 踢足球
DeepMind訓練AI踢足球
DeepMind開發新AI,可學習人類動作、組成虛擬足球隊。他們在科學期刊《Science Robotics》公布一篇論文,解釋自家NPMP模型如何從人或動物動作中學習複雜技能,並以代理程式或實體機器人,將技能體現出來,像是踢足球。
NPMP是一組通用的運動控制AI模型,可將當下的運動意圖轉化為低階控制訊號。該模型包含了編碼器和低階控制器,可分別把未來動作軌跡壓縮進運動意圖,並依代理程式狀態及現有運動意圖,產生下個動作。DeepMind表示,他們的方法讓「球員」從追球技能開始學習合作,包括靈敏的移動、傳球及分工。球員們展現出靈敏的高頻運動控制,及摻雜預期隊友行為的長期決策,形成足球的團體戰。(詳全文)
Meta 語音 讀腦
Meta新AI可解碼大腦3秒活動的對應語音
Meta開發一套新模型,可在3秒的大腦活動中,從793個單字字彙表中,解碼出相對應的語音片段,前10名單字的準確率高達73%,涵蓋了大部分日常用字。這套AI的特別之處,在於非侵入條件下,從大腦活動中解碼語音。
Meta先以比對學習技術訓練模型,再用該模型對齊大腦活動紀錄和語音,來判斷語音。進一步來說,團隊使用自家開發的模型wave2vec 2.0,來辨識聽有聲讀物受試者大腦中的語音表達,也就是非侵入性的腦電圖和腦磁波儀紀錄。結果顯示,wav2vec 2.0能從語音,自動生成與大腦一致的語音表示,將大腦模型的輸出和語音的深度表示對齊,以此對出大腦訊號對應的語音。(詳全文)
OpenAI DALL-E 延伸繪畫
只有肖像不過癮,DALL-E模型新功能幫忙畫出下半身
OpenAI為文生圖模型Dall-E新添Outpainting延伸繪畫功能,可根據給定圖像的風格和視覺元素,延伸畫出原始圖像邊界以外的內容,使用者也能以自然語言描述,引導圖中的故事往新方向發展。
OpenAI以《戴珍珠耳環的少女》為例,除了頭像之外,DALL-E延伸畫出了下半身和所處空間,將原圖的視覺元素如陰影、反射和材質等風格,都保留、呈現在延伸的繪畫中。OpenAI表示,目前超過100萬人使用 DALL-E,而新功能將進一步擴展使用者創造力。(詳全文)
吳恩達 論文 開放
吳恩達:美論文開放政策將催生更多AI新進展
幾周前,美國白宮簽署備忘錄,要求政府資助的所有研究論文及相關數據,都得在2025年底前,在線上免費公開。AI專家吳恩達讚許這項政策,他表示,AI研究論文難得在幾年前,就已轉向免費公開的方向發展,特別是線上免費論文資料庫arXiv收錄全球大量的AI研究論文。他分析,論文發布有3個途徑,一是期刊論文,通常較長且嚴謹編輯、得經過同儕評審,會議論文(如NeurIPS和ICLR)則較短、不如前者嚴謹編輯,因此發布速度較快,而在arXiv上發布論文,則不需經同儕評審,可立即接觸到有興趣的研究者。
這種快速發布、傳播的好處,讓研究者的投稿習慣從期刊,逐漸轉向會議和arXiv。雖然研究論文數量暴增,但想法的傳播,促成AI快速發展。雖然如此,吳恩達表示,當他要將AI應用至醫療、氣候變遷和其他領域時,仍會遇到惱人的期刊付費牆(Paywall),而白宮這項政策,可望打破這堵牆。他希望,AI和其他學科能因此更加速發展。(詳全文)
圖片來源/Google、Le Parisien、紐約時報、DeepMind、OpenAI
AI近期新聞
1. PyTorch基金會成立,將管理深度學習框架PyTorch未來發展
2. GitHub研究Copilot可加速55%開發速度
3. 美擴大AI晶片出口中國禁令
資料來源:iThome整理,2022年9月
熱門新聞
2024-12-03
2024-11-29
2024-12-02
2024-12-02
2024-12-03