AI趨勢周報第177期：深化AI國力，美跨司法、國防、商務部組隊給總統與聯邦機構建議

美國商務部成立國家AI諮詢委員會，正招募來自產學界AI專家，要給總統和聯邦政府AI發展策略建議。

圖片來源:

螢幕截圖

重點新聞(0910～0916)

AI國力 國家AI諮詢委員會 競爭力

深化AI國力，美國正組成AI委員會來給總統和聯邦機構建議

美國商務部最近宣布成立國家AI咨詢委員會（NAIAC），要針對美國AI競爭力現狀等一系列議題，來向總統和聯邦機構建議。NAIAC是根據美國2020年發布的《國家AI倡議法案》，連結了商務部部長、白宮科技政策辦公室、國防部長、能源部長、國務卿、司法部長和國家情報總監共同成立。

NAIAC鎖定的AI議題不只有美國AI競爭力現狀，還包括落實國家AI計畫的程度、AI就業情況和AI倫理等，以及AI可解釋性、安全性等。該組織目前正招募來自產學界、聯邦實驗室和非營利組織的AI專家成員。（詳全文）

臉書 語音合成 原始音檔

語音合成新成就！臉書新NLP模型不需文本和標籤、單靠音檔就能合成語音

臉書AI再進擊！臉書最近揭露一款生成式語音模型GSLM，單靠原始音檔就能合成語音，完全不需要文本資料。臉書直指，這個研究開啟了無文本NLP的新時代。

近年來，GPT-3、BERT這類基於文本（Text）的NLP模型帶來不少突破，可根據輸入文字產生逼真的文本，還能作為預訓練模型，讓使用者用少量標籤或表徵（Representation）就能解決多種NLP任務，如情感分析、翻譯、摘要生成等。但這類模型有個缺點，也就是只適用於擁有龐大文字資料集的語言。

臉書打造的GSLM可解決這個問題。GSLM透過表徵學習來處理原始音檔訊號，完全不需文本資料和標籤，也不必先打造傳統語音合成所需的自動語音辨識ASR系統，就能以原始音檔的語音產生新話語。也就是說，即便是沒有大量文字資料集的語言，GSLM也能照常生成。

該模型由3大部分組成，一是將原始語音切割為聲音單位的編碼器，二是用來預測下個單位的語言模型，最後是將聲音單位轉換為單字的解碼器。臉書用6千小時的語音資料集Libri-Light和Librispeech來訓練編碼器和語言模型，過程中也不用文本資料和標籤。臉書將現有的GSLM語音合成成果公開在AI研究院官網上，團隊表示，GSLM研究還在持續中，未來將開源程式碼，也要將GSLM發展為預訓練模型，讓使用者用少數標註資料，就能有效訓練下游任務，比如口語摘要、資訊檢索。（詳全文）

程式碼生成 Salesforce CodeT5

又有程式碼生成工具問世！Salesforce開源可即時產生程式碼的模型

Salesforce近日開源一套即時程式碼生成模型CodeT5，這是繼GitHub的Copilot、微軟CodeBERT之後，另一個程式碼生成工具。Salesforce指出，程式碼生成技術雖然越來越成熟，但仍有其挑戰，比如這些生成模型不是極度仰賴編碼器（如BERT）就是解碼器（如GPT），因此不是最有效的方法。

為解決這個問題，Salesforce打造一套具備編譯器和解碼器功能的預訓練模型CodeT5。該模型架構與Google的文字生成預訓練模型T5相似，但它改寫了文字轉換架構，讓輸入值和輸出值都是文字串，因此對程式碼的理解力更好。

團隊用835萬個範本來訓練AI，包括使用者在GitHub上的書寫評論。在訓練時，最大版本的CodeT5具2.2億個參數，花了12天才訓練好。不過測試後，CodeT5在各種下游程式碼任務都展現SOTA水準，不論是生成還是理解部分，比如自然語言轉程式碼（NL-PL）任務、程式碼轉自然語言（PL-NL），甚至是不同程式語言間的轉換。（詳全文）

Google 胸腔X光片 異常

更通用了！Google新模型能揪出訓練資料集未見過的肺部異常

Google開發一套新模型，能從去識別化資料集中，區分正常和異常的胸腔X光片，而且，對沒有出現在訓練資料集的肺結核病和COVID-19，還能發現其異常之處，對於未見過的案例具有通用性。

目前的醫療AI，已有大量演算法可用來偵測特定疾病，如肺癌、肺結核和氣胸，但這些模型在臨床上仍有所限制，像是氣胸偵測器就無法顯示癌症的病徵，而肺結核偵測器可能無法辨識出肺炎。

因此，Google開發一套深度學習系統來解決這個問題。他們使用EfficientNet-B7架構的深度學習系統，在ImageNet上進行預訓練，接著用來自印度阿波羅醫院的20萬張去識別化胸腔X光片訓練模型。後來，Google使用各種資料集來測試這套系統，發現該系統能夠精確地區分常見的胸腔異常，同時還能偵測未遇過疾病，能以非常高比例的發現肺結核病，也能揪出COVID-19病徵。（詳全文）

智慧製造 華碩 品質檢測

瞄準智慧製造！華碩推出兩大AI產品

華碩進攻智慧製造市場，旗下華碩IoT團隊推出兩大AI產品「人工智慧視覺軟體工具包」和「人工智慧波形異常分析應用軟體」，要來加速製造業AI化腳步。

其中，AI視覺軟體工具包瞄準金屬沖壓、塑膠射出及電子零件組裝等產業，利用零件光學和物理元件表現特性資料來訓練AI模型，進一步辨識瑕疵產品，如刮痕、壓傷、髒污等，甚至還能分辨藏在同心圓、髮絲紋中的微小瑕疵。華碩指出，該工具包還導入異常偵測（Anomaly Detection）技術，能將原本耗費數小時的模型訓練時間，縮短為數分鐘。另一方面，AI波形異常分析應用軟體則鎖定動件產線業者，利用機器運轉產生的震動波形資料訓練模型，來判斷馬達、風扇等產品品質。（詳全文）

Uber 大數據分析 開源平臺

Uber大數據省錢術（上）：開源分析平臺效率優化3大關鍵

Uber坐擁數百PB資料，全都靠開源平臺分析，但這樣的大數據分析平臺，卻是內部最燒錢的工具。為此，Uber先是制定了三大大數據分析平臺省錢方向：供應、需求、平臺效率，接著，Uber並進一步從平臺效率，說明團隊如何透過大數據檔案瘦身、HDFS抹除碼、YARN排程優化等方法，來提高開源平臺效率。

檔案瘦身第一步是格式優化。Uber內部Hadoop檔案系統（HDFS）空間大都被Hive表格佔據，這些表格以Parquet或ORC格式儲存，這些格式是基於區塊的列式格式，每個區塊包含大量的行數（約1萬）。為進行瘦身，團隊研究出幾個格式優化方法，比如用 GZIP Level 6演算法壓縮Parquet檔案，或是定期刪除從Kafka抽取的日誌列，或是手動調整行的排序，來減少表格大小，最高可降低50%。＜/p>

再來，Uber利用Hadoop 3.0 HDFS抹除碼，來進行瘦身第二步。HDFS抹除碼是一種資料容錯技術，可大量取代大小檔案中的重複性資料，大幅釋放容量。接著，Uber設計一套動態MAX演算法，來優化YARN容量排程，來應付佇列尖峰時段的負載。

此外，Uber還嘗試其他方法來提高平臺使用率，比如他們雖使用Hive-on-Spark、Spark、Presto等三種查詢引擎，但團隊正將所使用的檔案格式改為Parquet；另一方面，他們也利用Apache Hudi頂級專案，來保持數據新鮮度，不必每天掃描好幾天份量的舊資料。（詳全文）

EdTech 語言學習 Birdbrain

語言學習App大廠Duolingo揭露內部AI應用

擁有5億使用者的語言學習App業者Duolingo近期舉辦教育科技大會Duocon，分享了自家App使用的AI技術，包括動態出題、語音合成、AI調整動畫角色。Duolingo公司由卡內基美隆大學研究員於2009年成立，目前提供了40種語言共100多種自學課程和測驗，這些課程能根據使用者程度出題，也會在題目中提供例句、單字朗讀。

Duolingo表示，他們打造一套最新的AI題目排程系統Birdbrain，來預測使用者答對下一個題目的機率，進而動態調整、提供相對應程度的題目，讓使用者保持學習興趣。此外，他們也正部署優化過的語音合成演算法，來提供更像人類的發音。另一方面，團隊也用AI輔助設計一系列的卡通人物，來直接與使用者對話，讓需要死背硬記的課程不再單調。（詳全文）

圖片來源／臉書、Salesforce、Google、Uber

AI趨勢近期新聞

1. 中鋼啟動AI挑戰賽、鎖定字元辨識，廣邀各路AI好手參賽

2. 交通部用無人機、影像辨識技術維護路口安全

資料來源：iThome整理，2021年9月

重點新聞(0910～0916)

熱門新聞