DeepMind AI模型不下圍棋了，新AlphaDev模型可加速資料中心運算效率

圖片來源:

DeepMind

Google AI部門DeepMind曾經以AlphaGo擊敗棋王一時聲名大噪，本周DeepMind宣布最新AI模型研發成果AlphaDev，可加速資料中心運行速度並具節能之效。

AlphaDev是以精通下棋及電玩遊戲的AlphaZero（曾經擊敗過AlphaGo）和MuZero模型改良而成。兩者後來改以優化資料中心和影像壓縮為主軸。而AlphaDev則是AlphaZero的特化版，它發現新的資料排序（sorting）及雜湊（hashing）演算法，可加速軟體程式碼的執行。

AlphaDev找尋新演算法是從讓電腦讀取的低階程式指令，而非人類撰寫如C++之類的高階語言著手。他們相信，低階的組合指令比高階程式語言更容易找到改善空間，電腦儲存和運算在這個層次更為彈性，意謂更容易有突破性的技術，以提升速度或降低耗能。他們希望能由AlphaDev找到新的資料排序及雜湊演算法，因為這是今天人們資料排序、儲存及檢索的二個最基本流程。排序演算法能影響數位裝置處理和顯示資訊，從搜尋或社群網站貼文排序、或使用者推薦等。

作為AlphaZero的變種，AlphaDev也是增強學習（reinforcement learning）模型。為了訓練AlphaDev尋找新演算法，研究人員將排序變成一人玩家的「組合遊戲」。每回合AlphaDev都觀察它產生的演算法及由CPU取得的資訊，然後再選取一個指令加入演算法再展開下回合。AlphaDev必須要從非常多的指令組合中找出排序演算法，每回合再找出更快、更好的演算法。而指令組合數量，大概等同於宇宙的分子數量，或是西洋棋（10的120次方）與圍棋（10的700次方）棋步。而走錯任何一步，整個演算法可能就沒用了。研究人員會從兩方面來獎賞AlphaDev的排序，一是正確性，二是效率、速度。

最後AlphaDev發現到新的演算法，可改善低階虛擬機器（LLVM）libc++排序函式庫的速度，在較短（3到5 element）序列可提升70%，而在超過25萬個element的長序列則提升1.7%。短序列的演算法是DeepMind研究重點，因為更為常用。DeepMind指出，在簡單的使用者搜尋任務上，AlphaDev演算法可提升排序速度，但一旦應用到更大規模環境，例如資料中心，將能大量節能及省下成本。

尋找雜湊演算法也是AlphaDev的任務之一。雜湊常用於資料儲存和檢索，如資料庫中。AlphaDev找到的演算法應用在資料中心內9到16 byte的雜湊函式時，可提升30%的效率。

自從發表用於LLVM標準C++函式庫的排序演算法來取代用了十多年的副程式（sub-routines），及發表用於abseil函式庫的雜湊演算法，已有數百萬次下載，這些演算法已用於各種產業，包括雲端、線上購物和供應鏈管理。

DeepMind預期，一如其演算法從下棋開始跨到資料中心運算，未來有更多通用型AI模型會進一步用於現代生活。

熱門新聞