圖片來源: 

DeepMind

Google AI部門DeepMind曾經以AlphaGo擊敗棋王一時聲名大噪,本周DeepMind宣布最新AI模型研發成果AlphaDev,可加速資料中心運行速度並具節能之效。

AlphaDev是以精通下棋及電玩遊戲的AlphaZero(曾經擊敗過AlphaGo)和MuZero模型改良而成。兩者後來改以優化資料中心和影像壓縮為主軸。而AlphaDev則是AlphaZero的特化版,它發現新的資料排序(sorting)及雜湊(hashing)演算法,可加速軟體程式碼的執行。

AlphaDev找尋新演算法是從讓電腦讀取的低階程式指令,而非人類撰寫如C++之類的高階語言著手。他們相信,低階的組合指令比高階程式語言更容易找到改善空間,電腦儲存和運算在這個層次更為彈性,意謂更容易有突破性的技術,以提升速度或降低耗能。他們希望能由AlphaDev找到新的資料排序及雜湊演算法,因為這是今天人們資料排序、儲存及檢索的二個最基本流程。排序演算法能影響數位裝置處理和顯示資訊,從搜尋或社群網站貼文排序、或使用者推薦等。

作為AlphaZero的變種,AlphaDev也是增強學習(reinforcement learning)模型。為了訓練AlphaDev尋找新演算法,研究人員將排序變成一人玩家的「組合遊戲」。每回合AlphaDev都觀察它產生的演算法及由CPU取得的資訊,然後再選取一個指令加入演算法再展開下回合。AlphaDev必須要從非常多的指令組合中找出排序演算法,每回合再找出更快、更好的演算法。而指令組合數量,大概等同於宇宙的分子數量,或是西洋棋(10的120次方)與圍棋(10的700次方)棋步。而走錯任何一步,整個演算法可能就沒用了。研究人員會從兩方面來獎賞AlphaDev的排序,一是正確性,二是效率、速度。

最後AlphaDev發現到新的演算法,可改善低階虛擬機器(LLVM)libc++排序函式庫的速度,在較短(3到5 element)序列可提升70%,而在超過25萬個element的長序列則提升1.7%。短序列的演算法是DeepMind研究重點,因為更為常用。DeepMind指出,在簡單的使用者搜尋任務上,AlphaDev演算法可提升排序速度,但一旦應用到更大規模環境,例如資料中心,將能大量節能及省下成本。

尋找雜湊演算法也是AlphaDev的任務之一。雜湊常用於資料儲存和檢索,如資料庫中。AlphaDev找到的演算法應用在資料中心內9到16 byte的雜湊函式時,可提升30%的效率。

自從發表用於LLVM標準C++函式庫的排序演算法來取代用了十多年的副程式(sub-routines),及發表用於abseil函式庫的雜湊演算法,已有數百萬次下載,這些演算法已用於各種產業,包括雲端、線上購物和供應鏈管理。

DeepMind預期,一如其演算法從下棋開始跨到資料中心運算,未來有更多通用型AI模型會進一步用於現代生活。

熱門新聞

Advertisement