臉書開源經2,000萬場自我對戰訓練的ELF OpenGo模型

臉書去年開源了能完敗職業圍棋高手的人工智慧ELF OpenGo，現在更進一步開源經兩千萬次自我對戰的模型與資料集等相關研究成果。ELF OpenGo的前身原為DeepMind開發的圍棋軟體AlphaGo Zero，臉書將其重新實作發布ELF OpenGo，能以一顆GPU就打贏排名前30的4位圍棋高手，還是皆以20比0完勝。

ELF是臉書在2017年發布的遊戲研究平臺，講究可擴充、輕量與靈活的特性，ELF讓研究人員能在各種遊戲環境中測試演算法，包括棋盤、街機與即時戰略遊戲，而在2018年，臉書開源了基於ELF平臺的OpenGo。現在臉書進一步釋出ELF OpenGo相關的新功能和研究成果，開源經過2千萬次人工智慧自我對戰訓練的模型。

臉書提到，由於訓練模型需要有大量的計算資源，因此即便他們在2018年釋出ELF OpenGo到原始碼，但多數研究人員仍無法重現臉書的研究成果。所以臉書決定從頭訓練開始訓練ELF OpenGo，並釋出其所有的研究成果，對外公開人工智慧能夠打敗玩家的原因，同時也詳述了技術的侷限，臉書特別舉例，人工智慧在學習招式的速度比人類慢得多，像是下圖的梯子招式，人工智慧就花了很多時間才學到。

臉書開源的ELF OpenGo是目前最新的模型以及最佳程式碼版本，包括2千萬次自我對戰的模型以及1,500個中介模型資料。臉書還以模型分析職業圍棋棋士的賽局，發現模型的預測能力，約在總訓練時間的10％就已經達到穩定水準，並隨著訓練的時間增加，ELF OpenGo的技能強度隨之提升。

這個最新版本的ELF OpenGo，能以60％以上的勝率打贏ELF OpenGo雛形。臉書表示，即使是ELF OpenGo雛形，其圍棋能力也早就超越人類，臉書以模型證明，即便是最優秀的圍棋棋士，下的棋步也不一定是最高超的。

這次開源的內容，還包括超過300年的8.7萬場專業圍棋歷史對戰資料，該資料集收集了跨越1700年到2018年的圍棋賽局，臉書的系統透過機器人和人類之間的棋步預測，評估了這些歷史賽局棋步的水準。臉書同時釋出工具，讓使用者能深入每一場圍棋對戰的細節，研究特定比賽特定棋士的棋步。該互動工具提供視覺化功能，方便使用者能更輕易地檢視歷史資料存擋

臉書提到，對於人工智慧的研究人員來說，ELF OpenGo是豐富的研究資源，而對於圍棋的愛好者而言，其專業的賽局分析能力，可以成為新型訓練輔助工具，就是有一位超強棋藝大師能與玩家對戰練習。臉書發布了Windows版本應用程式，可以讓玩家下載使用。

不過，研究還沒結束，臉書表示，即便ELF OpenGo能夠打贏人類，也是因為進行了數百萬場對戰以後的結果，但顯然人類的學習更有效率，臉書接下來的目標，就是讓人工智慧學習的效率提升。

熱門新聞