圖片來源: 

Google

遊戲及比賽一直是開發人員用來測試電腦運算能力與人工智慧的最佳途徑,IBM已成功擊敗了世界西洋棋王及奪下益智競賽Jeopardy的冠軍,但源自中國的圍棋則是電腦一直無法克服的。不過, Google於本周表示,該公司所打造的人工智慧系統AlphaGo已於去年10月打敗了歐洲圍棋冠軍樊麾,接著要在今年3月挑戰來自南韓的全球棋王李世石。

因2014年被Google收購而加入Google的人工智慧公司DeepMind創辦人Demis Hassabis表示,圍棋的規則很簡單,雙方以黑、白子圍地吃子,以圍地的大小來區分勝負,雖然規則簡單,卻是個非常複雜的遊戲,它的棋子擺放位置有10^170種可能性,是西洋棋子的10^100倍,還多過全宇宙的原子數量。

Hassabis說,圍棋的複雜度讓電腦無力招架,卻也讓人工智慧的研究人員們深深著迷。

電腦先是在1952年克服了井字遊戲、在1997年拿下跳棋、IBM的深藍電腦在1997年擊敗西洋棋冠軍Garry Kasparov、IBM的Watson系統在2011年取得Jeopardy益智競賽的冠軍,但在去年10月以前,電腦的圍棋能力都只與業餘高手相當。

Hassabis說明,傳統的人工智慧方法是建構一個涵蓋所有可能位置的搜尋樹,但這並不適用於圍棋,因此Google打造了AlphaGo,它結合了進階的搜尋樹與深層神經網路,其中有一個策略神經網路(policy network)負責選出圍棋的下一步,另一個價值神經網路(value network)則負責預測贏家。

Google先以圍棋專家的3000萬個棋步來訓練這些神經網路,一直到預測準確度達到57%,可是這也只能讓AlphaGo的下棋能力與專業棋手差不多,於是Google進一步讓AlphaGo的神經網路彼此交戰,在展開數千盤對戰的同時利用強化學習(reinforcement learning)進行調整。

最後Google讓AlphaGo上了比賽桌,先是挑戰各大圍棋程式,在500盤對奕中只輸了1盤,接著在去年10月挑戰歐洲圍棋冠軍樊麾,取得五盤全勝的佳績。出生於中國的樊麾在2013、2014與2015年都是歐洲圍棋冠軍,樊麾說,他早就知道AlphaGo是台電腦,如果沒人告訴他這件事,他會以為對手是個有點古怪卻厲害的真人。(下圖為樊麾與AlphaGo對戰過程)

此一有關AlphaGo的研究報告已於《自然》(Nature)期刊出版,同時Google打算再接再勵,準備在今年3月讓AlphaGo挑戰南韓的全球棋王李世石。

Hassabis強調,AlphaGo不只是個被注入人工規則的專家系統,它還具備了各種機器學習技術,得以自行找出如何贏得棋賽的辦法,縱使競賽是個可快速並有效開發與測試人工智慧演算法的理想平台,但最終Google還是想利用這些技術來解決現實世界的重要問題,例如氣候模型與疾病分析等。

 

 


Advertisement

更多 iThome相關內容