人工智慧在各種遊戲,包括圍棋和象棋等擊敗人類,而現在臉書更應用人工智慧技術,並結合先進的搜尋技術,讓機器人掌握花火(Hanabi)這個更複雜的紙牌遊戲,程度不只更勝過去的演算法,還能夠擊敗菁英玩家。

花火是一種需要高度合作的紙牌遊戲,玩法類似團隊接龍,但玩家無法看到自己擁有的牌,只能看到其他玩家的牌組,玩家透過每回合有限的資訊,經推理、整合和發揮默契來完成遊戲,最後才能成功將不同花色的數字牌,按順序排列並成功施放出花火。

玩家必須透過交換訊息,才能了解要出牌還是棄牌,但是決定行動的線索,只能透過特定紙牌顏色和編號等,非常有限的提示進行溝通,而由於玩家都知道,花火是一款合作遊戲,因此會直接相信隊友的暗示,不會認為隊友的暗示存在欺騙或是誤導等目的。

臉書提到, 人類透過觀察行為,來解釋隊友的意圖,像是隊友可能以特定顏色卡片,來暗示玩家下一回合要使用的卡片,而這是一種演繹的能力,玩家用來理解隊友的意圖,並預測他們對線索的解釋,和回應的行為。而在真實世界中,臉書也期待人工智慧系統擁有協作能力,能夠在需要的環境進行合作。

在今年的時候,DeepMind和Google Brain的人工智慧研究人員,同時也認為花火是研究人工智慧的新領域,因為花火多人遊戲,同時結合了合作性玩法以及不完整的訊息。而臉書現在發表了最新的研究,他們開發了一種應用即時搜尋方法的人工智慧機器人,這種搜尋方法結合預運算的策略,可以對遊戲過程中遇到的各種情況進行微調,顯著改善包括增強學習等,任何遊玩花火的演算法。

這項研究主要貢獻是在不完整訊息的情況下,使用搜尋方法。臉書提到,過去搜尋方法只能用在如象棋和圍棋等,這類公開完整資訊的遊戲,而由於花火遊戲進行時,每個玩家只能看到部分而非全部紙牌,任意階段的遊戲都只有非完整的資訊,機器人在做出決定之前,需要考量多種不同的可能,而這種情況讓搜尋變得困難,通常也需要花費更多的運算資源。

臉書提到,儘管不少多重代理的人工智慧研究,都專注在零和競爭上,但是透過有限溝通進行有效率協調的人工智慧技術,在現實世界的潛在用途更大,像是在只有部分可觀察的環境交通導航,需要駕駛員需要傳達自己的意圖以及解釋他人意圖,而在工作環境中,人工智慧系統需要能夠解釋人類所提供的非語言線索。

當人工智慧可以理解這些意圖,就能以更高的效率進行合作,臉書認為,他們在花火遊戲中的研究,能夠推進現實世界中合作式人工智慧代理的發展。

熱門新聞

Advertisement