AI也會讀空氣！臉書發展可理解遊戲隊友意圖的AI

人工智慧在各種遊戲，包括圍棋和象棋等擊敗人類，而現在臉書更應用人工智慧技術，並結合先進的搜尋技術，讓機器人掌握花火（Hanabi）這個更複雜的紙牌遊戲，程度不只更勝過去的演算法，還能夠擊敗菁英玩家。

花火是一種需要高度合作的紙牌遊戲，玩法類似團隊接龍，但玩家無法看到自己擁有的牌，只能看到其他玩家的牌組，玩家透過每回合有限的資訊，經推理、整合和發揮默契來完成遊戲，最後才能成功將不同花色的數字牌，按順序排列並成功施放出花火。

玩家必須透過交換訊息，才能了解要出牌還是棄牌，但是決定行動的線索，只能透過特定紙牌顏色和編號等，非常有限的提示進行溝通，而由於玩家都知道，花火是一款合作遊戲，因此會直接相信隊友的暗示，不會認為隊友的暗示存在欺騙或是誤導等目的。

臉書提到，人類透過觀察行為，來解釋隊友的意圖，像是隊友可能以特定顏色卡片，來暗示玩家下一回合要使用的卡片，而這是一種演繹的能力，玩家用來理解隊友的意圖，並預測他們對線索的解釋，和回應的行為。而在真實世界中，臉書也期待人工智慧系統擁有協作能力，能夠在需要的環境進行合作。

在今年的時候，DeepMind和Google Brain的人工智慧研究人員，同時也認為花火是研究人工智慧的新領域，因為花火多人遊戲，同時結合了合作性玩法以及不完整的訊息。而臉書現在發表了最新的研究，他們開發了一種應用即時搜尋方法的人工智慧機器人，這種搜尋方法結合預運算的策略，可以對遊戲過程中遇到的各種情況進行微調，顯著改善包括增強學習等，任何遊玩花火的演算法。

這項研究主要貢獻是在不完整訊息的情況下，使用搜尋方法。臉書提到，過去搜尋方法只能用在如象棋和圍棋等，這類公開完整資訊的遊戲，而由於花火遊戲進行時，每個玩家只能看到部分而非全部紙牌，任意階段的遊戲都只有非完整的資訊，機器人在做出決定之前，需要考量多種不同的可能，而這種情況讓搜尋變得困難，通常也需要花費更多的運算資源。

臉書提到，儘管不少多重代理的人工智慧研究，都專注在零和競爭上，但是透過有限溝通進行有效率協調的人工智慧技術，在現實世界的潛在用途更大，像是在只有部分可觀察的環境交通導航，需要駕駛員需要傳達自己的意圖以及解釋他人意圖，而在工作環境中，人工智慧系統需要能夠解釋人類所提供的非語言線索。

當人工智慧可以理解這些意圖，就能以更高的效率進行合作，臉書認為，他們在花火遊戲中的研究，能夠推進現實世界中合作式人工智慧代理的發展。

熱門新聞