圖片來源: 

Microsoft

微軟周三宣佈 它的人工智慧(AI)系統在經典遊戲《小精靈小姐》(Ms. Pac-man)上拿下首個滿分的999,900分。
 
這個系統是由微軟今年一月收購的加拿大深度學習新創公司Maluuba所開發。該團隊運用一種強化式學習(reinforcement learning)的人工智慧技術及分散合擊的策略,在Atari 2600模擬器上執行《小精靈小姐遊戲》,並因此超越人類拿下首個滿分。
 
《小精靈小姐》是1980年代相當受歡迎的遊戲,小精靈要在迷宮中盡可能吃下白豆子拿分,但又要小心4大幽靈的追趕。然而這個遊戲變化多端相當難打,因而也成為許多AI界人士很有興趣的目標。今年Google在4月1日也曾推出結合《小精靈小姐遊戲》和Google Maps作為愚人節慶祝活動。人類最高紀錄是266,330分。 

微軟Maluuba團隊設計了一種名為混合式獎賞架構(Hybrid Reward Architecture)的策略,它使用150多隻小精靈(agent),使它們在單一共同目標之下,又各自被分配一個特定任務。例如一些去尋找大力丸,一些負責躲避幽靈。此外並設計出一個類似公司資深經理的大精靈(top agent),可在收集所有精靈建議做出團隊的最佳決策。

例如,100隻小精靈想去吃大力丸而向右跑,3隻小精靈為了躲避幽靈而向左跑,則大精靈會給發現幽靈且向左跑的精靈的決策加權值。研究人員指出,每隻精靈都在自利前提下行動,而大精靈決策考量整體利益的情況下,能拿到最高分。 

研究人員表示,透過強化式學習,這個AI系統中一方面協調所有成員偏好,另一方面讓各個成員專注單一問題,結果是對整個團體都獲益。

 
這次發表再次顯示AI在遊戲或比賽上已經不輸人類。Alphabet旗下DeepMind公司的人工智慧AlphaGo在上個月以三戰全勝擊敗世界排名第一的中國籍圍棋名將柯潔後,暫時沒有人類能阻止AI了。

 

 

 

 


Advertisement

更多 iThome相關內容