圖片來源: 

百度

百度又更進一步研發人工智慧(AI)技術,日前揭露了一套AI系統,結合監督學習法和強化學習法來訓練虛擬AI助理,且值得注意的是,這套AI系統發展出AI助理的「零樣本學習能力(Zero-Shot Learning Ability)」,讓AI助理能夠理解一個從未見過的全新指令。

這套AI系統允許虛擬教師透過感知和動作來連結語言,以從頭開始教導虛擬AI助理語言,就像父母教小孩。根據百度的研究結果顯示,AI助理能夠以自然語言理解虛擬教師的指令,並採取相對應的回饋行動。

而「零次數學習能力」就是,此AI助理在面對一個從未見過的全新指令,也能夠正確地執行任務,換句話說,這個AI助理能夠依據過去學習過的單字、文法,來理解一個全新的句子,就像小孩子在學習語言一樣。

另外,關於百度這套AI系統的研究環境,百度在一個名為「XWorld」的2D虛擬迷宮環境中進行這項AI的研究,透過虛擬教師以自然語言對AI助理發出指令,訓練AI助理做出相對應的行動。

這套AI系統讓虛擬教師採取正向或負向的激勵制度,來回饋AI助理執行指令的成功或失敗,且為了加速AI助理的學習能力,虛擬教師也會詢問AI助理一些關於周遭環境的簡單問題。舉例來說,虛擬教師提問「在北邊的物體是什麼?」,AI助理就要回答「香蕉」。

(圖片來源/百度)

百度表示,接下來將教導AI助理在目前2D環境中更多關於自然語言的指令,下一步將遷移AI助理至虛擬的3D環境中,此3D虛擬環境更類似於我們所居住的真實環境,也將面臨更多的挑戰,而百度的最終目標是,在真實環境中,透過真人教師用自然語言來訓練實體機器人。


Advertisement

更多 iThome相關內容