Google超快深度增強學習演算法Soft Actor-Critic,機器人只要訓練2小時就能於各類地形行走

Soft Actor-Critic基於最大熵增強學習,增加了超參數的強健性以及採樣效率,可以在幾小時內解決原本需要數週的機器人行為訓練。

2019-01-21

不再需要人類示範遊戲,Uber用新型機器學習演算法打破最高分紀錄

策略遊戲對AI程式來說一直是個很大的挑戰,最近Uber的AI實驗室發表了新型機器學習演算法Go-Explore,該AI程式不需要人類的示範,在兩款策略遊戲中都遠遠超越人類玩家的平均表現

2018-11-28

OpenAI手把手增強學習從頭教,釋出教育資源Spinning Up

Spinning Up內容豐富囊括不少資源,不只從基本理論介紹起,還提供研究增強學習的方法,同時附上了許多演算法的實作範例程式碼。

2018-11-12

OpenAI改良增強學習技術激發好奇心,讓AI玩遊戲勝過人類

人工智慧玩遊戲的最佳分數達17.5K,通過第一級關卡並且探索完24個房間,OpenAI提到,好奇心驅使代理人發現新房間,並找到提高遊戲分數的方法。

2018-11-06

AI趨勢周報第62期:臉書開源自家增強學習平臺Horizon

臉書日前宣布開源內部專用的增強學習平臺Horizon,臉書許多應用程式都有使用Horizon,比如Messenger虛擬助理M Suggestions系統,可以推薦翻譯、Spotify歌曲、Food Network食譜影片等。臉書希望開源Horizon能擴展增強學習和無監督學習的應用領域。

2018-11-02

克服增強學習缺陷,Google讓AI擁有好奇心、自我激勵學習

基於情景記憶模型的關鍵,是把代理人從環境中獲得的觀察結果儲存在情景記憶中,並獎勵代理人取得尚未在記憶中出現的觀察。

2018-10-25

Google開源基於TensorFlow的增強學習框架Dopamine

Dopamine是用於快速設計增強學習演算法雛形的研究框架,能滿足開發小型且易於理解程式碼專案的需求,供研究人員進行推測研究測試新想法。

2018-08-29

北卡羅萊納大學讓AI自行設計化合物,還可指定化合物特性加速藥物開發

現在藥物開發只能在已知的化合物資料庫中進行虛擬篩選,ReLeaSE為科學家帶來的能力,就像是提供一家雜貨店和一位可以製作任何餐點的私人廚師,擁有創造與評估新化合物的獨特能力。

2018-08-03

以文字遊戲來訓練增強學習AI,微軟實驗室開源TextWorld框架

微軟開源的TextWorld包含遊戲產生器和遊戲引擎兩個元件,除了可以用來生成文字遊戲外,遊戲引擎具備簡單的推理演算法,能夠遊玩市面上的文字遊戲,供研究人員評估人工智慧。

2018-07-17

人類只要示範遊戲一次,OpenAI靠增強學習讓AI青出於藍勝於藍

OpenAI使用與OpenAI Five相同的增強學習技術,教人工智慧遊玩複雜的遊戲蒙特祖馬的復仇,除了參考人類示範的遊戲技巧外,還能考慮人類示範者沒有想過的解決方案。

2018-07-09

Google讓機器人抓握技巧更像人,在雜亂中抓取目標前還會先撈一撈

Google要讓機器人模仿人類的抓握策略,不只使用深度學習,賦予機器人處理非結構化現實場景的能力,再結合增強學習,讓機器人擁有進行長期推理與強大的順序決策技巧。

2018-07-02

OpenAI舉辦機器學習擂台,讓AI玩家在SEGA音速小子上決勝負

OpenAI釋出了經典基準(Retro-baselines),向參賽者展示增強學習演算法在遊戲關卡中的應用。而經典基準顯示,即使使用了轉移學習,轉移學習(Transfer Learning)演算法的學習能力還是遠低於人類。

2018-04-10