DeepMind以多重代理增強學習策略,讓AI在星海爭霸 2天梯爬上大師等級

AlphaStar擴展自我對戰策略,轉而以一群代理戰隊互相學習成長,透過發現代理遊玩缺點來提升技術

2019-11-02

AI趨勢周報第105期:每日數百億個人化推播就靠它!臉書釋出決策AI工具包ReAgent

臉書AI研究院釋出一款增強式學習AI工具包ReAgent,可用來打造決策型AI,目前已於GitHub上開放下載。這個工具包是一個小型C++函式庫,有3大部分,首先是能產生決策並接收回饋的模型,再來是離線的評估模組,以及用來大量部署模型的部署平臺。

2019-10-18

Openai訓練神經網路可操作單個機器手掌解決魔術方塊

Openai應用了自動域隨機化,能夠逐漸提高神經網路的訓練難度,使得神經網路足夠強健應付現實環境

2019-10-16

DeepMind發表遊戲增強學習框架OpenSpiel

OpenSpiel提供了各式增強學習的研究環境以及演算法,以促進通用增強學習的發展

2019-09-03

教AI踢足球!Google大腦開源足球遊戲增強學習環境

進行足球比賽所需要掌握的傳球、防守等技巧與決策能力,對於增強學習技術來說是一大挑戰

2019-06-11

AWS推出DeepRacer聯賽虛擬賽車場,讓全球開發者以模型在線上競速

AWS為迷你自駕車DeepRacer推出新控制臺,開發者可以用來訓練增強學習模型,並於虛擬賽車場進行比賽

2019-04-30

Google超快深度增強學習演算法Soft Actor-Critic,機器人只要訓練2小時就能於各類地形行走

Soft Actor-Critic基於最大熵增強學習,增加了超參數的強健性以及採樣效率,可以在幾小時內解決原本需要數週的機器人行為訓練。

2019-01-21

不再需要人類示範遊戲,Uber用新型機器學習演算法打破最高分紀錄

策略遊戲對AI程式來說一直是個很大的挑戰,最近Uber的AI實驗室發表了新型機器學習演算法Go-Explore,該AI程式不需要人類的示範,在兩款策略遊戲中都遠遠超越人類玩家的平均表現

2018-11-28

OpenAI手把手增強學習從頭教,釋出教育資源Spinning Up

Spinning Up內容豐富囊括不少資源,不只從基本理論介紹起,還提供研究增強學習的方法,同時附上了許多演算法的實作範例程式碼。

2018-11-12

OpenAI改良增強學習技術激發好奇心,讓AI玩遊戲勝過人類

人工智慧玩遊戲的最佳分數達17.5K,通過第一級關卡並且探索完24個房間,OpenAI提到,好奇心驅使代理人發現新房間,並找到提高遊戲分數的方法。

2018-11-06

AI趨勢周報第62期:臉書開源自家增強學習平臺Horizon

臉書日前宣布開源內部專用的增強學習平臺Horizon,臉書許多應用程式都有使用Horizon,比如Messenger虛擬助理M Suggestions系統,可以推薦翻譯、Spotify歌曲、Food Network食譜影片等。臉書希望開源Horizon能擴展增強學習和無監督學習的應用領域。

2018-11-02

克服增強學習缺陷,Google讓AI擁有好奇心、自我激勵學習

基於情景記憶模型的關鍵,是把代理人從環境中獲得的觀察結果儲存在情景記憶中,並獎勵代理人取得尚未在記憶中出現的觀察。

2018-10-25