增強學習 | iThome

| google | 增強學習 | 機器人

Google訓練機器人在自家辦公室分類垃圾

Google應用增強學習技術訓練機器人分類垃圾，實際部署後可成功減少垃圾桶40%至50%的垃圾重量

2023-04-14

| google | 增強學習 | 資料集

Google打造增強學習資料集生態系RLDS，促進資料收集和交流

增強學習資料集（RLDS）是一個資料集生態系，能夠完整收集增強學習需要的訓練資料，也能方便地與其他研究人員共享

2021-12-07

| google | 增強學習 | 機器人

狗成為機器人動作導師，Google讓四足機器人跟狗學習靈活的移動

研究人員利用狗的動作影片，在模擬環境訓練控制政策，並運用到真實世界四足機器人上，使其能作出靈活的動作

2020-04-07

| AI | google | 增強學習 | GPU | 健保署 | 廣達 | IBM | 武漢肺炎 | 超級電腦 | cGAN | 壓縮 | Uber

AI周報第125期：Google釋出超強RL代理，1秒訓練百萬幀影像還省下80%訓練成本

為打破傳統RL訓練的資源瓶頸，Google開發超強RL代理SEED RL，可將訓練規模擴展至數千臺機器、1秒可訓練百萬幀影像，透過集中式推論來有效利用運算資源，最多可省下8成訓練成本；另一方面，MIT發表新壓縮方法，最多可將cGAN縮小33倍，讓它能在行動裝置上執行；健保署日前聯手廣達，要以獨家AI平臺來協助研究員分析上億筆醫療大數據。

2020-03-26

| google | Deepmind | 增強學習

Google與DeepMind聯手釋出增強學習代理Dreamer，能透過想像力學習行為

增強學習代理Dreamer可透過世界模型，獲得對未來的預測以幫助學習長期行為

2020-03-20

| AI | 臉書 | 增強學習

AI也會讀空氣！臉書發展可理解遊戲隊友意圖的AI

臉書最新發展的人工智慧，可利用有限的資訊了解隊友意圖，並進行合作

2019-12-09

| AWS | DeepRacer | 增強學習

AWS DeepRacer釋出新版本搭載立體視覺攝影機與光達

新版DeepRacer搭載更先進的感測器，將能良好地偵測DeepRacer周圍的障礙物

2019-11-28

| google | RecSim | 推薦系統 | 增強學習

Google開源推薦系統模擬平臺RecSim

RecSim可用來模擬各種用戶偏好以及潛在狀態等特徵，幫助開發者開發與評估推薦器模型

2019-11-25

| OpenAI | 增強學習 | AI

Openai釋出增強學習的安全限制量測工具，研究如何讓AI不做「傻事」

研究人員可利用Safety Gym設置各種複雜度與難度的增強學習測試環境，試驗增強學習演算法在安全性以及效能表現。

2019-11-22

| Deepmind | AlphaStar | 增強學習 | 星海爭霸 | AI | 人工智慧

DeepMind以多重代理增強學習策略，讓AI在星海爭霸 2天梯爬上大師等級

AlphaStar擴展自我對戰策略，轉而以一群代理戰隊互相學習成長，透過發現代理遊玩缺點來提升技術

2019-11-02

| 臉書 | 決策AI | 增強學習 | 一之軒 | 辨識 | 臺灣杉二號 | 嘉義大學 | 植保機器人 | 中正大學 | 無人餐廳 | google | AI | IT周報

AI趨勢周報第105期：每日數百億個人化推播就靠它！臉書釋出決策AI工具包ReAgent

臉書AI研究院釋出一款增強式學習AI工具包ReAgent，可用來打造決策型AI，目前已於GitHub上開放下載。這個工具包是一個小型C++函式庫，有3大部分，首先是能產生決策並接收回饋的模型，再來是離線的評估模組，以及用來大量部署模型的部署平臺。

2019-10-18

| OpenAI | 神經網路 | 增強學習 | 域隨機化

Openai訓練神經網路可操作單個機器手掌解決魔術方塊

Openai應用了自動域隨機化，能夠逐漸提高神經網路的訓練難度，使得神經網路足夠強健應付現實環境

2019-10-16

iThome 研討會

IT EXPLAINED 數位轉型攻略 VIII

GenAI 加速企業創新落地，更需要全新 IT 戰略

日期: 即日起~01/28

DevOpsDays Taipei 2026 即刻開放徵求講者

DevOpsDays 不只是一場技術研討會，更是一個讓技術知識流動、社群共好的平臺。在技術百鍊成鋼的路上，你的實踐經驗就是最珍貴的寶藏！立即報名成為講者，讓我們一起推動臺灣 DevOps 走得更遠！

日期: 2026 年 6 月 25-26 日（四 - 五）