| AI | RL | 獎勵機制 | 通用AI | DeBERTa | 自然語言 | AI監管 | 臉書 | IT周報

AI趨勢周報第155期:不求獎勵的RL代理就更像人類嗎?Google Brain告訴你

Google Brain聯手多倫多大學和Vector研究院,用3種常見的人類學習機制,來探討AI是否不需任務獎勵,只靠Intrinsic objective就能探索環境、找出最佳解法;微軟NLU模型DeBERTa超越人類表現,「離通用AI更近了」;臉書發起Open Loop計畫,號召全球政策制定者和科技公司加入,來研擬恰當的AI法規。

2021-01-14