| IT周報 | AI | 強化學習 | RLHF | LLM | 生成式AI | Python | 微軟 | Excel | 程式開發

AI趨勢周報第225期:DeepMind發表新演算法ReST,不需人為介入強化學習

人類回饋強化學習(RLHF)是當今LLM的重要訓練方法,但DeepMind新演算法ReST可免去人為介入;Hugging Face發布圖文通吃的多模態模型;文字、語音都能懂!Meta開源多語言翻譯模型;微軟在Excel加入Python支援;資料不外洩!Hugging Face推出企業級自託管程式開發助手

2023-08-24