| ChatGPT Atlas | 代理模式 | 提示詞注入 | 自動化紅隊 | 強化學習

ChatGPT Atlas代理模式更新,引入對抗式訓練防提示詞注入攻擊

OpenAI內部自動化紅隊用強化學習找出新提示詞注入手法,因此更新ChatGPT Atlas代理模式,加入對抗式訓練檢查點與防護,並提醒視任務需求選擇登出執行並核對高風險動作

2025-12-25