OpenAI發布程式開發專用模型GPT-5.2-Codex,並表示這是針對Codex情境調校的GPT-5.2版本,主打專業軟體工程與防禦型資安。該模型已在付費版ChatGPT用戶可使用的各項Codex介面上線,並規畫在接下來數周內逐步開放API存取。同時OpenAI也測試邀請制可信存取(Trusted Access),讓經審核、以防禦用途為主的專業人士與組織,先行參與後續能力與更寬鬆模型的存取測試。

官方提到,GPT-5.2-Codex的改動重點在於長期任務的上下文壓縮,並強化大型程式碼變更情境下的穩定性,例如重構與系統搬遷,也改善在Windows環境中的代理式程式開發表現,並提供Codex CLI作為使用入口。

OpenAI描述GPT-5.2-Codex更能處理長上下文與大型儲存庫,工具呼叫更可靠,目標是在長時間工作階段中維持脈絡一致,完成重構、程式碼庫搬遷與功能建置等較大任務,即使計畫調整或嘗試失敗也能繼續迭代。

OpenAI也提到視覺理解能力提升,可更準確解讀螢幕截圖、技術圖表與使用者介面,用於加速把設計稿轉成可運作原型。

在基準測試方面,OpenAI稱GPT-5.2-Codex在SWE-Bench Pro的準確率達56.4%,在Terminal-Bench 2.0達64.0%,呈現該模型在真實軟體工程任務與終端機操作情境下的代理式程式開發能力提升。對照OpenAI先前公布的GPT-5.2在SWE-Bench Pro為55.6%、GPT-5.1為50.8%,GPT-5.2-Codex在同類軟體工程基準測試上小幅提升,並在終端機型任務上相較GPT-5.1-Codex-Max的58.1%更高

OpenAI這次也將資安擺進模型能力強化重點,OpenAI表示,模型在資安任務的進步同時帶來雙重用途風險,因此採取更謹慎的部署策略。系統卡附錄指出,GPT-5.2-Codex在整備度框架(Preparedness Framework)下未達資安能力高(High)等級,OpenAI因此在模型層與產品層加上額外防護,包含針對有害任務與提示注入的安全訓練,以及代理沙箱與可設定的網路存取等機制。

官方也提到,先前有資安研究人員使用GPT-5.1-Codex-Max搭配Codex CLI進行React伺服器元件的漏洞研究並負責任通報。該研究原本是為了重現並分析稍早揭露的重大漏洞 React2Shell(CVE-2025-55182)修補內容,過程中另外發現3項新漏洞。React團隊隨後公開這3項漏洞,其中兩項可造成DoS,另一項可能導致原始碼曝光

針對後續開放策略,OpenAI表示將逐步推出並搭配更嚴格的存取控管,除ChatGPT付費用戶外,API端也逐步開放,並以邀請制讓經審核的防禦用途研究者先行參與。

熱門新聞

Advertisement