GPT-5-Codex出爐，變身為更完整的開發代理系統

圖片來源:

OpenAI

OpenAI於9月15日發表了GPT-5-Codex，它是基於GPT-5的程式開發工具Codex的最新版本。這一代的Codex已經強化了環境整合與持續脈絡追蹤能力，並具備較強的代理人行為，被視為從單純模型向具備代理功能系統（agentic system）的一大轉變，OpenAI稱它是「更可靠的隊友」。

GPT-5-Codex的重大升級之一是強化了環境整合能力：它現在能在命令列介面（CLI）、整合開發環境（IDE）、雲端／網頁端、GitHub、甚至ChatGPT app等地方使用，且工作進度與專案脈絡可以在這些環境中無縫保留。

具體而言，開發者可以先在CLI啟動一個重構任務，之後轉到VS Code或IDE擴充功能中預覽或修改，再切換到雲端／網頁版本進行較複雜的結構調整，整個過程中GPT-5-Codex能維持對專案狀態與文件內容的理解。

GPT-5-Codex也能在不同環境中理解並利用特有的脈絡資訊。例如，在IDE中，它會參考開啟的檔案與被選取的程式碼片段；在雲端環境中，能掃描專案結構，了解依賴關係，執行測試，並在程式庫中尋找錯誤。

此外，GPT-5-Codex表現出較強的主動執行與監控開發任務能力。當任務簡單時，它回應快速；當任務複雜、重構範圍大或涉及多文件時，它會投入更多思考。在測試中，有超過七小時連續自主工作、修正測試失敗、最終成功交付實作的案例。

GPT-5-Codex在程式碼庫上也能主動瀏覽、分析相依性、執行測試來驗證程式碼正確性，並在發現潛在問題時提供具體修改建議。

在性能與準確度的量化比較上，GPT-5-Codex的重構任務準確率為51.3%，高於GPT-5的33.9%；其用來評估真實軟體開發任務的SWE-bench Verified成績為74.5%，高過GPT-5的72.8%；在簡單任務上，GPT-5-Codex使用的Token比GPT-5少了93.7%，而在最複雜的任務上，GPT-5-Codex思考的時間則是GPT-5的兩倍。

圖片來源／OpenAI

熱門新聞