圖片來源: 

OpenAI

OpenAI於9月15日發表了GPT-5-Codex,它是基於GPT-5的程式開發工具Codex的最新版本。這一代的Codex已經強化了環境整合與持續脈絡追蹤能力,並具備較強的代理人行為,被視為從單純模型向具備代理功能系統(agentic system)的一大轉變,OpenAI稱它是「更可靠的隊友」。

GPT-5-Codex的重大升級之一是強化了環境整合能力:它現在能在命令列介面(CLI)、整合開發環境(IDE)、雲端/網頁端、GitHub、甚至ChatGPT app等地方使用,且工作進度與專案脈絡可以在這些環境中無縫保留。

具體而言,開發者可以先在CLI啟動一個重構任務,之後轉到VS Code或IDE擴充功能中預覽或修改,再切換到雲端/網頁版本進行較複雜的結構調整,整個過程中GPT-5-Codex能維持對專案狀態與文件內容的理解。

GPT-5-Codex也能在不同環境中理解並利用特有的脈絡資訊。例如,在IDE中,它會參考開啟的檔案與被選取的程式碼片段;在雲端環境中,能掃描專案結構,了解依賴關係,執行測試,並在程式庫中尋找錯誤。

此外,GPT-5-Codex表現出較強的主動執行與監控開發任務能力。當任務簡單時,它回應快速;當任務複雜、重構範圍大或涉及多文件時,它會投入更多思考。在測試中,有超過七小時連續自主工作、修正測試失敗、最終成功交付實作的案例。

GPT-5-Codex在程式碼庫上也能主動瀏覽、分析相依性、執行測試來驗證程式碼正確性,並在發現潛在問題時提供具體修改建議。

在性能與準確度的量化比較上,GPT-5-Codex的重構任務準確率為51.3%,高於GPT-5的33.9%;其用來評估真實軟體開發任務的SWE-bench Verified成績為74.5%,高過GPT-5的72.8%;在簡單任務上,GPT-5-Codex使用的Token比GPT-5少了93.7%,而在最複雜的任務上,GPT-5-Codex思考的時間則是GPT-5的兩倍。

圖片來源/OpenAI

熱門新聞

Advertisement