圖片來源: 

OpenAI

在內部發出紅色警戒後,OpenAI昨(11)日發表最新LLM GPT-5.2,宣稱是迄今最強大的專業知識工作模型系列,強調文件製作、視覺及軟工能力更強,幻覺更少,但價格也調高約40%。

OpenAI指出,設計GPT-5.2的目的是為了展現更大經濟價值,它在建立試算表、製作簡報、編寫程式碼、解讀圖像、理解長篇上下文、運用各項工具,以及處理複雜的多步驟專案方面表現更佳。

ChatGPT中的GPT‑5.2 Instant、Thinking和Pro即日起陸續推出,首先開放給付費方案使用者。API中,上述模型現已向所有開發者開放。GPT‑5.2 (Thinking)每百萬Token輸入/輸出價格為$1.75/$14,並對快取輸入提供90%折扣。Pro版為$21/$168。ChatGPT的方案訂閱費用不變,相較之下,GPT‑5.1為$1.25/$10。OpenAI解釋GPT-5.2更貴是因模型能力更強。

和GPT-5.1 Thinking相較,GPT-5.2 Thinking在知識工作任務標竿測試GDPval成績,由38.8%大幅提升到70.9%。OpenAI表示,它在處理44種知識工作任務時,表現甚至優於專業人士。

GPT- 5.2在長文本理解和推理能力大幅提升,可支援多數十萬token的資料,對長文件、合約、報告及研究資料的分析更準確。OpenAI強調,GPT-5.2 Thinking是其首個在4-needle MRCR(context windows可達256k)測試達到近乎滿分準確率的模型。

在開發輔助上,新版SWE-Bench Verified也由76.3%進步到新高80.0%,能可靠對生產環境程式碼偵錯、處理開發需求、重構大型程式碼庫。

GPT-5.2 Thinking是OpenAI迄今最強的視覺模型,可更精準解讀圖表、螢幕截圖、技術圖示等視覺訊息,而不只是文字。OpenAI也強調GPT-5.2 Thinking幻覺較5.1 Thinking明顯降低,在去識別化的回應層面錯誤率也從8.8%降為6.2%,減少38%。

GPT-5.2將導入作為ChatGPT的底層引擎,分成三個版本。包括支援日常查詢或工作的快速版本GPT-5.2 Instant;適合複雜工作的GPT-5.2 Thinking,後者在編寫程式碼、摘要長篇文件、回應數學和邏輯問題,規劃與決策能力都更提升。以及最可靠的模型GPT‑5.2 Pro,適合需要高品質答案、且容許較長回應時間的艱深任務,包括程式設計。

GPT‑5.2 Thinking現已可透過Responses API和Chat Completions API提供使用。

因應在美國的用戶在和AI對話後自殘事件,GPT-5.2也強化在敏感對話的回應能力。OpenAI也開始分階段推出年齡預測模型⁠,可自動替未滿18歲的使用者套用內容保護措施,限制其接觸敏感內容。

熱門新聞

Advertisement