OpenAI將Operator模型升級為具推理能力的o3 | iThome

文/林妍溱|2025-05-27發表

圖片來源:

OpenAI

OpenAI本周宣布將Operator代理人使用的模型，由GPT-4o升級為具推理思維能力的o3。

Operator為ChatGPT的電腦使用代理人（Computer-Using Agent，CUA），為ChatGPT賦予看/讀、寫/打字、點擊或操作滑鼠的能力，使其能代用戶執行多種任務，包括上網搜尋、操作應用程式、甚至訂餐廳、訂外送或下單。Operator今年1月先提供給美國，之後又陸續推向巴西、日、韓及新加坡等國，且持續擴大到全球。

目前Operator維持為研究預覽（research preview）版，還是僅限月付200美元的Pro方案用戶使用。

OpenAI在官方X帳號說明，Operator升級使用o3模型後，它和瀏覽器互動時將會更持續、更準確，以提高任務的成功率。回應內容上也會更清楚、全面、更有條理。

根據OpenAI說明，新版使用o3的Operator在OSWord和WebArena測試結果，都較原有（4o）的Operator表現更好，成為新的SOTA，而在不論標竿測試和人類偏好評估上，也都超越使用o4的Operator。

其他AI業者也正在開發類似Operator的代理人，包括Hugging Face的Open Computer Agent能查詢Google Maps或使用圖片生成模型，Google可理解影片、共享螢幕的Project Astra現在則整合到Google Live。圖片來源／OpenAI

熱門新聞

OpenAI推出GPT-5.4，強化專業能力並首度支援AI操作電腦

2026-03-06

美伊衝突期間，AWS中東資料中心因外部撞擊事故導致服務中斷

2026-03-02

駭客利用檔案管理員Windows File Explorer和WebDAV散布惡意程式

2026-03-02

【資安週報】0223~0226，AI自動化漏洞掃描將趨於普及，Anthropic推出Claude Code Security

2026-03-02

鴻海釋出未來5年永續發展藍圖，燈塔工廠要增加1倍

2026-03-04

卡巴斯基揭露Android後門Keenadu，部分裝置出廠即遭植入並形成殭屍網路

2026-03-05

Google抓Antigravity濫用誤鎖Gemini CLI用戶，新增再認證解封流程

2026-03-02

OpenClaw存在資安漏洞ClawJacked，攻擊者恐透過WebSocket連線挾持

2026-03-02

Advertisement