
圖片來源:
OpenAI
OpenAI本周宣布將Operator代理人使用的模型,由GPT-4o升級為具推理思維能力的o3。
Operator為ChatGPT的電腦使用代理人(Computer-Using Agent,CUA),為ChatGPT賦予看/讀、寫/打字、點擊或操作滑鼠的能力,使其能代用戶執行多種任務,包括上網搜尋、操作應用程式、甚至訂餐廳、訂外送或下單。Operator今年1月先提供給美國,之後又陸續推向巴西、日、韓及新加坡等國,且持續擴大到全球。
目前Operator維持為研究預覽(research preview)版,還是僅限月付200美元的Pro方案用戶使用。
OpenAI在官方X帳號說明,Operator升級使用o3模型後,它和瀏覽器互動時將會更持續、更準確,以提高任務的成功率。回應內容上也會更清楚、全面、更有條理。
根據OpenAI說明,新版使用o3的Operator在OSWord和WebArena測試結果,都較原有(4o)的Operator表現更好,成為新的SOTA,而在不論標竿測試和人類偏好評估上,也都超越使用o4的Operator。
其他AI業者也正在開發類似Operator的代理人,包括Hugging Face的Open Computer Agent能查詢Google Maps或使用圖片生成模型,Google可理解影片、共享螢幕的Project Astra現在則整合到Google Live。圖片來源/OpenAI
熱門新聞
2025-07-07
2025-07-04
2025-07-03
2025-07-07
2025-07-04
2025-07-04
Advertisement