| GPT-5 | MCP-Universe | AI代理 | 多步驟任務 | 人工智慧測試
GPT-5在跨工具任務成功率僅四成,MCP基準測試凸顯AI代理落地難題
Salesforce團隊發表MCP-Universe基準測試,GPT-5在跨工具多步驟任務成功率為43.72%,雖居各模型之首但仍未過半,研究指出長脈絡與工具適應力是人工智慧代理落地的主要瓶頸
2025-08-25
| GPT-5 | MCP-Universe | AI代理 | 多步驟任務 | 人工智慧測試
GPT-5在跨工具任務成功率僅四成,MCP基準測試凸顯AI代理落地難題
Salesforce團隊發表MCP-Universe基準測試,GPT-5在跨工具多步驟任務成功率為43.72%,雖居各模型之首但仍未過半,研究指出長脈絡與工具適應力是人工智慧代理落地的主要瓶頸
2025-08-25