
Google周二(11/18)發表新一代的Gemini 3模型,大幅升級了推理、多模態理解到代理人能力,當天已被部署至Search AI Mode、Gemini應用、AI Studio與Vertex AI。
Gemini 3目前包含兩大版本。主力版本Gemini 3 Pro是目前公開可使用的全功能模型,具備最強的多模態理解、推理與vibe coding能力,並支援100萬Token脈絡窗口。另一版本Gemini 3 Deep Think則為強化推理模式,專為跨領域、高複雜度問題所設計,目前僅提供給安全測試者,未來將開放給Google AI Ultra訂閱者。
Google表示,Gemini 3 Pro在多項AI基準測試中創下新高。在LMArena取得1501 Elo並登上排行榜第一,展現其在模型對戰式評比中的整體回答品質。Humanity’s Last Exam得分達37.5%,顯示其能處理極高難度的人類推理題目。GPQA Diamond達91.9%,反映出模型在博士級科學與研究問題上的理解深度。而在針對高難度數學推理的MathArena Apex中,Gemini 3 Pro也取得23.4%的成績。
多模態方面,在MMMU-Pro與Video-MMMU等測試也刷新紀錄,顯示模型在文字、影像、影片與程式碼推理方面均已達到新層級。
Gemini 3延續Gemini 2.5的代理人發展方向,在Vending-Bench 2展現全年穩定的模擬營運能力。該測試以經營一臺販賣機長達一年的情境,評估模型是否能在季節變化與動態需求下維持連貫策略與正確決策。Gemini 3在此表現顯示其具備長期任務中的一致性與耐久度,未來將透過Gemini Agent在產品中呈現,協助處理如預訂服務、整理收件匣等跨應用任務。
目前Google AI Pro每月費率為19.99美元,Google AI Ultra每月為249.99美元,開發者API採用按使用量計價,Gemini 3 Pro每百萬Token的輸入約2美元,每百萬Token輸出約12美元。
熱門新聞
2025-12-24
2025-12-26
2025-12-26
2025-12-26
2025-12-26
2025-12-29
2025-12-26