Google釋出Gemini 3，強化推理、多模態及代理人能力

圖片來源:

Google

Google周二（11/18）發表新一代的Gemini 3模型，大幅升級了推理、多模態理解到代理人能力，當天已被部署至Search AI Mode、Gemini應用、AI Studio與Vertex AI。

Gemini 3目前包含兩大版本。主力版本Gemini 3 Pro是目前公開可使用的全功能模型，具備最強的多模態理解、推理與vibe coding能力，並支援100萬Token脈絡窗口。另一版本Gemini 3 Deep Think則為強化推理模式，專為跨領域、高複雜度問題所設計，目前僅提供給安全測試者，未來將開放給Google AI Ultra訂閱者。

Google表示，Gemini 3 Pro在多項AI基準測試中創下新高。在LMArena取得1501 Elo並登上排行榜第一，展現其在模型對戰式評比中的整體回答品質。Humanity’s Last Exam得分達37.5%，顯示其能處理極高難度的人類推理題目。GPQA Diamond達91.9%，反映出模型在博士級科學與研究問題上的理解深度。而在針對高難度數學推理的MathArena Apex中，Gemini 3 Pro也取得23.4%的成績。

多模態方面，在MMMU-Pro與Video-MMMU等測試也刷新紀錄，顯示模型在文字、影像、影片與程式碼推理方面均已達到新層級。

Gemini 3延續Gemini 2.5的代理人發展方向，在Vending-Bench 2展現全年穩定的模擬營運能力。該測試以經營一臺販賣機長達一年的情境，評估模型是否能在季節變化與動態需求下維持連貫策略與正確決策。Gemini 3在此表現顯示其具備長期任務中的一致性與耐久度，未來將透過Gemini Agent在產品中呈現，協助處理如預訂服務、整理收件匣等跨應用任務。

目前Google AI Pro每月費率為19.99美元，Google AI Ultra每月為249.99美元，開發者API採用按使用量計價，Gemini 3 Pro每百萬Token的輸入約2美元，每百萬Token輸出約12美元。

熱門新聞