
Google本周發布輕量模型Gemini 3.1 Flash-Lite,主打快速、低成本,為執行高處理量的任務而設計。
即日起,Gemini 3.1 Flash-Lite以預覽版形式透過Google API在Google AI Studio上線,並透過Vertex AI提供給企業。
Gemini 3.1 Flash-Lite主打低價及更快的效能,號稱是Gemini 3系列速度最快、成本最低的模型。Google引述一項獨立標竿測試,Gemini 3.1 Flash-Lite在Time to First Answer Token(TTFT)的效能表現比2.5 Flash快2.5倍,輸出速度也提升45%。另一方面3.1 Flash-Lite雖然快,其推理、多模態理解能力卻不含糊。其GPQA Diamond跑分達86.9%,MMMU Pro達76.8%,超越2.5 Flash。Arena.ai Leaderboard Elo分數達1432,也技冠同級模型。

圖片來源/Google
Google表示,3.1 Flash-Lite的快速及推理能力,可協助大量的開發任務,像是重視成本的大量翻譯或內容控管工作。它也能處理需要深度推理能力的任務,例如生成使用者介面、儀表板、建立模擬或遵從指令。
以API價格而言,3.1 Flash-Lite輸入/輸出為每百萬token 0.25/1.5美元。和2.5 Flash相比較便宜,後者為0.3/2.5美元。值得注意的是,和同為Lite等級的2.5 Flash-Lite相較則價格較高,2.5版收費為0.1/0.4美元,輸出表現也比較快。
熱門新聞
2026-03-02
2026-03-02
2026-03-02
2026-03-02
2026-03-02
2026-03-02
2026-03-03