Google預覽Gemini 3.1 Flash-Lite，主打低成本與大量任務處理

圖片來源:

Google

Google本周發布輕量模型Gemini 3.1 Flash-Lite，主打快速、低成本，為執行高處理量的任務而設計。

即日起，Gemini 3.1 Flash-Lite以預覽版形式透過Google API在Google AI Studio上線，並透過Vertex AI提供給企業。

Gemini 3.1 Flash-Lite主打低價及更快的效能，號稱是Gemini 3系列速度最快、成本最低的模型。Google引述一項獨立標竿測試，Gemini 3.1 Flash-Lite在Time to First Answer Token（TTFT）的效能表現比2.5 Flash快2.5倍，輸出速度也提升45%。另一方面3.1 Flash-Lite雖然快，其推理、多模態理解能力卻不含糊。其GPQA Diamond跑分達86.9%，MMMU Pro達76.8%，超越2.5 Flash。Arena.ai Leaderboard Elo分數達1432，也技冠同級模型。

圖片來源／Google

Google表示，3.1 Flash-Lite的快速及推理能力，可協助大量的開發任務，像是重視成本的大量翻譯或內容控管工作。它也能處理需要深度推理能力的任務，例如生成使用者介面、儀表板、建立模擬或遵從指令。

以API價格而言，3.1 Flash-Lite輸入/輸出為每百萬token 0.25/1.5美元。和2.5 Flash相比較便宜，後者為0.3/2.5美元。值得注意的是，和同為Lite等級的2.5 Flash-Lite相較則價格較高，2.5版收費為0.1/0.4美元，輸出表現也比較快。

熱門新聞