Google釋出Gemini 2.5 Flash與2.5 Pro穩定版，預覽入門級Gemini 2.5 Flash-Lite

Google在本周二（6/17）正式釋出已預覽數月的Gemini 2.5 Flash與2.5 Pro穩定版，同時宣布預覽入門級的Gemini 2.5 Flash-Lite。

首個具備思考（Thinking）能力的Gemini模型是Google是在去年12月發表的Gemini 2.0 Flash Thinking Mode，而今年開始測試的Gemini 2.5家族則是首個內建Thinking能力的Gemini模型家族，包括Gemini 2.5 Pro與Gemini 2.5 Flash。

此一Thinking能力指的是模型在生成回應之前，會先進行內部推理、分析與規畫，以產生更精確也更深入的回答，旨在支援複雜任務的處理，回應時間也會比較久，內建思考能力的大型語言模型亦被外界稱為推理模型。

在Gemini 2.5模型家族中，2.5 Pro與2.5 Flash內建並啟用Thinking能力，而Gemini 2.5 Flash-Lite的Thinking能力雖然也是內建的，但預設值是關閉的。

一般而言，開發者可以透過API來設定thinkingBudget參數，以決定模型所投入的Thinking資源。在目前的Gemini 2.5模型家族中，2.5 Pro版的thinkingBudget最低閥值是128個Token，意謂著它不論如何都會發揮Thinking能力，也代表著它無法被關閉。

至於2.5 Flash雖然也是預設啟用Thinking，但可將thinkingBudget設為0，以關閉其思考功能；至於Gemini 2.5 Flash-Lite預設值則是關閉了Thinking，可藉由thinkingBudget設定來啟用。而且在2.5 Flash與Gemini 2.5 Flash-Lite中，不管有沒有啟用Thinking的費用都是一樣的。

最新的Gemini 2.5 Flash-Lite就是講求成本與效率，每100萬個Token的輸入費用為0.1美元，輸出為0.4美元。而2.5 Flash的輸入/輸出費用則是0.3/2.5美元，2.5 Pro則是1.25/10美元。

而在Google的各式基準測試中，可以發現啟用Thinking的測試結果絕大多數都優於未啟用。

除了Thinking功能之外，3個模型都支援多模態輸入，包括文字、程式碼、圖片、聲音、影片與PDF等，在輸出上，2.5 Pro與2.5 Flash支援文字、程式碼，以及文字+圖片的輸出，2.5 Flash-Lite則僅支援文字與程式碼的輸出。

此外，2.5 Pro適用於高階決策、商業分析、複雜的程式碼生成及除錯；2.5 Flash可支援即時聊天、客服、快速摘要或圖片標註等；入門款的Gemini 2.5 Flash-Lite則適用於大規模內容摘要、高吞吐量的資料處理、基本問答與低延遲應用。

熱門新聞