Google在本周二(6/17)正式釋出已預覽數月的Gemini 2.5 Flash與2.5 Pro穩定版,同時宣布預覽入門級的Gemini 2.5 Flash-Lite。

首個具備思考(Thinking)能力的Gemini模型是Google是在去年12月發表的Gemini 2.0 Flash Thinking Mode,而今年開始測試的Gemini 2.5家族則是首個內建Thinking能力的Gemini模型家族,包括Gemini 2.5 ProGemini 2.5 Flash

此一Thinking能力指的是模型在生成回應之前,會先進行內部推理、分析與規畫,以產生更精確也更深入的回答,旨在支援複雜任務的處理,回應時間也會比較久,內建思考能力的大型語言模型亦被外界稱為推理模型。

在Gemini 2.5模型家族中,2.5 Pro與2.5 Flash內建並啟用Thinking能力,而Gemini 2.5 Flash-Lite的Thinking能力雖然也是內建的,但預設值是關閉的。

一般而言,開發者可以透過API來設定thinkingBudget參數,以決定模型所投入的Thinking資源。在目前的Gemini 2.5模型家族中,2.5 Pro版的thinkingBudget最低閥值是128個Token,意謂著它不論如何都會發揮Thinking能力,也代表著它無法被關閉。

至於2.5 Flash雖然也是預設啟用Thinking,但可將thinkingBudget設為0,以關閉其思考功能;至於Gemini 2.5 Flash-Lite預設值則是關閉了Thinking,可藉由thinkingBudget設定來啟用。而且在2.5 Flash與Gemini 2.5 Flash-Lite中,不管有沒有啟用Thinking的費用都是一樣的。

最新的Gemini 2.5 Flash-Lite就是講求成本與效率,每100萬個Token的輸入費用為0.1美元,輸出為0.4美元。而2.5 Flash的輸入/輸出費用則是0.3/2.5美元,2.5 Pro則是1.25/10美元。

而在Google的各式基準測試中,可以發現啟用Thinking的測試結果絕大多數都優於未啟用。

除了Thinking功能之外,3個模型都支援多模態輸入,包括文字、程式碼、圖片、聲音、影片與PDF等,在輸出上,2.5 Pro與2.5 Flash支援文字、程式碼,以及文字+圖片的輸出,2.5 Flash-Lite則僅支援文字與程式碼的輸出。

此外,2.5 Pro適用於高階決策、商業分析、複雜的程式碼生成及除錯;2.5 Flash可支援即時聊天、客服、快速摘要或圖片標註等;入門款的Gemini 2.5 Flash-Lite則適用於大規模內容摘要、高吞吐量的資料處理、基本問答與低延遲應用。

熱門新聞

Advertisement