DeepSeek推出最新版模型DeepSeek v3.2 首度整合工具使用能力

中國AI新創公司DeepSeek本周釋出最新版模型DeepSeek v3.2，首度將推理整合使用工具能力。

DeepSeek v3.1是高運算效率和代理人效能、及推理能力兼顧的新模型。除了v3.2版，這家新創公司也開源了強化推理能力的DeepSeek v3.2 Speciale。

DeepSeek最新版本為v3.2-Exp的繼任版本，植基於三大新技術突破。包括DeepSeek Sparse Attention這種注意力機制可大幅降低運算複雜性，同時保留模型效能，特別是長上下文的情境。其次是可擴充強化式學習框架，藉由實作強化式學習及擴大後訓練運算，DeepSeek v3.2效能堪比OpenAI最新的GPT-5。

DeepSeek v3.2-Speciale甚至超越GPT-5，推理能力則與Google Gemini-3.0-Pro相當。後者在2025國際數學奧林匹亞(IMO)及資訊奧林匹亞(IOI)測試上都展現金牌水準。而在ICPC World或IMO測試上也表現優異。

第三，是大規模代理任務合成管線(pipeline)。研究團隊開發新式的合成管線，可系統化產生大量訓練資料，有助於大規模代理人後訓練，進而提升在複雜互動環境中代理人依從及泛化（generalization）能力。DeepSeek v3.2的訓練資料號稱包含1800多種情境下的8.5萬種指令。

DeepSeek說，3.2版是該公司第一個將思維能力直接整合到工具使用能力的模型，它不論在思維(thinking)或非思維(non-thinking)模式下都支援工具使用能力。不過3.2-Speciale是專為深度推理任務設計，不支援工具呼叫。

此外DeepSeek v3.2並更新聊天範本，主要是修改了工具呼叫格式，並新增「以工具思考」的能力，他們也提供工具，在專用 encoding 資料夾包含示範把 OpenAI 相容格式的對話訊息編碼成模型可接受的輸入字串的Python 範例程式，以及測試案例（test cases），以協助降低開發者轉移成本。

二個模型以MIT授權開源。現在DeepSeek v3.2 已透過DeepSeek App、Web和API上線，DeepSeek v3.2-Speciale目前僅提供API存取。

熱門新聞