
中國AI新創公司DeepSeek本周釋出最新版模型DeepSeek v3.2,首度將推理整合使用工具能力。
DeepSeek v3.1是高運算效率和代理人效能、及推理能力兼顧的新模型。除了v3.2版,這家新創公司也開源了強化推理能力的DeepSeek v3.2 Speciale。
DeepSeek最新版本為v3.2-Exp的繼任版本,植基於三大新技術突破。包括DeepSeek Sparse Attention這種注意力機制可大幅降低運算複雜性,同時保留模型效能,特別是長上下文的情境。其次是可擴充強化式學習框架,藉由實作強化式學習及擴大後訓練運算,DeepSeek v3.2效能堪比OpenAI最新的GPT-5。
DeepSeek v3.2-Speciale甚至超越GPT-5,推理能力則與Google Gemini-3.0-Pro相當。後者在2025國際數學奧林匹亞(IMO)及資訊奧林匹亞(IOI)測試上都展現金牌水準。而在ICPC World或IMO測試上也表現優異。
第三,是大規模代理任務合成管線(pipeline)。研究團隊開發新式的合成管線,可系統化產生大量訓練資料,有助於大規模代理人後訓練,進而提升在複雜互動環境中代理人依從及泛化(generalization)能力。DeepSeek v3.2的訓練資料號稱包含1800多種情境下的8.5萬種指令。
DeepSeek說,3.2版是該公司第一個將思維能力直接整合到工具使用能力的模型,它不論在思維(thinking)或非思維(non-thinking)模式下都支援工具使用能力。不過3.2-Speciale是專為深度推理任務設計,不支援工具呼叫。
此外DeepSeek v3.2並更新聊天範本,主要是修改了工具呼叫格式,並新增「以工具思考」的能力,他們也提供工具,在專用 encoding 資料夾包含示範把 OpenAI 相容格式的對話訊息編碼成模型可接受的輸入字串的Python 範例程式,以及測試案例(test cases) ,以協助降低開發者轉移成本。
二個模型以MIT授權開源。現在DeepSeek v3.2 已透過DeepSeek App、Web和API上線,DeepSeek v3.2-Speciale目前僅提供API存取。
熱門新聞
2025-12-24
2025-12-29
2025-12-26
2025-12-29
2025-12-26