
法國AI新創公司Mistral本周公佈開源程式撰寫模型Devstral 2、輕量版Devstral Small 2,以及CLI代理人等相關工具加入軟工代理人戰局,並提供一段時間的免費API存取。
Devstral 是軟體工程專用的代理式LLM,而Devstral 2為1230億參數的稠密Transformer(dense transformer)模型,支援256K脈絡長度。它是為指令遵從而微調,使其相當適合交談、指示型、代理式任務,也擅長使用工具來探索codebase、編輯多種檔案,驅動軟工代理人。
Mistral同時公佈240億參數的Devstral Small 2,可部署在筆電上,或是以API存取執行,適合在本地端部署以及微調客製化。
雖然Devstral 2及Devstral Small 2參數量和DeepSeek v3.2各小了5倍和28倍,和Kimi K2相比更小了8倍和41倍,但在標竿測試SWE-bench Verified上卻獲致72.2%及68.0%的效果,僅略低於大廠旗艦模型如Gemini 3 Pro、GPT 5.1及Claude 4.5 Sonnet,超過Grok Code Fast 1、Owen 3 coder plus及DeepSeek v 3.2。
兩者輕巧特性使其可部署在基本硬體上,降低開發人員、小型企業或個人玩家的開發門檻。這家法國AI公司宣稱Devstral 2的成本效率在實際任務上是Claude Sonnet的7倍。
在軟工輔助能力上,Devstral 2支援探索基準代碼(codebase)及協同多個檔案變更,它能追蹤框架相依性、偵測錯誤及修正臭蟲、現代化舊式系統。它還能被微調以特定語言為優先,或為大型企業級基準代碼化。Mistral AI並提供數據,顯示Devstral 2和DeepSeek 3.2及Sonnet 4.5的效能比較,勝率分別是42.8%及21.4%。
Mistral還公佈了以Devstral為引擎的開源指令行程助理Vibe CLI,它提供對話式,具有檔案操作、程式搜尋、版本控管及指令執行工具,還有專案感知、智慧參照、多檔案協同及autocompletion、存續性紀錄、客製化主題等能力,能讓使用者以自然語言探索基準代碼上、或修改、執行變更。使用者可在自己的終端機或以Agent Communication Protocol整合到偏好的IDE中操作。
Devstral 2以修改的MIT授權開源。而Devstral Small 2和Mistral Vibe CLI都以Apache 2.0授權開源。
Devstral 2目前透過Mistral API可免費使用一段時間。免費期過後,API將按輸入/輸出(每百萬token)收費,Devstral 2為0.40/2.00美元,Devstral Small 2則為0.10/0.30美元。
熱門新聞
2025-12-04
2025-12-08
2025-12-08
2025-12-05
2025-12-08