Google開源TranslateGemma翻譯模型，支援55種語言

圖片來源:

Hugging Face

Google周四（1/15）開源了TranslateGemma翻譯模型，它支援55種語言，提供3種規模版本，分別是40億、120億和270億參數，適用於手機、筆電和雲端部署。

TranslateGemma是基於Google的開源AI模型Gemma 3所打造的翻譯專用版本。Gemma是Google推出的輕量級開源大型語言模型系列，設計理念是讓開發者能在各種裝置上運行高效能AI應用。這次的TranslateGemma則是將Gemma 3針對翻譯任務進行深度優化，從更大型的Gemini模型學習翻譯知識，以提升翻譯品質。

該模型採用兩階段訓練：首先用人工翻譯和Gemini模型生成的高品質合成數據進行微調，接著透過強化學習讓翻譯更自然流暢。這種方法成功將大型Gemini模型的翻譯能力濃縮到更精簡的開源架構中。

在WMT24++基準測試中，120億參數模型的表現超越了270億參數的基準模型。WMT24++ 是由Google與Unbabel共同開發的翻譯評測標準，涵蓋55種語言，包含文學、新聞、社群和語音等4個領域的人工翻譯參考資料，是目前業界常用、具代表性的翻譯評測標準之一。

這意味著開發者可以用更小的模型達到更好的翻譯品質，同時獲得更快的速度和更低的成本。40億參數版本也展現出與120億基準模型相當的效能，讓翻譯功能可以直接在手機上高效運行。

先前Google已推出過MADLAD-400等開源翻譯模型，Meta也有SeamlessM4T等支援語音和文字的翻譯模型。相較之下，TranslateGemma專注於文字翻譯，但在翻譯品質和效能上都有顯著提升。除了55種核心語言，研究團隊還擴展訓練到近500個語言對。值得一提的是，模型保留了圖像翻譯能力，可以直接翻譯照片中的文字，例如路標、菜單等。

TranslateGemma已於Kaggle及Hugging Face開放下載，開發者也可透過Vertex AI部署。

熱門新聞