
Hugging Face
Google周四(1/15)開源了TranslateGemma翻譯模型,它支援55種語言,提供3種規模版本,分別是40億、120億和270億參數,適用於手機、筆電和雲端部署。
TranslateGemma是基於Google的開源AI模型Gemma 3所打造的翻譯專用版本。Gemma是Google推出的輕量級開源大型語言模型系列,設計理念是讓開發者能在各種裝置上運行高效能AI應用。這次的TranslateGemma則是將Gemma 3針對翻譯任務進行深度優化,從更大型的Gemini模型學習翻譯知識,以提升翻譯品質。
該模型採用兩階段訓練:首先用人工翻譯和Gemini模型生成的高品質合成數據進行微調,接著透過強化學習讓翻譯更自然流暢。這種方法成功將大型Gemini模型的翻譯能力濃縮到更精簡的開源架構中。
在WMT24++基準測試中,120億參數模型的表現超越了270億參數的基準模型。WMT24++ 是由Google與Unbabel共同開發的翻譯評測標準,涵蓋55種語言,包含文學、新聞、社群和語音等4個領域的人工翻譯參考資料,是目前業界常用、具代表性的翻譯評測標準之一。
這意味著開發者可以用更小的模型達到更好的翻譯品質,同時獲得更快的速度和更低的成本。40億參數版本也展現出與120億基準模型相當的效能,讓翻譯功能可以直接在手機上高效運行。
先前Google已推出過MADLAD-400等開源翻譯模型,Meta也有SeamlessM4T等支援語音和文字的翻譯模型。相較之下,TranslateGemma專注於文字翻譯,但在翻譯品質和效能上都有顯著提升。除了55種核心語言,研究團隊還擴展訓練到近500個語言對。值得一提的是,模型保留了圖像翻譯能力,可以直接翻譯照片中的文字,例如路標、菜單等。
TranslateGemma已於Kaggle及Hugging Face開放下載,開發者也可透過Vertex AI部署。
熱門新聞
2026-01-12
2026-01-12
2026-01-12
2026-01-12
2026-01-12