重點新聞(0123~0129)

 ATLAS     擴展法則     Google DeepMind  

Google DeepMind給出多語言模型的最佳擴展法則

Google DeepMind最近提出一套新訓練法則ATLAS(Adaptive Transfer Scaling Laws),專門解決一個老問題:多語言模型越練越大,但效果常常不如預期。進一步來說,過去大家熟悉的擴展法則(Scaling laws),幾乎都是在「只訓練英文」的情況下推導出來的。一旦模型要同時支援幾十、幾百種語言,原本的經驗法則就不太管用。

ATLAS實際跑了774次受控訓練實驗,模型大小從1,000萬到80億參數不等,涵蓋了400多種語言訓練,而團隊評估了48種目標語言的表現。他們發現,語系或書寫系統相近的語言一起訓練,最容易加分,例如西班牙文、葡萄牙文、義大利文一起訓練,效果通常比亂混更好。

這項研究也量化了常被提到的「多語言詛咒」。結論是,語言變多確實會佔用模型容量,但影響沒那麼可怕:如果支援的語言數量翻倍,只要把模型放大約1.18倍、資料量增加1.66倍,就能維持效能。團隊也在ATLAS給出建議,算力資源不夠時,先微調現有的多語言模型最划算;資源要是夠多,再從頭訓練。(詳全文)

 翻譯     資料集     Hugging Face  

Hugging Face釋出1兆Token的超大翻譯資料集FineTranslations

Hugging Face最近公開FineTranslations資料集,規模超過1兆Token,涵蓋500多種語言與英文對照翻譯的平行文本,是目前最大的合成翻譯資料集之一。為建立這套資料集,團隊先是將多語言預訓練資料集FineWeb2的非英文內容,透過Gemma 3 27B模型,大規模翻譯成英文。這個資料集以ODC-By 1.0授權釋出,使用者可自由使用、重製,團隊也完整公開產製流程。

FineTranslations的核心目的,是要補齊現有模型的翻譯弱點。多數語言模型在「外語翻英文」時表現很好,但在「英文翻外語」,尤其是低資源語言,翻譯品質仍明顯落後。Hugging Face的做法,是先建立大量的原文-英文對照資料集,再用這些平行語料來微調模型,強化英文 → 其他語言的翻譯能力。

團隊測試發現,這批英文資料本身也保留各國文化和語境特徵,單獨用於英文模型訓練時,效果已接近FineWeb等高品質語料。這也顯示,以AI合成的資料,再反過來訓練AI,是一個可行的方法。(詳全文)

  Clawbot     AI助理     協作  

Clawdbot走紅,AI助理走向開始做事的行動代理

開源AI代理專案Clawdbot(現名為Moltbot)近日在開發者社群快速竄紅,被視為AI助理邁向行動代理(Agent)的重要象徵。該專案由奧地利工程師、PSPDFKit共同創辦人Peter Steinberger於2026年1月推出,主打使用者可自行部署且控制的本地AI助理,而非綁定單一雲端服務。

Clawdbot的設計重點,在於讓大型語言模型不只回話,而是能在取得授權後實際執行任務。使用者可將其部署在本地電腦或伺服器,串接OpenAI、Anthropic等模型API,並透過Telegram、Slack、Discord或Teams等既有通訊工具下指令,讓AI進行檔案讀寫、終端機操作、網頁擷取與流程自動化。

相較多數雲端AI服務,Clawdbot不強調專屬介面,而是嵌入原有工作流程。其以Gateway負責權限與訊息控管,實際行動則交由本地代理執行。社群分享顯示,已有使用者將其用於內容產製、研究與內部流程自動化。雖仍偏向開發者實驗框架,但Clawdbot的爆紅意味著,AI助理正從聊天工具,走向可被信任、可被授權的工作夥伴。(詳全文)

  Anthropic    憲章      Claude  

Anthropic改用一整份說明書教AI怎麼想,還授權釋出

Anthropic近日公開新版Claude憲章,完整揭露模型的行為原則和價值優先順序,並以CC0授權釋出,任何人都能自由使用。Anthropic強調,這份文件不只是對外說明立場,還會直接用在模型訓練,來優化Claude對複雜情境的判斷。

和過去條列式規則不同,這次憲章改寫成一份「有前因後果」的完整文件,花大量篇幅解釋為什麼要這樣做、界線在哪裡。Anthropic認為,只叫AI守規則並不夠,還要讓模型理解原則背後的理由,遇到價值衝突時才不會僵硬套用。

這份憲章主要寫給Claude看,用來說明模型可能遇到的兩難情境,例如誠實與同理如何拿捏、協助使用者時如何保護敏感資訊。實務上,憲章不只作為行為目標,也會用來產生合成訓練資料,持續影響後續版本。Anthropic也明訂行為優先順序:先確保整體安全與人類可監督性,再來是廣義倫理,接著才是公司指引與使用者需求,反映現階段模型仍可能誤判風險的現實。(詳全文)

  MCP Apps     Claude     工作流程  

Claude導入MCP Apps,AI工具整合從「用文字說」走向「一起操作」

Anthropic宣布,旗下AI聊天機器人Claude正式導入MCP Apps,可將第三方工具的互動式介面直接嵌入對話中,讓Claude從以文字為主的協作助手,進一步變成可視化的工作介面,目前已支援Asana、Box、Figma、Slack等9種工具,後續也規畫加入Salesforce。

MCP(Model Context Protocol)是Anthropic推出的開放標準,用來定義AI如何安全連接外部工具並執行指令。過去Claude雖能透過MCP建立任務或操作工具,但流程多以文字回饋為主;MCP Apps則更進一步,允許工具把原本的UI一起帶進AI對話中。

實際使用時,使用者可在Claude內直接查看並編修Asana專案、預覽與修改Slack訊息,或在Figma FigJam中把文字指令轉成流程圖與甘特圖,就像是和AI一起盯著同一個畫面工作,而不是只等結果回報,為AI代理更深入工作流程鋪路。(詳全文)

  瀏覽器     Gemini     Chrome  

Gemini進駐Chrome側欄,瀏覽器更像行動AI代理了

Google最近更新Chrome的AI能力,讓Gemini常駐於瀏覽器側邊欄,還能隨分頁切換,即時理解使用情境,讓使用者不必跳離頁面,就能請AI彙整重點、比較網站內容或整理行程。目前先於美國推出。

與此同時,Google也推出代理式瀏覽功能Auto Browse,能在使用者授權下,由Gemini代為開啟分頁、搜尋資訊、填寫表單與比對選項,並即時顯示操作流程;遇到登入、付款等敏感動作,則會要求人工確認。目前Auto Browse僅開放AI Pro與Ultra用戶試用,並設有使用上限。

此外,Google也把影像創作模型Nano Banana直接內建於瀏覽器,讓使用者可對網頁圖片即時轉換風格或視覺化資料。換句話說,Chrome正從單純的瀏覽工具,進一步成為AI可實際動手做事的入口。(詳全文)

  Ai2     程式開發     後訓練  

Ai2推SERA程式開發代理,把後訓練門檻壓到最低

美國艾倫AI研究院(Ai2)最近啟動Open Coding Agents計畫,首波釋出程式開發代理SERA,並同步公開訓練資料和可重現的後訓練流程。Ai2希望,開發團隊能用低成本,把模型快速調整到企業內部或私有程式碼庫。

Ai2指出,封閉模型通常沒看過企業或組織內部的程式碼風格與API慣例,實務上常「不懂專案在幹嘛」。SERA採用合成資料驅動的後訓練方法,降低對完整測試環境的依賴。官方估算,重現既有最佳開源成果僅需約400美元算力,若要逼近同級頂尖模型,成本上限約1.2萬美元,小團隊也能負擔。

就效能來說,SERA-32B在SWE-Bench Verified的解題率達54.2%,約40個GPU日內即可完成訓練,還可直接相容Claude Code。Ai2也與Nvidia合作,優化模型在H100、B200平臺的推論效率。(詳全文)

  Google AI Plus     Deep Research     NotebookLM  

Google AI Plus正式在臺上線

Google正式在臺灣推出Google AI Plus訂閱方案,主打每月新臺幣260元,整合旗下多項進階AI模型與工具,瞄準工作效率和創作需求。即日起新用戶還可享前兩個月半價優惠。

訂閱後,使用者可在Gemini App中解鎖Gemini 3 Pro,用於程式撰寫、推理和複雜任務;此外也能使用Deep Research生成較完整的主題分析報告。在創作部分,Google提供Nano Banana Pro影像生成,以及Veo 3.1 Fast的文字轉影片功能,並每月附贈200點AI點數,可用於Flow和Whisk製作短片。

而且,使用者也能透過內建於Gmail和Google文件的Gemini,來協助寫信、整理草稿;至於NotebookLM,則可提供更高的語音摘要和筆記本上限。這個方案還包含200GB雲端儲存空間,最多還能與5位家庭成員共享。Google表示,臺灣既有Google One Premium 2TB用戶,也將自動獲得AI Plus權益。(詳全文)

圖片來源/Google DeepMind、Hugging Face、Moltbot、Ai2、Google

  AI近期新聞 

1. Moonshot AI開源Kimi K2.5,可自動生成最多100個子代理

2. 衛福部正式啟動高算力中心暨跨國聯邦學習平臺,要解決公雲的合規局限

資料來源:iThome整理,2026年1月

 

熱門新聞

Advertisement