LLM | Page 6 | iThome

本期Martech雙周報重點：Jellyfish推出可以整理並分析不同LLM對品牌認知的工具；Google開源支援更多數位行銷情境的MMM成效追蹤統計模型；Amazon推出相當於Perfomance Max和Advantage+的跨通路AI代投服務

2025-02-07

Anthropic推出憲法式分類器，透過預設規則與分類器訓練，提高大型語言模型防禦能力。在測試中，該技術將越獄成功率從86％降至4.4％，拒絕率僅增0.38％，現已開放測試平臺供試驗

2025-02-06

Snowflake在Hugging Face開源SwiftKV模型，透過模型重組與知識蒸餾，將輸入提示處理計算減半，提升大型語言模型推論效率至2倍，適用於高負載企業應用

2025-01-17

中國MiniMax推出MiniMax-01系列，語言模型支援400萬Token上下文處理，性能與頂尖模型相當，多模態模型專注文本與影像結合，適用智慧助理與多媒體生成，定價具競爭力但存政策風險

2025-01-17

與傳統的建模範式相比，什麼是以數據為中心的AI？我們該如何決定它是否適合某項專案？

2025-01-03

LG新Gram筆電支援Copilot+，採混合式人工智慧架構，在本地端執行自家Exaone開源模型，可進行離線人工智慧運算，也能連接雲端支援更高階的需求

2025-01-03

7-Zip遭爆存在零時差漏洞，攻擊者可透過壓縮檔執行惡意程式碼，不過7-Zip開發者否認，指漏洞資訊有誤，並質疑是以大型語言模型生成

2025-01-02

在韓國電商市場具有領導地位的科技電商酷澎，如何以既有600多個ML專案為基礎，用生成式AI進一步強化零售大數據應用

2024-12-30

Hugging Face聯手其他團隊開發ModernBERT模型；Google推出LLM事實基準測試和排行榜；Hugging Face：小模型可用更長的運算時間，得到更好的準確率；OpenAI公布最新旗艦模型o3；Meta BLT語言模型架構突破分詞技術極限；DeepSeek V3模型釋出

2024-12-29

中國人工智慧公司DeepSeek推出具6,710億參數的語言模型DeepSeek V3，技術與效能暫時超越Llama等開放模型。不過，來自中國的語言模型因其審查機制，對全球華語世界的言論多樣性與話語權帶來潛在影響引發關注

2024-12-27

Meta一口氣開源9大研究成果；ChatGPT整合30多種第三方桌面應用程式；Nvidia推出輕巧實惠的生成式AI超級電腦；微軟發布140億參數小語言模型Phi-4；Google DeepMind推Veo 2影像生成模型；Anthropic推出Claude使用分析系統Clio

2024-12-20

MLCommons針對大型語言模型的安全性推出AILuminate基準測試，涵蓋12類潛在危險並進行獨立科學評估，Claude 3.5 Haiku、Claude 3.5 Sonnet、Gemma2 9B、Phi 3.5 MoE Instruct皆達非常好（Very Good）的等級

2024-12-08