| LLM | OpenAI | o3-mini | Deliberative Alignment | jailbreak

資安研究人員聲稱突破OpenAI最新防禦機制,成功在新款機器學習模型o3-mini進行越獄

CyberArk研究員透露,他們對於才正式發表不久、搭載新資安防護機制的o3系列AI模型進行測試,結果發現還是能夠成功越獄,要求AI模型提供網路攻擊步驟及工具

2025-02-11

| IT周報 | 生成式AI | LLM | MMM | 市場調查 | RMN

Martech雙周報第70期:LLM都怎麼說你的品牌?Jellyfish推出對各大模型做「市調」的分析工具

本期Martech雙周報重點:Jellyfish推出可以整理並分析不同LLM對品牌認知的工具;Google開源支援更多數位行銷情境的MMM成效追蹤統計模型;Amazon推出相當於Perfomance Max和Advantage+的跨通路AI代投服務

2025-02-07

| Anthropic | AI安全 | 越獄攻擊 | 憲法式分類器 | LLM

Anthropic公開憲法式分類器,大幅降低AI越獄攻擊成功率

Anthropic推出憲法式分類器,透過預設規則與分類器訓練,提高大型語言模型防禦能力。在測試中,該技術將越獄成功率從86%降至4.4%,拒絕率僅增0.38%,現已開放測試平臺供試驗

2025-02-06

| SwiftKV | Snowflake | LLM | 知識蒸餾

Snowflake開源可縮減LLM推論時間50%的SwiftKV模型

Snowflake在Hugging Face開源SwiftKV模型,透過模型重組與知識蒸餾,將輸入提示處理計算減半,提升大型語言模型推論效率至2倍,適用於高負載企業應用

2025-01-17

| MiniMax | 基準測試 | LLM

中國AI公司MiniMax推出新LLM,支援400萬Token與多模態應用

中國MiniMax推出MiniMax-01系列,語言模型支援400萬Token上下文處理,性能與頂尖模型相當,多模態模型專注文本與影像結合,適用智慧助理與多媒體生成,定價具競爭力但存政策風險

2025-01-17

| 數據集 | 迭代 | 模型 | 效能 | 數據 | LLM | AI開發 | LLM評估指標

以數據為中心的AI

與傳統的建模範式相比,什麼是以數據為中心的AI?我們該如何決定它是否適合某項專案?

2025-01-03

| LG | Exaone | LLM | 混合式AI | Copilot+ PC | AI PC

LG Gram筆電導入混合式AI,本地端執行自家Exaone開源模型

LG新Gram筆電支援Copilot+,採混合式人工智慧架構,在本地端執行自家Exaone開源模型,可進行離線人工智慧運算,也能連接雲端支援更高階的需求

2025-01-03

| 7-Zip | ACE | LLM

7-Zip傳存在零時差漏洞,7-Zip開發者駁斥此為假消息

7-Zip遭爆存在零時差漏洞,攻擊者可透過壓縮檔執行惡意程式碼,不過7-Zip開發者否認,指漏洞資訊有誤,並質疑是以大型語言模型生成

2025-01-02

| 酷澎 | 生成式AI | LLM | 軟體開發生命週期 | GPU

酷澎如何擁抱生成式AI,開發到應用技術細節一次看

在韓國電商市場具有領導地位的科技電商酷澎,如何以既有600多個ML專案為基礎,用生成式AI進一步強化零售大數據應用

2024-12-30

| IT周報 | Hugging Face | BERT | 序列 | LLM | google | 分詞 | Meta | 超高速顯微鏡

AI趨勢周報第265期:BERT的接班模型來了

Hugging Face聯手其他團隊開發ModernBERT模型;Google推出LLM事實基準測試和排行榜;Hugging Face:小模型可用更長的運算時間,得到更好的準確率;OpenAI公布最新旗艦模型o3;Meta BLT語言模型架構突破分詞技術極限;DeepSeek V3模型釋出

2024-12-29

| LLM | DeepSeek | LLaMA

DeepSeek V3多項測試指標領先Llama,中國語言模型引發言論自由與話語權討論

中國人工智慧公司DeepSeek推出具6,710億參數的語言模型DeepSeek V3,技術與效能暫時超越Llama等開放模型。不過,來自中國的語言模型因其審查機制,對全球華語世界的言論多樣性與話語權帶來潛在影響引發關注

2024-12-27

| IT周報 | Meta | AI代理 | LLM | 影像生成 | Anthropic | 小模型 | 生成式AI | 超級電腦 | Nvidia

AI趨勢周報第264期:從虛擬人到LLM社交智力測試,Meta開源9大研究成果

Meta一口氣開源9大研究成果;ChatGPT整合30多種第三方桌面應用程式;Nvidia推出輕巧實惠的生成式AI超級電腦;微軟發布140億參數小語言模型Phi-4;Google DeepMind推Veo 2影像生成模型;Anthropic推出Claude使用分析系統Clio

2024-12-20