GPU | KV快取卸載 | LLM | LLM記憶體擴展 | 大型語言模型 | 技術文章 | 記憶體 | 高頻寬快閃記憶體 | AI & Big Data
【兩大路線擺脫GPU記憶體容量有限的束縛】LLM記憶體擴展解決方案概覽
為了滿足LLM無止盡的記憶體空間需求,促成記憶體擴展解決方案的興盛發展,涵蓋從開源軟體,到搭配專屬硬體運作等不同形態
2025-09-04
GPU | LLM | MoE | 大型語言模型 | 技術文章 | 混合專家模型架構 | 記憶體 | AI & Big Data
【引進多元化記憶體架構,擴展LLM記憶體資源】打破LLM的記憶體容量瓶頸
LLM能力持續提高,帶來記憶體容量需求暴漲,促成卸載GPU記憶體負荷、擴展可用記憶體資源的嶄新解決方案誕生,幫助克服LLM應用的記憶體瓶頸
2025-09-04
面對資訊與科技大爆炸的當代工作環境,所有人的步調不斷加快,都希望能夠馬上看到成效。但在「開快車」之前,我們本身還是需要具備一定程度的能力,就像運動需要足夠的體力,掌握基本知識、各種動作訣竅,以及自我保護的方法,而且,要眼觀四面、耳聽八方,打開所有身體的感官,做出最佳判斷
2025-09-04
CVE-2025-7775 | CVE-2025-7776,CVE-2025-8424 | Hexstrike-AI | MCP | 新聞 | 資安
AI滲透測試自動化平臺HexStrike-AI遭濫用,駭客快速將Citrix NetScaler零時差漏洞用於實際攻擊
資安業者Check Point提出警告,號稱能整合超過150款資安工具,以及12款AI代理的自動化資安防禦框架HexStrike-AI,在正式發表不久,駭客已在網路犯罪論壇討論,如何將其用來攻擊存在CVE-2025-7775的Citrix NetScaler設備,並實際於受害設備部署Web Shell
2025-09-04
ChatGPT Projects | OpenAI | 新聞 | AI & Big Data
OpenAI開放免費用戶使用ChatGPT Projects
ChatGPT Projects功能讓使用者能依據不同主題需求,開設專屬智慧工作空間以存放聊天內容、上傳檔案,添加客製化指令
2025-09-04
Cisco | LLM伺服器 | Ollama | Shodan | 新聞 | AI & Big Data | 資安
Cisco揭露逾千臺Ollama伺服器外曝,近2成免認證可執行模型推論
Cisco發現逾千臺Ollama伺服器對外曝露,其中近2成可無認證執行模型推論,顯示企業與個人部署大語言模型時忽視存取控制,可能帶來重大安全風險
2025-09-04
AI搜尋 | google | Siri | World Knowledge Answers | 新聞 | 蘋果 | AI & Big Data
根據彭博社取得的消息,蘋果為了強化AI搜尋技術選擇與Google合作,將評估Google所開發的AI模型能否適用於Siri
2025-09-04
Android | CVE-2025-38352 | CVE-2025-48543 | 新聞 | 零時差漏洞 | 資安
本週Google發布9月份安卓每月例行更新,一共修補112項漏洞,並指出其中有兩個CVE-2025-38352、CVE-2025-48543,已被用於針對性攻擊
2025-09-04







