
KV快取產品崛起
資料中心GPU記憶體容量擴充緩不濟急、成本高昂,眾多儲存廠商與開源社群看準AI市場應用商機,紛紛投入KV快取這個全新的產品領域,希望透過外部記憶體資源擴充,為GPU提供更多記憶體,目前已形成多種產品路線,也帶來嶄新的階層式AI記憶體應用框架
AI啟動下一波企業儲存系統革命
人工智慧已成為當代企業IT應用的顯學,當所有人都在追逐軟體與AI模型的發展,以及硬體運算能力之餘,對於網路、儲存系統等IT基礎架構的效能、效率要求,也跟著水漲船高
文 /|2025-07-04
滿足LLM推理永無止盡的記憶體需求,外部KV快取記憶體解決方案崛起
為了解決GPU有限的記憶體容量,對於LLM推理運算造成的瓶頸,促成嶄新的外部KV快取記憶體技術,在近幾個月來迅速興起
文 /|2025-07-04
加速大語言模型推論效率,KV快取卸載解決方案總覽
GPU記憶體已經成為限制大語言模型推論效率的瓶頸,也促成一系列外部KV記憶體解決方案的誕生,藉由卸載GPU的KV快取,達到提升效能的目的
文 /|2025-07-04
按讚加入iThome粉絲團追蹤