AI推論 | iThome

模型即服務平臺Replicate同意網路安全及效能優化服務供應商Cloudflare的收購提議，將整合雙方產品與技術以共同發展AI推論服務

2025-11-18

高通（Qualcomm）推出機架級AI推論解決方案，採用者包括沙烏地阿拉伯AI新創Humain

2025-10-28

Google Cloud Run GPU正式上線，支援用戶即時啟用Nvidia L4 GPU，無需配額申請，可提升人工智慧推論與批次運算彈性，並有效降低閒置成本

2025-06-09

堅決不做LLM模型的紅帽，如何在GenAI世界中找到自己的新定位，GenAI新戰略背後有哪些思考，以及下一步方向又是如何，紅帽技術長親自剖析背後的布局關鍵

2025-05-21

WebAssembly封裝的AI代理程式檔案超小，更容易落地部署、快速啟動。這項雲原生新技術，在2025年將成為企業IT開發GAI應用的新主流

2024-12-27

AI推論程式碼、CUDA runtime、PyTorch框架和10GB的LLM基礎模型，用Wasm編譯後的Bytecod檔，可以大幅縮小到數MB，比同樣功能的容器或VM映像檔，足足少了1千倍，這正是Wasm冷啟動速度可以超級快的原因。

2024-11-29

Ampere將透過整合其Altra CPU及高通的Cloud AI 100 Ultra AI加速器，開發專為處理大型語言模型推論作業設計的資料中心伺服器晶片，以創造無GPU的AI推論

2024-05-20

數位經濟平臺Digiconomist、比特幣耗電量指數的創辦人Alex De Vries預估到了2027年，AI的用電量可能等同於荷蘭一年的電力使用

2023-10-12

今年9月，Nvidia推出新一代AI推論加速卡Tesla T4，導入最新發表的GPU架構Turing，強化多精度的運算效能

2018-11-29