| 鴻海 | FoxBrain | LLM | 推理 | RLAIF | 資料過濾 | 分類
鴻海解析自家大語言模型FoxBrain技術亮點
鴻海日前在Nvidia GTC大會中說明自家大型語言模型FoxBrain技術亮點,包括在預訓練階段用LLM來過濾原始資料並分類、結合LLM和COSTAR框架來產出品質更好的訓練資料,以及在後訓練階段用LLM生成更多訓練資料、用LLM生成正確的推理過程,來強化FoxBrain推理能力等。
2025-04-01
| LLM | 繁中 | 合成資料 | Llama 3.1 | 推理 | 數學
鴻海要開源700億參數繁中大型語言模型FoxBrain
鴻海研究院日前揭露自家首款繁體中文大型語言模型FoxBrain,以Llama 3.1 70B模型為基礎,以120張H100 GPU和98B Token合成資料訓練而成,不只繁中能力超越Llama-3-Taiwan-70B,還具備良好的數學和邏輯推理能力。FoxBrain之後將開源。
2025-03-11
| AWS | SageMaker | 機器學習 | 無伺服器 | 推理
AWS正式推出SageMaker無伺服器推理服務
用戶可以選擇以無伺服器的形式,將模型部署至SageMaker機器學習服務,在不需要配置伺服器的情況下執行模型推理
2022-04-24
| Nvidia | TensorRT | AI | 推理
Nvidia釋出TensorRT 8強化大型語言模型推理
最新的深度學習推理SDK TensorRT 8,能夠加速所有基於Transformer模型的對話人工智慧,把推理時間縮短到前一代的一半
2021-07-21