| 叡揚資訊 | AI Chatbot | AI對話機器人 | 繁中語料 | 大型語言模型 | LLM
【企業LLM實戰:叡揚資訊】實測多種LLM更走訪企業現場,歸納臺灣企業LLM應用3大挑戰
年初,專攻AI對話平臺的叡揚資訊開始嘗試不同的LLM,更參與了不少企業客戶LLM驗證。他們從這些實戰中,歸納出臺灣企業現在所面對的3大LLM課題
2023-11-30
| 史丹佛大學 | Stanford HAI | 基礎模型 | 透明度 | LLM | Lama 2 | OpenAI | PaLM 2 | BloomZ
史丹佛大學發表基礎模型透明度指標,Llama 2以54%居冠
執行基礎模型透明度調查的史丹佛大學HAI學院認為,模型的透明度反映了企業或學術界使用模型發展應用的潛在風險,但研究人員發現市面上十大基礎模型在透明度方面都不及格,即使被HAI評鑑為最佳的Meta Lama 2模型,其透明度表現在100項指標中也只拿下5成,遠低於研究人員預估的8成理想值
2023-10-20
| 中研院 | CKIP-Llama-2-7b | LLM | 大型語言模型 | TAIDE
【剖析中研院大型語言模型事件的衝擊】為何臺灣必須擁有本土化的LLM
在10月6日國慶日前夕,中研院開源釋出了使用Llama 2所開發的繁中大型語言模型CKIP-Llama-2-7b,但由於一開始未說明該模型是明清人
2023-10-12
| LLM | 串流 | 注意力機制 | Transformer | 語言模型串流應用
高效框架StreamingLLM可處理無限長度文本,解決LLM串流應用困境
研究人員開發出StreamingLLM框架,使語言模型能夠處理無限長度的文本,解決記憶體消耗與長序列泛化問題,提升在串流應用部署語言模型的可行性
2023-10-05
| Meta | Llama 2 | LLM | Llama 2 Long | 長文本
Meta新開源模型Llama 2 Long整體長文處理效能超越GPT-3.5 Turbo
Meta新的Llama 2 Long模型經過持續預訓練,能夠有效處理長文本,並在長、短上下文任務優於當前的開源模型,而且不需要人工註釋資料,整體長上下文表現可超越OpenAI的gpt-3.5-turbo-16k模型
2023-10-03