| 大型語言模型 | LLM | 微調 | 安全風險 | AI安全 | 模型安全 | GPT-3.5 Turbo | Llama-2

研究顯示微調LLM會削弱模型安全性

IBM研究院與普林斯頓大學、維吉尼亞科技大學聯合發表的論文指出,有三種方法可以透過微調LLM破壞開發者為模型加入的安全防護,例如數十萬組資料集中一旦含有不到100則的有害資料,就足以影響Meta Llama-2及OpenAI GPT-3.5 Turbo的安全性

2023-10-16

| 中研院 | CKIP-Llama-2-7b | LLM | 大型語言模型 | TAIDE

【剖析中研院大型語言模型事件的衝擊】為何臺灣必須擁有本土化的LLM

在10月6日國慶日前夕,中研院開源釋出了使用Llama 2所開發的繁中大型語言模型CKIP-Llama-2-7b,但由於一開始未說明該模型是明清人

2023-10-12

| LLM | 串流 | 注意力機制 | Transformer | 語言模型串流應用

高效框架StreamingLLM可處理無限長度文本,解決LLM串流應用困境

研究人員開發出StreamingLLM框架,使語言模型能夠處理無限長度的文本,解決記憶體消耗與長序列泛化問題,提升在串流應用部署語言模型的可行性

2023-10-05

| Meta | Llama 2 | LLM | Llama 2 Long | 長文本

Meta新開源模型Llama 2 Long整體長文處理效能超越GPT-3.5 Turbo

Meta新的Llama 2 Long模型經過持續預訓練,能夠有效處理長文本,並在長、短上下文任務優於當前的開源模型,而且不需要人工註釋資料,整體長上下文表現可超越OpenAI的gpt-3.5-turbo-16k模型

2023-10-03

| Mistral AI | LLM | Llama 2

Mistral AI開源輕巧高效能語言模型Mistral 7B

Mistral AI推出的開源語言模型Mistral 7B,雖只有73億參數,但在各項基準測試上表現優於Llama 2 13B模型,提供開發者另一個高效且具可擴展性的選擇

2023-09-28

| google | LLM | 蒸餾 | 微調

Google開發逐步蒸餾技術,小資料小模型也能打敗LLM

Google開發逐步蒸餾(Distilling Step-by-Step)技術,以較少資料訓練專用小模型,效能即可優於少樣本提示語言模型,解決龐大模型的部署挑戰,同時也使小模型效能可超越大型語言模型

2023-09-23

| 華碩 | 台智雲 | LLM | Llama 2 | 部署 | Code Llama

台智雲揭企業級LLM服務新進展,9月底將上線3種繁中優化的Llama 2模型

華碩子公司台智雲揭露新進展,要在企業級大型語言模型服務AFS中納入更多模型,包括以繁中資料強化的FFM-Llama 2 7B、13B和70B版本,預計9月底上線。

2023-09-21

| FLM-101B | 大型語言模型 | LLM

研究人員以10萬美元開發出千億參數的大型語言模型

近期公開於Hugging Face平臺的大型語言模型FLM-101B,強調具備1,010億個參數及0.31TB token,研究人員強調開發成本只花了10萬美元,且效能媲美GPT-3和GLM-130B等知名模型

2023-09-18

| IT周報 | LLM | 文生圖 | DeciLM 6B | 微軟 | Mojo | 程式語言 | AI | google

AI趨勢周報第228期:生成速度比Llama 2快15倍,以色列新創開源語言模型DeciLM 6B

Deci不只開源57億參數語言模型,還有圖像生成模型DeciDiffusion 1.0;語言、邏輯推理表現勝過Llama 2,微軟開源13億參數模型phi-1.5;執行速度達Python 68,000倍的AI語言Mojo可本地下載了;Nvidia開源TensorRT-LLM函式庫,加速LLM推論

2023-09-15

| 模糊測試 | LLM | 生成式AI

Code Intelligence推出可快速生成模糊測試的生成式AI服務CI Spark

Code Intelligence推出CI Spark服務,利用生成式人工智慧技術自動生成模糊測試程式碼,強化軟體安全,提升程式碼覆蓋率

2023-09-14

| Nvidia | LLM | 推論

Nvidia開源TensorRT-LLM函式庫強化H100 GPU大型語言模型推論效能

Nvidia推出TensorRT-LLM模型最佳化函式庫,強化H100 GPU推論能力,協助開發者高效運行大型語言模型,結合動態批次處理技術,提高GPU使用效率

2023-09-12

| 國科會 | LLM | TAIDE | 可信任AI | Llama 2

國產可信任AI對話引擎TAIDE開放測試申請,初期聚焦辦公室4大應用

由國科會號召打造的TAIDE計畫有新進展,這個專為臺灣打造的生成式AI對話引擎,將在9月開放公部門應用測試的申請,10月就會提供測試帳號,初期可幫助執行中英翻譯、自動摘要、寫Email,以及出題目產生文章等任務,後續將持續跟與會單位探討及發想更多應用可能性

2023-09-05