AI21 Labs的文字編輯器Wordtune新增共同作者機器人Spices,根據文章內容提供引用和統計資料,協助作者以具真實性與可追溯性的建議豐富文章
2023-01-19
微軟正式推出Azure OpenAI服務,提供GPT-3、Codex和DALL-E 2模型
企業用戶已經可以申請,透過Azure OpenAI服務取用GPT-3、GPT-3.5、Codex和DALL-E 2模型,之後微軟也提供用戶存取對話語言模型ChatGPT
2023-01-17
Google表示,被開除的工程師Blake Lemoine宣稱LaMDA模型有感知能力一事毫無根據,在雙方溝通無效、Lemoine依舊選擇違反公司政策情況下,選擇解僱Lemoine
2022-07-25
| Hugging Face | BigScience專案 | 語言模型 | BLOOM | 開源
由AI新創Hugging Face主導並協調的BigScience專案,釋出具備1,760億個參數的大型語言模型BLOOM,其參數規模略勝OpenAI的GPT-3模型
2022-07-14
| YaLM 100B | Yandex | 開源 | 語言模型
Yandex開源具備1,000億個參數的YaLM 100B語言模型
Yandex強調YaLM 100B是全球最大的類生成型已訓練變換模型(GPT)的神經網路
2022-06-24
| Meta | Open Pretrained Transformer | OPT-175B | 語言模型
Meta釋出具備1,750億個參數的Open Pretrained Transformer語言模型
OPT-175B語言模型所使用的參數數量,與號稱全球最強大語言模型的OpenAI GPT-3一樣多,不過,Meta強調它們只使用了16個Nvidia的V100 GPU就完成該模型的訓練與部署
2022-05-04
Deepmind利用紅隊語言模型來生成測試使用案例,以自動發現語言模型的各種有害行為
2022-02-08
Google讓模型依任務學習路由,有效提高大型語言模型推理效率
Google發表新的新型混合專家模型TaskMoE,大小不只是典型混合專家模型TaskMoE的七分之一,吞吐量更是提升達2倍
2022-01-18