| IT周報 | Mamba | 程式碼生成 | Meta | Llama 3.1 | 蘋果 | Transformer | Nvidia

AI趨勢周報第257期: Mistral AI用Mamba架構打造程式碼生成模型

Mistral AI用Mamba 2架構打造程式碼生成模型,表現比同規模的Transformer模型好;Hugging Face釋出小又強健的語言模型SmolLM;Meta開源Llama 3.1 405B;有效加速Transformer生成時間,蘋果推LazyLLM;Nvidia推出企業級模型客製化平臺AI Foundry

2024-07-26

| IT周報 | Meta | Transformer | 局部性 | 核融合 | JAX | 蘋果 | WWDC | Apple Intelligence

AI趨勢周報第255期: Google DeepMind開源核融合裝置模擬器TORAX

Google DeepMind用Python-JAX打造托卡馬克核融合裝置模擬器並開源;Meta AI證實Transformer能處理單一像素而非16x16的區塊,效果還更好;健保署聯手Google要打造糖尿病風險預測AI;Nvidia開源HelpSteer2資料集,可低成本確保LLM與人類偏好一致;蘋果新推Apple Intelligence智慧功能

2024-06-16

| IT周報 | Transformer | xLSTM | LLM | 國科會 | TAIDE | Deepmind | 分子結構 | AI開發助理

AI趨勢周報第252期:取代Transformer?LSTM之父發表新LLM架構

LSTM之父Sepp Hochreiter提出一種新架構xLSTM,媲美Transformer;DeepMind發表可預測所有生命分子結構的AlphaFold 3模型;國科會揭TAIDE計畫最新成果;甲骨文也推出AI開發助理了;Red Hat推出AI平臺,內建IBM Granite模型;Stack Overflow聯手OpenAI,將優化Chatbot功能

2024-05-12

| IT周報 | Mamba | Transformer | google | Gemini | AWS | 思科 | AI助理 | AI聯盟

AI趨勢周報第235期:Mamba架構橫空出世,克服Transformer運算效率缺陷還具5倍吞吐量

Mamba引起AI社群關注,採狀態空間模型實現5倍吞吐量;GPT-4V最強對手來了,Google多模態Gemini模型登場;Meta、IBM等巨頭合組開源AI聯盟;Google發表新一代TPU和超級電腦架構;JetBrains新AI程式開發助理整合自家IDE

2023-12-10

| LLM | 串流 | 注意力機制 | Transformer | 語言模型串流應用

高效框架StreamingLLM可處理無限長度文本,解決LLM串流應用困境

研究人員開發出StreamingLLM框架,使語言模型能夠處理無限長度的文本,解決記憶體消耗與長序列泛化問題,提升在串流應用部署語言模型的可行性

2023-10-05

| PyTorch | Transformer | 機器學習

深度學習函式庫PyTorch 2.0正式發布,帶來高效能Transformer API與模型編譯器

PyTorch 2.0添加高效能Transformer API以及torch.compile編譯器,開發者可明顯感覺模型訓練與推理運算加速

2023-03-16

| IT周報 | google | Transformer | 機器人 | 導航 | 資料集 | 搜尋 | 大型主機

AI趨勢周報第210期:Google用Transformer模型即時導航機器人

Google成功用Transformer模型即時導航機器人,延遲僅8毫秒;司法院法庭中文語音辨識系統正式上線,準確率超過9成;Google搜尋再優化,新添資料集搜索引擎;Brave搜尋引擎自建生成式AI,幫摘要搜尋結果;IBM大型主機作業系統將擁抱AI

2023-03-09

| 微軟 | DirectML | PyTorch | Transformer

最新版DirectML PyTorch開始支援熱門Transformer模型

開發者現在可以使用DirectML PyTorch最新版本,利用GPU加速來訓練包括GPT2、BERT等熱門Transformer模型

2022-12-07

| Apache OpenNLP | ONNX Runtime | Transformer

Apache OpenNLP整合ONNX Runtime現可高效執行Transformer模型

Java NLP機器學習函式庫Apache OpenNLP藉由整合ONNX Runtime,開始能夠執行Transformer模型,使用戶獲得高效深度學習自然語言處理的能力

2022-09-23

| Nvidia | LLM | NeMo | Transformer

Nvidia發布AI新工具簡化大型語言模型訓練與部署

科學家可以藉由Nvidia BioNeMo服務,訓練和部署大型生物分子Transformer人工智慧模型,加速藥物探索研究

2022-09-21

| IT周報 | AI | google | 氣味 | 蟲媒傳染病 | 逃稅 | 訂閱制 | 紐約時報 | TensorFlow | Transformer

AI趨勢周報:Google AI釋出氣味圖譜,要來預防蟲媒傳染病

Google AI用ML產出氣味圖譜,可定位分子與氣味,進而用於驅蟲劑、預防蟲媒傳染病;私建游泳池想逃稅?法國政府用AI一眼揪出得補稅的地產;讀者可看幾篇免費文章?紐時用ML自動決定;TensorFlow 2.10版出爐了;吳恩達:白宮論文開放政策將催生更多AI新進展

2022-09-15

| IT周報 | 陪審團學習 | 偏差 | Meta | 物件偵測 | Transformer | 人造眼 | 招潮蟹

AI趨勢周報第196期:史丹佛研發陪審團學習方法,要解決標註者造成的ML偏差

史丹佛大學發展陪審團學習方法,要打破標註者分布不均造成的ML偏差;模擬招潮蟹!MIT專家打造出陸地水下都能看的360度人造眼;Meta開發新演算法,要讓新一代Chatbot談吐更優雅;Meta開源新電腦視覺模型,可偵測更多不常見物件

2022-08-11