| Gemini 2.0 | agentic AI | AI agent
Google將Gemini 2.0定位為針對Agentic AI時代打造的多模態語言模型家族,以Gemini 2.0 Flash為先發
2024-12-12
| Databricks | MLflow | 資料集 | AI agent
Databricks推出新API可迅速合成機器學習評估資料集
Databricks新的合成資料生成API,讓企業能在數分鐘內,根據專有資料自動生成機器學習評估資料集,支援自定義問題指南,並與現有評估平臺整合,提升人工智慧代理的測試與除錯效率
2024-12-12
| Copilot Vision | 微軟 | Edge
微軟可理解網頁內容的Copilot Vision在美開放部分用戶測試
微軟將實驗性AI功能Copilot Vision開放給部分Copilot Pro用戶試用,這個整合於Edge的瀏覽器專用助理,主打能夠根據用戶正在瀏覽的網頁內容,完成行程建議、購物指引等任務
2024-12-10
OpenAI公布影片生成模型Sora,Plus、Pro方案可用
OpenAI在今年初公布的影片生成模型Sora,現在連同速度更快的Sora Turbo模型一併正式發布,以獨立產品在sora.com網站上線,同時提供給ChatGPT Plus和Pro用戶
2024-12-10
OpenAI新的強化微調技術可降低強化學習實作門檻,供開發者打造針對特定領域的專家級模型,特別適用於法律、保險與醫療等具備客觀正確答案的領域
2024-12-09
| GenCas | Google DeepMind | 天氣預測 | 氣象預報 | AI模型
Google DeepMind AI模型GenCast可提供15天氣象預報,比權威機構還準
Google DeepMind發表新一代天氣預報模型GenCast,可提供未來15天的氣象預報,並強調預測準確度優於歐洲中期天氣預報中心(ECMWF)的ENS系統
2024-12-09
根據Meta公布的資料,700億參數的Llama 3.3在多任務語言理解、財務、數學、多任務學習推理等標竿測試中,效能超越Gemini Pro 1.5、GPT-4o以及Llama 3.1 405B
2024-12-08
| Grok
X平臺聊天機器人Grok開放給免費用戶,增加擬真圖片生成模型Aurora
社群平臺X開始部署免費版聊天機器人服務Grok,同時加入xAI新模型Aurora所提供的圖片生成功能
2024-12-08
| MLCommons | LLM | 安全風險 | 基準測試
MLCommons推出第一個LLM安全基準,促進AI風險評估標準化
MLCommons針對大型語言模型的安全性推出AILuminate基準測試,涵蓋12類潛在危險並進行獨立科學評估,Claude 3.5 Haiku、Claude 3.5 Sonnet、Gemma2 9B、Phi 3.5 MoE Instruct皆達非常好(Very Good)的等級
2024-12-08
| OpenAI | ChatGPT Pro
OpenAI新增最高階ChatGPT Pro方案,每月200美元
OpenAI公布月費高達200美元的付費方案ChatGPT Pro,強調可無上限存取既有模型及工具,並獨家使用OpenAI-o1 Pro模型,可針對困難問題提供最佳答案
2024-12-06











