| XAI | Grok 4.1 | LLM | 幻覺 | EQ-Bench3

xAI推出Grok 4.1公開評測資料,主打情感互動並提升查證可靠性

xAI推出Grok 4.1,強化情感理解、創作表現與查證能力,在真人偏好測試中以約64%勝率超越前代,幻覺率降至4.22%。新版已於grok.com與行動平臺上線,但尚未開放公開API串接

2025-11-20

| IT周報 | LLM | 幻覺 | google | OpenAI | Sora | Nvidia | 機器人

AI趨勢周報第277期: 降低幻覺新方法,Google推Data Commons MCP伺服器

Google推出Data Commons MCP伺服器,AI代理可即時存取龐大且具公信力的資料;經濟部推AI應用躍昇計畫,要藉共通模型帶動跨產業落地;Meta發布320億參數CWM模型,專攻程式碼生成和推理;微軟把代理人模式引進Office;OpenAI推新版影片生成模型Sora 2

2025-10-02

| OpenAI | 大型語言模型 | 幻覺 | 自信錯誤

OpenAI發現評測獎勵猜測,促使大型語言模型出現幻覺

OpenAI發現模型亂猜導致幻覺頻繁,建議模型評測應重懲自信錯誤並獎勵合宜不確定,可降低錯誤率提升可靠度

2025-09-09

| google | RAG | 生成式AI | 幻覺 | Vertex AI

Google推Vertex AI RAG Engine提升生成式AI應用精確性與可靠性

Google Vertex AI RAG Engine採用RAG技術,藉由整合外部資料,解決生成式人工智慧的幻覺問題,以及資料時效性限制

2025-01-20

| AWS | 生成式AI | 幻覺

AWS推出自動化推理檢查,強化生成式AI安全性與準確性

AWS在Amazon Bedrock Guardrails中新增自動化推理檢查功能,透過數學與邏輯驗證生成式人工智慧回應的準確性,防範幻覺錯誤

2024-12-06

| 奇美醫院 | GAI | 生成式AI | GenAI | 多層次提示 | 幻覺 | 智慧醫院

【奇美醫院GAI應用實例】GAI分工走進診間成虛擬照護團隊,靠多層次提示克服幻覺難題

奇美醫院的生成式AI應用分為2大類,一是專門除錯、摘要的HIS Copilot,另一是整合各種資訊來給建議的A+巡房大聯盟,兩者都涵蓋醫師、護理師等多種醫療人員,就像一支虛擬照護團隊。這些GAI之所以落地實用,還在於克服幻覺

2024-11-08

| IT周報 | LLM | 幻覺 | 微軟 | AI認證 | 人才 | 國泰金控 | 生成式AI | AI爬蟲

AI趨勢周報第260期:能偵測又能修正LLM幻覺內容,微軟預覽新功能Correction

微軟預覽一款Azure AI內容安全功能Correction,可偵測、修正LLM幻覺內容;臺灣人工智慧學校年底前開辦工程級AI認證;國泰金控揭露生成式AI技術發展框架;可阻擋AI爬蟲了,Cloudflare釋出免費工具;國泰聯手中信、玉山、新光驗證聯邦學習架構;Meta釋出Llama新模型,開始支援多模態了

2024-09-29

| OpenAI | 過程監督 | AI | 幻覺

OpenAI新訓練方法可避免AI出現幻覺

OpenAI透過一種稱為過程監督的方法,增進了大型語言模型的推理能力,在數學領域有效解決幻覺問題

2023-06-02