幻覺 | iThome

xAI推出Grok 4.1，強化情感理解、創作表現與查證能力，在真人偏好測試中以約64%勝率超越前代，幻覺率降至4.22%。新版已於grok.com與行動平臺上線，但尚未開放公開API串接

2025-11-20

AI趨勢周報第277期：降低幻覺新方法，Google推Data Commons MCP伺服器

Google推出Data Commons MCP伺服器，AI代理可即時存取龐大且具公信力的資料；經濟部推AI應用躍昇計畫，要藉共通模型帶動跨產業落地；Meta發布320億參數CWM模型，專攻程式碼生成和推理；微軟把代理人模式引進Office；OpenAI推新版影片生成模型Sora 2

2025-10-02

| OpenAI | 大型語言模型 | 幻覺 | 自信錯誤

OpenAI發現評測獎勵猜測，促使大型語言模型出現幻覺

OpenAI發現模型亂猜導致幻覺頻繁，建議模型評測應重懲自信錯誤並獎勵合宜不確定，可降低錯誤率提升可靠度

2025-09-09

Google推Vertex AI RAG Engine提升生成式AI應用精確性與可靠性

Google Vertex AI RAG Engine採用RAG技術，藉由整合外部資料，解決生成式人工智慧的幻覺問題，以及資料時效性限制

2025-01-20

| AWS | 生成式AI | 幻覺

AWS推出自動化推理檢查，強化生成式AI安全性與準確性

AWS在Amazon Bedrock Guardrails中新增自動化推理檢查功能，透過數學與邏輯驗證生成式人工智慧回應的準確性，防範幻覺錯誤

2024-12-06

【奇美醫院GAI應用實例】GAI分工走進診間成虛擬照護團隊，靠多層次提示克服幻覺難題

奇美醫院的生成式AI應用分為2大類，一是專門除錯、摘要的HIS Copilot，另一是整合各種資訊來給建議的A+巡房大聯盟，兩者都涵蓋醫師、護理師等多種醫療人員，就像一支虛擬照護團隊。這些GAI之所以落地實用，還在於克服幻覺

2024-11-08

| IT周報 | LLM | 幻覺 | 微軟 | AI認證 | 人才 | 國泰金控 | 生成式AI | AI爬蟲

AI趨勢周報第260期：能偵測又能修正LLM幻覺內容，微軟預覽新功能Correction

微軟預覽一款Azure AI內容安全功能Correction，可偵測、修正LLM幻覺內容；臺灣人工智慧學校年底前開辦工程級AI認證；國泰金控揭露生成式AI技術發展框架；可阻擋AI爬蟲了，Cloudflare釋出免費工具；國泰聯手中信、玉山、新光驗證聯邦學習架構；Meta釋出Llama新模型，開始支援多模態了

2024-09-29

| OpenAI | 過程監督 | AI | 幻覺

OpenAI新訓練方法可避免AI出現幻覺

OpenAI透過一種稱為過程監督的方法，增進了大型語言模型的推理能力，在數學領域有效解決幻覺問題

2023-06-02

iThome 研討會

IT EXPLAINED 數位轉型攻略 VIII

GenAI 加速企業創新落地，更需要全新 IT 戰略

日期: 即日起~01/28

DevOpsDays Taipei 2026 即刻開放徵求講者

DevOpsDays 不只是一場技術研討會，更是一個讓技術知識流動、社群共好的平臺。在技術百鍊成鋼的路上，你的實踐經驗就是最珍貴的寶藏！立即報名成為講者，讓我們一起推動臺灣 DevOps 走得更遠！

日期: 2026 年 6 月 25-26 日（四 - 五）