大英百科、Merriam-Webster控告OpenAI侵權

大英百科全書（Encyclopedia Britannica）出版商Britannica及旗下字典編輯商Merriam-Webster公司本周控告OpenAI、OpenAI控股公司等相關組織運用其內容來訓練模型、核對事實，以及提供給終端用戶，已侵害其版權，而且還生成錯誤內容破壞其名譽。

Britannica擁有10萬篇線上文章及紙本新大英百科全書的版權。而其下Merriam-Webster公司則以出版Merriam-Webster字典聞名。

兩公司先指出，OpenAI的ChatGPT剝奪了像大英百科等仰賴點擊流量及使用者訂閱的營收，並與兩公司直接競爭，影響其生計。他們也指控OpenAI的模型和ChatGPT的服務模式，從4個層面濫用其內容，侵害其版權。

首先，一如多家媒體或出版商，兩公司指控OpenAI涉及大量複製其版權內容來訓練其大語言模型LLM。其次，這家AI業者為了確保生成的內容符合事實，乃運用其內容檢索增強生成（retrieval-augmented generation，RAG）系統檢索、複製其版內容，來補足LLM模型的既有知識。第三，OpenAI LLM生成的內容，透過ChatGPT輸出給終端用戶。然而ChatGPT輸出的內容包含完整或部份取自大英百科的版權內容、或以其摘要，或是類似文字。

除了大量複製內容外，二家出版商還指控，OpenAI LLM基於模型幻覺生成的錯誤內容，也被OpenAI歸咎到大英百科或是Merriam-Webster字典造成用戶混淆也破壞公司名譽。而且ChatGPT在指向文章來源時，刻意遺漏或不正確展示兩公司的商標，這做法也違反了版權法。

兩家公司在去年9月也對Perplexity提出類似控告，目前也在審理中。

大英百科是最新一家控告OpenAI的出版商。在此之前，包括紐約時報、Ziff Davis（旗下有PC Mag、CNET、Mashable、ÍGN等）、芝加哥論壇報、加拿大廣播公司及加國數家媒體等。

熱門新聞