背景圖片取自/Mimicry Hu on Unsplash

大英百科全書(Encyclopedia Britannica)出版商Britannica及旗下字典編輯商Merriam-Webster公司本周控告OpenAI、OpenAI控股公司等相關組織運用其內容來訓練模型、核對事實,以及提供給終端用戶,已侵害其版權,而且還生成錯誤內容破壞其名譽。

Britannica擁有10萬篇線上文章及紙本新大英百科全書的版權。而其下Merriam-Webster公司則以出版Merriam-Webster字典聞名。

兩公司先指出,OpenAI的ChatGPT剝奪了像大英百科等仰賴點擊流量及使用者訂閱的營收,並與兩公司直接競爭,影響其生計。他們也指控OpenAI的模型和ChatGPT的服務模式,從4個層面濫用其內容,侵害其版權。

首先,一如多家媒體或出版商,兩公司指控OpenAI涉及大量複製其版權內容來訓練其大語言模型LLM。其次,這家AI業者為了確保生成的內容符合事實,乃運用其內容檢索增強生成(retrieval-augmented generation,RAG)系統檢索、複製其版內容,來補足LLM模型的既有知識。第三,OpenAI LLM生成的內容,透過ChatGPT輸出給終端用戶。然而ChatGPT輸出的內容包含完整或部份取自大英百科的版權內容、或以其摘要,或是類似文字。

除了大量複製內容外,二家出版商還指控,OpenAI LLM基於模型幻覺生成的錯誤內容,也被OpenAI歸咎到大英百科或是Merriam-Webster字典造成用戶混淆也破壞公司名譽。而且ChatGPT在指向文章來源時,刻意遺漏或不正確展示兩公司的商標,這做法也違反了版權法。

兩家公司在去年9月也對Perplexity提出類似控告,目前也在審理中。

大英百科是最新一家控告OpenAI的出版商。在此之前,包括紐約時報、Ziff Davis(旗下有PC Mag、CNET、Mashable、ÍGN等)、芝加哥論壇報加拿大廣播公司及加國數家媒體等。

熱門新聞

Advertisement