Reddit控告Perplexity AI與3家資料爬梳公司

圖片來源:

Reddit才在2025年6月控告Anthropic未經授權使用該平臺的內容來訓練AI模型，本周轉而控告Perplexity AI，以及其它3家資料擷取公司SerpApi、Oxylabs UAB與AWMProxy，指控它們大規模地以不當的方式爬梳Reddit上的內容。而這次Perplexity AI也不甘示弱地透過Reddit平臺喊冤。

Reddit宣稱，Perplexity  AI，以及美國的SerpApi、立陶宛的Oxylabs UAB與俄羅斯的AWMProxy等資料擷取公司，以工業規模及非法的方式從Reddit抓取使用者貼文與評論，並用於商業用途，特別是訓練或支援AI搜尋/回答系統。其中，SerpApi、Oxylabs UAB及AWMProxy偽裝身分、隱藏位置，假冒是真人用戶來繞過Reddit的技術防護措施，甚至是透過Google搜尋結果頁來抓取Reddit資料。

此外，Reddit亦指控Perplexity AI至少為上述其中一家的客戶，購買其資料來建構其答案引擎。Reddit要求法院禁止被告使用或販售自Reddit爬梳的資料，終止相關行為並要求損害賠償。

迄今Reddit已與OpenAI、Google及Sprinklr等AI業者達成內容合作協議，但Perplexity AI一直未與Reddit簽署授權合約。

不過，同一天Perplexity AI就透過Reddit平臺反擊，指出當公共資料成為上市公司商業模式的一部分時，它們便預見了今日的慘況。出售訓練資料使用權已成為Reddit日益重要的收入來源，猜測Reddit的提告是為了在與Google及OpenAI的內容授權談判中展現實力。

Perplexity AI澄清，該公司並沒有不理會Reddit提出的授權問題，而是向對方解釋，Perplexity AI是家應用層公司，不會利用內容來訓練模型，也從來沒有利用內容來訓練模型，因此不可能簽署授權協議。然而，就算聽了解釋，Reddit依然堅持Perplexity AI應付費。

Perplexity AI的答案搜尋引擎主要功能為搜尋網路、識別可靠來源，並將資訊整合成清晰與最新的答案，並集中呈現使用者所需的見解。該公司表示，它們使用Reddit內容的方式是總結了Reddit的討論，並在答案中引用了Reddit上的討論串，然而，Reddit本周改變了心意，不再允許Perplexity用戶在學習過程中找到Reddit上的公開內容，儘管Reddit認為這是它們的權利，但這與開放網路背道而馳。

不過，目前Reddit有超過9成的營收還是來自廣告。根據該公司今年第二季財報，該季進帳5億美元，成長78%，當中光是廣告營收就占了4.65億美元，包含授權在內的其它營收只占了3,500萬美元。該季Reddit的每股盈餘為0.48美元。

熱門新聞