圖片來源: 

Reddit

Reddit才在2025年6月控告Anthropic未經授權使用該平臺的內容來訓練AI模型,本周轉而控告Perplexity AI,以及其它3家資料擷取公司SerpApi、Oxylabs UAB與AWMProxy,指控它們大規模地以不當的方式爬梳Reddit上的內容。而這次Perplexity AI也不甘示弱地透過Reddit平臺喊冤。

Reddit宣稱,Perplexity  AI,以及美國的SerpApi、立陶宛的Oxylabs UAB與俄羅斯的AWMProxy等資料擷取公司,以工業規模及非法的方式從Reddit抓取使用者貼文與評論,並用於商業用途,特別是訓練或支援AI搜尋/回答系統。其中,SerpApi、Oxylabs UAB及AWMProxy偽裝身分、隱藏位置,假冒是真人用戶來繞過Reddit的技術防護措施,甚至是透過Google搜尋結果頁來抓取Reddit資料。

此外,Reddit亦指控Perplexity AI至少為上述其中一家的客戶,購買其資料來建構其答案引擎。Reddit要求法院禁止被告使用或販售自Reddit爬梳的資料,終止相關行為並要求損害賠償。

迄今Reddit已與OpenAI、Google及Sprinklr等AI業者達成內容合作協議,但Perplexity AI一直未與Reddit簽署授權合約。

不過,同一天Perplexity AI就透過Reddit平臺反擊,指出當公共資料成為上市公司商業模式的一部分時,它們便預見了今日的慘況。出售訓練資料使用權已成為Reddit日益重要的收入來源,猜測Reddit的提告是為了在與Google及OpenAI的內容授權談判中展現實力。

Perplexity AI澄清,該公司並沒有不理會Reddit提出的授權問題,而是向對方解釋,Perplexity AI是家應用層公司,不會利用內容來訓練模型,也從來沒有利用內容來訓練模型,因此不可能簽署授權協議。然而,就算聽了解釋,Reddit依然堅持Perplexity AI應付費。

Perplexity AI的答案搜尋引擎主要功能為搜尋網路、識別可靠來源,並將資訊整合成清晰與最新的答案,並集中呈現使用者所需的見解。該公司表示,它們使用Reddit內容的方式是總結了Reddit的討論,並在答案中引用了Reddit上的討論串,然而,Reddit本周改變了心意,不再允許Perplexity用戶在學習過程中找到Reddit上的公開內容,儘管Reddit認為這是它們的權利,但這與開放網路背道而馳。

不過,目前Reddit有超過9成的營收還是來自廣告。根據該公司今年第二季財報,該季進帳5億美元,成長78%,當中光是廣告營收就占了4.65億美元,包含授權在內的其它營收只占了3,500萬美元。該季Reddit的每股盈餘為0.48美元。

熱門新聞

Advertisement