Photo by Solen Feyissa on Unsplash

《紐約時報》(The New York Times)上周引述消息來源報導,OpenAI與Google都利用YouTube的影片內容來訓練AI模型,儘管此舉可能違反YouTube服務條款,但在業者急需大規模內容來訓練AI模型之際,皆選擇遊走於灰色地帶。

根據YouTube服務條款,它允許使用者存取、散布或播放YouTube內容,但並不允許使用者於YouTube平臺之外使用其內容。

報導指出,當時OpenAI迫切需要更多的資料來開發GPT-4,內部所討論的來源從播客、有聲書到YouTube不等,還考慮買下那些蒐集大量數位資料的新創公司,隨後OpenAI打造了一款語音辨識系統Whisper,最終轉錄了超過100萬小時的YouTube影片,把它們變成文本來訓練GPT-4 。

紐時亦引用消息來源指出,有些Google員工即使知道OpenAI使用YouTube內容來訓練它們的AI,卻未加以阻止,因為Google自己也這樣做。不過,Google發言人向該報表示,Google並不知道OpenAI做了什麼,而且Google禁止未經授權抓取或下載YouTube內容。

熱門新聞

Advertisement