紐時披露OpenAI與Google都利用YouTube內容來訓練AI模型 | iThome

文/陳曉莉|2024-04-08發表

Photo by Solen Feyissa on Unsplash

《紐約時報》（The New York Times）上周引述消息來源報導，OpenAI與Google都利用YouTube的影片內容來訓練AI模型，儘管此舉可能違反YouTube服務條款，但在業者急需大規模內容來訓練AI模型之際，皆選擇遊走於灰色地帶。

根據YouTube服務條款，它允許使用者存取、散布或播放YouTube內容，但並不允許使用者於YouTube平臺之外使用其內容。

報導指出，當時OpenAI迫切需要更多的資料來開發GPT-4，內部所討論的來源從播客、有聲書到YouTube不等，還考慮買下那些蒐集大量數位資料的新創公司，隨後OpenAI打造了一款語音辨識系統Whisper，最終轉錄了超過100萬小時的YouTube影片，把它們變成文本來訓練GPT-4 。

紐時亦引用消息來源指出，有些Google員工即使知道OpenAI使用YouTube內容來訓練它們的AI，卻未加以阻止，因為Google自己也這樣做。不過，Google發言人向該報表示，Google並不知道OpenAI做了什麼，而且Google禁止未經授權抓取或下載YouTube內容。

熱門新聞

OpenAI推出GPT-5.4，強化專業能力並首度支援AI操作電腦

2026-03-06

美伊衝突期間，AWS中東資料中心因外部撞擊事故導致服務中斷

2026-03-02

駭客利用檔案管理員Windows File Explorer和WebDAV散布惡意程式

2026-03-02

【資安週報】0223~0226，AI自動化漏洞掃描將趨於普及，Anthropic推出Claude Code Security

2026-03-02

鴻海釋出未來5年永續發展藍圖，燈塔工廠要增加1倍

2026-03-04

Google抓Antigravity濫用誤鎖Gemini CLI用戶，新增再認證解封流程

2026-03-02

OpenClaw存在資安漏洞ClawJacked，攻擊者恐透過WebSocket連線挾持

2026-03-02

趨勢科技修補端點防護平臺Apex One重大漏洞，攻擊者恐用於發動RCE攻擊

2026-03-03

Advertisement