臉書更新了社群標準執行報告,其中揭露了臉書在2020年第4季,打擊騷擾與仇恨言論的成效,仇恨言論的普及率從0.10-0.11%下降至0.07-0.08%,也就是說,每1萬次的內容觀看,僅會有7到8次仇恨言論,暴力內容也從0.07%降至0.05%,成人裸露內容從原本的0.05-0.06%下降到0.03-0.04%。

臉書的技術長Mike Schroepfer提到,在2020年的第4季,臉書主動偵測仇恨言論、霸凌和騷擾內容的成果,比以往都還要好,而要在3年間有這樣的技術進展是很少見的。在2017年末的時候,臉書下架仇恨言論的比例只有24%,而2019年末,則上升到了80.5%,在2020年第3季來到了94%,而在最新的第4季,自動偵測系統已經可以發現97%的仇恨言論。

臉書以人工智慧來偵測用戶的仇恨言論,但有心人士也竭盡所能地規避偵測,而臉書現在可以更全面地偵測平臺上違反政策的內容,Mike Schroepfer舉例,「這是一個好消息」這句話出現在小孩出生貼文底下的回覆,便是正面的意思,但是當出現在有親人過世的貼文底下,則意義完全相反,因此偵測評論是否違反政策,還需要考量整體貼文的背景。

臉書持續改進人工智慧技術,更深入了解語言,並且對貼文的圖像、文字和其他細節進行組合分析,進而建構出一個擅長分析評論,並且能不斷從新資料學習的系統。而這樣的改進,大幅增進了臉書偵測霸凌和騷擾文字的能力,發現率從2020年第1季的16%,到第4季已經提高到49%,這代表在使用者發現且送出舉報之前,系統就先偵測到並且主動刪除這些內容。

而且臉書的人工智慧工具也支援更多種語言,使其可以偵測西班牙語和阿拉伯語等違反政策的內容,仇恨語音內容偵測能力因而也大幅提升,從第3季的2,210萬筆,上升至2,690萬筆。

臉書的社群標準執行報告,也包含了年輕人常用的Instagram,由於技術的進步,第4季總共刪除了500萬筆霸凌和騷擾內容,比第3季的260萬條幾乎多上一倍,同時也移除了超過30萬筆有組織的仇恨言論,在整體的仇恨言論偵測上,達到660萬筆,高於第3季的650萬筆。

Mike Schroepfer表示,雖然有了這些進展,但是仍有許多工作要進行,因為相同的單詞可以被解釋成不同的意思,而這取決於發布的位置和閱讀者,他們希望讓人工智慧可以更好地跨語言、文化和地域等背景偵測話語,訓練機器區分語言意義細微的差異。


熱門新聞

Advertisement