臉書強化AI技術，大幅提升騷擾與仇恨言論偵測效果

臉書更新了社群標準執行報告，其中揭露了臉書在2020年第4季，打擊騷擾與仇恨言論的成效，仇恨言論的普及率從0.10-0.11％下降至0.07-0.08％，也就是說，每1萬次的內容觀看，僅會有7到8次仇恨言論，暴力內容也從0.07％降至0.05％，成人裸露內容從原本的0.05-0.06％下降到0.03-0.04％。

臉書的技術長Mike Schroepfer提到，在2020年的第4季，臉書主動偵測仇恨言論、霸凌和騷擾內容的成果，比以往都還要好，而要在3年間有這樣的技術進展是很少見的。在2017年末的時候，臉書下架仇恨言論的比例只有24％，而2019年末，則上升到了80.5％，在2020年第3季來到了94％，而在最新的第4季，自動偵測系統已經可以發現97％的仇恨言論。

臉書以人工智慧來偵測用戶的仇恨言論，但有心人士也竭盡所能地規避偵測，而臉書現在可以更全面地偵測平臺上違反政策的內容，Mike Schroepfer舉例，「這是一個好消息」這句話出現在小孩出生貼文底下的回覆，便是正面的意思，但是當出現在有親人過世的貼文底下，則意義完全相反，因此偵測評論是否違反政策，還需要考量整體貼文的背景。

臉書持續改進人工智慧技術，更深入了解語言，並且對貼文的圖像、文字和其他細節進行組合分析，進而建構出一個擅長分析評論，並且能不斷從新資料學習的系統。而這樣的改進，大幅增進了臉書偵測霸凌和騷擾文字的能力，發現率從2020年第1季的16％，到第4季已經提高到49％，這代表在使用者發現且送出舉報之前，系統就先偵測到並且主動刪除這些內容。

而且臉書的人工智慧工具也支援更多種語言，使其可以偵測西班牙語和阿拉伯語等違反政策的內容，仇恨語音內容偵測能力因而也大幅提升，從第3季的2,210萬筆，上升至2,690萬筆。

臉書的社群標準執行報告，也包含了年輕人常用的Instagram，由於技術的進步，第4季總共刪除了500萬筆霸凌和騷擾內容，比第3季的260萬條幾乎多上一倍，同時也移除了超過30萬筆有組織的仇恨言論，在整體的仇恨言論偵測上，達到660萬筆，高於第3季的650萬筆。

Mike Schroepfer表示，雖然有了這些進展，但是仍有許多工作要進行，因為相同的單詞可以被解釋成不同的意思，而這取決於發布的位置和閱讀者，他們希望讓人工智慧可以更好地跨語言、文化和地域等背景偵測話語，訓練機器區分語言意義細微的差異。

熱門新聞