為了要打擊惡意改圖,臉書現在釋出圖像相似性(Image Similarity)資料集,提供用於偵測線上有害圖像變造的基準。圖像相似性資料集含有超過100萬張的圖像,其中有5萬張是由臉書所提供的查詢圖像。另外,臉書還舉辦了挑戰賽,以20萬美元的獎勵,廣邀研究人員來比賽,切磋偵測圖片變造的能力。

社交媒體上的錯誤訊息以及平臺遭到濫用的情況,使得不少相關團體著手提出解決方案,除了事實查核之外,還積極打擊偽造圖像,包括發展深度偽造(DeepFake)、惡意迷因偵測等技術,而臉書提到,最佳的解決方案,必須要與社群合作,因此他們集結眾人之力,創建了目前已知最大的圖像相似性資料集,內含包括由人或是自動編輯的圖像。

雖然大多數的用戶,都是出於良性或是娛樂的目的後製圖像,不過卻有部分惡意人士,透過變造圖像來傳播錯誤、暴力和仇恨訊息,而這可能使其他人受到傷害。

社交媒體運用內容追蹤和圖像相似性來阻擋,可能對社會產生負面影響的圖像或是影片傳播,透過結合人工和自動偵測工具,希望盡早發現裸露、暴力和已知錯誤的訊息,但是人工審查並無法大規模處理圖像,因此提高機器學習模型的辨識能力,才能夠有效改善這樣的問題。

圖像相似性指的是從大量不相關的圖像,找出遭到變造的圖像來源,這個技術並非是全新的概念,早被用於內容審查領域,諸如錯誤訊息、侵犯版權和詐騙等。圖像相似性檢測,是一種視覺內容追蹤方法,臉書提到,圖像相似性檢測的發展並未受到重視,針對像是分類或物體辨識等,針對其他視覺任務發展的模型,並無法在圖像相似性偵測上良好作用,而且缺乏大型標準化資料來源,無法測量圖像相似性演算法的效能,也阻礙了相關研究。

因此經過變造的圖片,通常能夠避開不夠強大的自動圖像檢測系統。為了要改進偵測系統的能力,臉書創建了Image Similarity資料集,希望讓基於機器學習技術的系統,能夠透過強化預測視覺內容相似性,使得線上服務可以大規模偵測遭到變造的圖像。

圖像相似性資料集能夠作為相似檢測的基準,其包含100萬張的圖像,和5萬張由人工與非人工編輯轉換的查詢圖像。為了避免這個資料集被惡意人士濫用,臉書將會先開放給同意資料集限制條款的挑戰賽參與者存取,在挑戰賽之後,臉書就會開放資料集,其他研究人員也只要同意使用條款,就可拿來研究使用。


熱門新聞

Advertisement