圖片來源: 

CSAIL

麻省理工學院(MIT)電腦科學暨人工智慧實驗室(Computer Science and Artificial Intelligence Lab,CSAIL)與卡塔爾計算研究所(Qatar Computing Research Institute,QCRI)正在打造一基於機器學習AI系統,能夠根據新聞的來源來辨識假新聞,目前在偵測事實可靠性上有65%的準確度,對於政治傾向的判斷則有70%的準確度,將可搭配事實查核網站使用,以減少假新聞流竄的時間。

科學家表示,近來的事實查核世界已產生了危機,諸如Politifact或Snopes等網站都是針對某一主題進行查核,只不過,當他們查明或揭穿事實時,這些假新聞或謠言可能已經繞了地球一圈。

於是CSAIL及QCRI認為最好的作法是不只專注於個別新聞的查證,還必須注重新聞來源,使得他們決定打造一個機器學習系統,可用來快速判斷新聞來源是否可靠或者帶有政治上的偏見。

該研究的主要作者Ramy Baly表示,如果一個網站曾出版過假新聞,那它很有可能會再犯,該系統可自動抓取這些網站的數據,並在第一時間察覺,而且只需要150篇文章來判斷新聞來源的可靠度,之後即可在假新聞被廣泛散布前就逮住它。

這群科學家先取用了來自Media Bias/Fact Check (MBFC)的數據,這是一個集結人類事實查核員的網站,已分析超過2,000個新聞網站的可靠度,從知名的MSNBC到內容農場,並把這些數據匯入機器學習演算法,以建立同樣的分類模式。

該系統還會檢查新聞出處的維基百科頁面來評估新聞來源的可靠程度,例如若維基百科的內容愈豐富,那麼該站就相對可靠,假設出現了「極端」或「陰謀論」等文字,代表它可能有所偏頗。

當把一個新聞出處輸入該系統時,在辨識該出處的新聞真實性(高、中、低)時已有65%的準確度,判斷它是左派、右派或中立立場的準確度則有70%。該研究的共同作者Preslav Nakov表示,目前此一系統還不夠完善,在準確度上仍需加強,最好的方式是與傳統的事實查核機制一起運作。

科學家們也已建立一個內含1,000個新聞來源的開源資料集,並加註了這些新聞來源的真實性及偏見分數,下一步將嘗試把以英文訓練的系統轉為其它語言,也會新增諸如宗教等政治以外的偏見指數。


Advertisement

更多 iThome相關內容