馬里蘭大學電腦科學系教授Jen Golbeck解釋,按照班佛定律(Benford's Law),以1為首位數字的出現機率,約30%,隨著數字越大,出現的機率則越小。這個方法,能有效在社群媒體上,揪出專門灌水讚數或轉推文章的假帳號機器人。(圖片來源/Jen Golbeck)

網路技術帶動社群媒體發展,讓大眾更快速與親友分享生活點滴,甚至用來打造個人品牌。但社群媒體的興盛,卻也產生假帳號買賣,專門替特定帳號衝讚數,或是投票灌水、分享特定貼文等。美國馬里蘭大學電腦科學系教授Jen Golbeck在今年大會中,分享自己如何以40年前的老方法,來揪出臉書、Twitter上的衝讚機器人。

Jen Golbeck指出,衝讚數的假帳號機器人因使用者需求而存在,讚數多,就越能放大自己的影響力。就市場行情來說,美金1元就能買到50至100個讚,便宜的價格更導致假帳號的猖獗。

也因此,各大社群平臺利用不同方法,來打擊假帳號。比如根據使用者特徵、好友數、活動時間、貼文內容和語句情感等特徵,訓練一套系統,來自動判斷帳號真偽。

採用40年班佛定律,從好友數、追蹤人數看出端倪

但Jen Golbeck認為:「還有一個更簡單的方法,能找出假帳號,」也就是班佛定律(Benford's Law)。班佛定律40年前興起,是指在日常生活的數據中,數字1到9出現的機率,以1最大,且隨著數字增長,出現機率遞減。

舉例來說,以1為首位數字的出現機率,約為30%,以9為首位數字的機率,則是4.6%。

於是,Jen Golbeck利用這個方法,從Twitter、臉書、Pinterest、Google Plus和LiveJournal等社群平臺中,找出帳號好友數和追蹤人數等數值分布,來核對是否符合班佛定律。

自掏腰包買轉推數,從中揪出俄羅斯假帳號軍團

為衡量班佛定律的符合程度,她採用卡方檢驗(Chi-square test)來檢測P值;如果P值小於0.05,就表示不符合班佛定律。

為展開研究,她自掏腰包,購買臉書和Twitter的讚數與轉推數,來轉推或按讚自己的貼文。她解釋,她先利用新設的帳號,發出無意義的貼文,比如只有一個數字,然後用買來的服務,來轉推或按讚這些貼文。

接著,她觀察,這些轉推或按讚的貼文中,有哪些陌生帳號也轉推或按讚。然後,她再分析這些陌生帳號及其追蹤者,來確認真偽。

在研究中,Jen Golbeck處理了數萬個帳號,「不出所料,幾乎所有帳號都符合班佛定律,只有100多個有問題。」

於是,她深入調查這100多個帳號,發現「除了1個是真人外,其餘都是一模一樣的俄羅斯機器人假帳號。」這些帳號隨機推文,內容不是從操作手冊節錄的句子,就是小說段落,「顯然由同一個演算法來控制。」

隨著進一步的調查,Jen Golbeck也發現,這些機器人,是一支俄羅斯假帳號軍團的一部分。她也在後來的幾年間,觀察這些機器人的行為。驚訝的是,這些行為模型並未改變。

「也許,這些機器人長期進行這些隨機、模擬人類的行為,是要讓自己的存在更合理,不被糾察系統抓到。」她推測,等到時機成熟時,其中幾個機器人帳號,也許會進行灌水、衝讚等行為。

而最好的解法,莫過於找出機器難以控制的行為特徵,來辨識帳號真實身分。


Advertisement

更多 iThome相關內容