臉書在研究院的官方部落格中公開這項偵測假帳號的研究成果,能在新帳號發出少數交友請求時,辨別是否為假帳號。

隨著網路科技的發展,社交網站已成為許多人每天生活中的日常,臉書更是很多人每天都會使用的社交網路平臺,這個全球最大的社交網路平臺,每日用戶已超過15億,然而,為了維護社交平臺不被濫用,光是2018年第一季臉書就關閉了5.83億個假帳號,過了一年,關閉的假帳號數量高達將近22億個。

大量的假帳號如何攔截?臉書內部自有一套做法,包括透過各種偵測系統,封鎖來自特定IP位置的帳號申請要求,事先防堵假帳號,其次是偵測假帳號的異常行為,在帳號剛建立初期就予以移除,或是將可疑的帳號列為觀察名單,其他用戶檢舉惡意行為再移除。

近期,臉書在今年在臺舉行的Web Conference 2020分享了防堵假帳號的新方法,這是由哈佛博士生Adam Breuer和兩名臉書資料科學團隊成員Roee Eilat 和Udi Weinsberg 共同完成,臉書也將其成果在臉書研究院的官網上發表。

該團隊提到,假帳號建立有三個階段,首先是建立假帳號,接下來發送交友請求,以擴展社交網路連結,當達到一定規模後開始濫用的行為,例如大量的發送垃圾或惡意訊息。

不過,要偵測新建立的假帳號有困難,主要是因為這些帳號在建立的初期,發出的交友連結並不多,難以被查覺異常。

他們發現,假帳號和真實用戶兩者在發送交友請求上有很大的不同,假帳號發出的交友請求,遭拒絕的比率,高於真實用戶被拒絕的比率,這代表了人們有警覺性,傾向接受他們熟悉的(認識的人發出的請求),拒絕那些他們不熟悉(假帳號的請求)。但這非絕對,實際上,真實的用戶也可能被拒絕,而假帳號也可能被接受。

如果一位用戶傾向接受真實用戶的交友請求,當他接受了一個交友請求,那麼發出請求的帳號可能是真實的用戶,相反的,如果交友請求被拒絕,那麼發出請求的帳號是假的可能性就會增加。即使用戶傾向接受假帳號的交友請求,當他接受交友請求,發出請求的帳號是假帳號的可能性也會增加。

他們也從數據上發現,假帳號為了提高被接受的可能性,會謹慎的挑選發出交友請求的目標。因此從新建立帳號(可能為真實用戶或假帳號)發出交友請求的目標對象,以及他們的反應(接受或拒絕請求),作為判斷新帳號為真實或假帳號的可能性。

基於這個概念,臉書研究團隊提出一個新演算法SybilEdge,用以在假帳號建立的初期偵測出來,避免這些假帳號濫用社交網路服務。研究將新帳號定義為7天內建立,或是發出的交友請求在50個以內。

SybilEdge分兩階段,首先,以某段時期的資料,加上內容及行為分類器對實際濫用行為的結果,去訓練模型,這個階段提供訓練模型所需要的參數,接下來,實際對每個交友請求和反應(接受或拒絕)執行模型,更新對新帳號判斷為假帳號的可能性。

相較於傳統的假帳號偵測方法,多以可疑帳號的行為作為判斷,SybilEdge重視新帳號發出交友請求的目標用戶,演算法會特別增加目標用戶的權重,包括目標用戶受其他用戶(假帳號或真實帳號)的偏好程度,目標用戶收到交友請求後的反應(接受或拒絕),此外,當確信目標用戶能夠判斷帳號的真偽時,給予信賴權重。

研究團隊以AUC(AUC=1為完全的分類器,若AUC=0.5則代表隨機性質的分類器)衡量和SybilSCAR、SybilRank、SybilBelief等模型的表現,結果顯示SybilEdge的表現優於其他相關模型,在新帳號發出15個交友請求時,SybilEdge的AUC大於0.9。


Advertisement

更多 iThome相關內容