即便用戶阻擋了第三方追蹤器,但第三方仍有辦法辨識使用者,Mozilla研究指出,只要透過分析使用者的瀏覽歷史紀錄,就能夠透過獨特的網頁瀏覽習慣,辨識出使用者,讓廣告商能夠創建精確的個人資料檔案,向使用者推播精準廣告。即便類似的研究在2012年已經進行過,但到了2020年,隨著技術發展,現在能更精確的追蹤使用者了。

Mozilla的研究人員複製並且擴展2012年的論文〈Why Johnny Can’t Browse in Peace: On the Uniqueness of Web Browsing History Patterns〉,並在2020安全會議Usenix上發表研究成果。在之前的研究中,研究人員預先列出了6,000個網站,並且使用特殊的CSS程式碼,追蹤441,627個不同的受試者,各造訪過這6,000個網站中的哪些網站,並為每個使用者建立一個專有的網站瀏覽歷史紀錄列表。

研究人員發現,其中有97%的用戶,擁有唯一的瀏覽歷史紀錄,而這便可作為用戶指紋,供第三方進行辨識。當研究人員要求這些用戶再次存取測試網站,只要查看使用者在50個網域的瀏覽歷史資料,就能辨識出38%的用戶,擴展分析到500個網域,則能將辨識準確度提高到70%。

Mozilla的研究人員想要檢視,2012年的這篇論文結論是否依然成立,因此在2019年7月開始了另一波新的實驗,有超過52,000名Firefox用戶自願參加,由於這次的瀏覽歷史資料直接從Firefox收集而來,比起過去的CSS方法更加可靠,而且研究人員收集的這些資料,與線上廣告、行動應用程式和資料分析廠商收集的資料大致相同,也就是說,當Mozilla研究人員如果能夠從這些資料辨識出使用者,則顯然第三方也可以。

實驗總共進行了兩個星期,受試者會先於第一個星期,向Mozilla分享瀏覽歷史紀錄,並會在第二個星期,再次與Mozilla共享資料,研究人員將嘗試依據第一星期的資料,辨識出用戶。根據兩周收集來的資料,研究人員收集了約66萬個不同的網域瀏覽資料,共有3,500萬次的網站存取資料,發現這超過52,000名的Firefox受試者,其中有48,919名具有唯一的瀏覽配置資料,也就是有99%是唯一的。

而且即便只追蹤前100名的網站,試用者的瀏覽模式仍然維持高度的唯一性,研究人員發現,只要用戶在資料收集期間,曾拜訪過50個或以上唯一網域的網站,光追蹤前1萬個網站,就約可以辨識出50%的使用者,當使用者瀏覽過越多網站,辨識度就越高,當用戶瀏覽超過150個不同的網站,則研究人員可以辨識出80%的使用者。研究人員警告,無數的第三方已經透過收集用戶的瀏覽歷史資料,將其作為唯一辨識指紋來識別使用者。


熱門新聞

Advertisement