圖片來源: 

Ali Emre Uzun on unsplash

來自英國3所大學的3名研究人員Joshua Harrison、Ehsan Toreini與Maryam Mehrnezhad近日發表了一篇研究報告,指出他們以使用者打擊鍵盤的聲音所開發的機器學習模型,可以準確地判斷使用者輸入的文字,若是以放在筆電旁的手機進行側錄以訓練模型,準確率高達95%,利用通訊軟體進行遠端攻擊也有超過90%的準確率。

研究人員先是蒐集了筆電上36個按鍵的聲音,包括26個英文字與10個阿拉伯數字,每個按鍵都以不同的手指或壓力按了25次,之後把這些聲波視覺化,強化每個鍵擊的差異,產生梅爾頻譜,再以它們來訓練既有的影像分類模型CoAtNet,隨後即可利用CoAtNet來判斷使用者所輸入的文字。

蒐集鍵擊聲的方式不同,準確率就不同。其中一項實驗是把一支iPhone 3 mini放在一臺蘋果M1 Pro版的MacBook Pro旁邊約17公分處,以蒐集打擊MacBook Pro鍵盤的聲音,所訓練出來的模型可達95%的準確率。

研究人員還實驗了Zoom與Skype,他們藉由遠端會議來蒐集目標對象的鍵擊資料,再以這些資料來訓練模型,透過Zoom側錄的準確率有93%,透過Skype也有91.7%。

這類的旁路攻擊主要是可獲得受害者所輸入的密碼,卻也不難破解,只要變更打字風格,模型的準確度就會降低,而且對於那些可以不看鍵盤就打字的使用者來說,辨識也較難,另一個防禦方法則是採用隨機密碼。

熱門新聞

Advertisement