麻省理工學院(MIT)、微軟及Adobe研究人員共同開發出一項「視覺麥克風」(Visual Microphone)技術,能夠透過周邊物體影像的細微震動判讀出人聲對話,這項技術的應用可能讓你身邊舉凡水杯、植物、洋芋片都變成竊聽器。

這項技術的原理是根據聲音撞擊到物體後會在物體表面產生微小震動的特性,研究人員利用高速攝影機拍攝出肉眼無法辨識出的這些細微振動,並發展出演算法來分析,並憑藉語音的可理解性(intelligibility)及信噪比(SNR)等指標值,來重建與辨識物體周遭的聲音。

研究人員實驗不同等級的攝影機及不同材質的物體以重建聲音的效果。在一項實驗中,研究人員利用速度超過音訊頻率的高速攝影機(每秒2000 至6000格)從15呎以外隔著隔音玻璃拍攝的洋芋片包裝袋影片重建出一小段可理解的人聲講話。研究人員也成功從一杯水、一片鋁箔,和一株盆景影片中,找出有用的音訊。研究人員表示,即使利用一般消費型攝影機拍攝每秒60格的正常速度影片,如果有足夠的輔助資訊,也能辨識出講話者的性別及房間內的人數等。

研究小組預計於8月中舉行的SIGGRAPH 2014大會上展示這項技術。研究人員表示,這項技術可使一杯水、一棵植物、一盒衛生紙、或一包洋芋片等日常用品都可變成「視覺麥克風」。

雖然用影片重建聲音的技術頗為神奇,未來可望成為警發辦案的有利工具,不過也有媒體擔心,這項技術一旦成熟,可能變成防不勝防的監聽工具。(編譯/林妍溱)

 

熱門新聞

Advertisement