情境示意圖。photo by chuttersnap on unsplash(https://unsplash.com/photos/gDDas5_ALRw)

電腦視覺暨隱私研究人員Adam Harvey最近揭露,微軟、杜克大學及史丹佛大學已悄悄地撤下了原本採用了創用CC(Creative Commons)授權的人臉辨識資料庫

其中,微軟在2016年上傳的MS Celeb號稱是全球最大的公開人臉辨識資料庫,存放了820萬張人臉照片;杜克大學的Duke MTMC則存放200萬張人臉;史丹佛大學的Brainwash則有約1.2萬張的人臉照片。

外界猜測這些組織的舉動金融時報在今年4月刊出的一篇報導有關。當時Harvey在一個人臉辨識的資料庫中發現了朋友Jillian York的照片,York在電子前線基金會(Electronic Frontier Foundation,EFF)任職,而Harvey則是在美國政府研究組織Iarpa旗下的人臉辨識專案Janus中看到York的多張照片,包括York在不同時期所拍攝的照片,以及在YouTube影片中的人臉鏡頭。

York說她並不知道自己的照片被收藏了,而且連10年前的照片都有。

Harvey的分析則發現,此一委外建置的Janus人臉辨識資料庫蒐集了逾2萬張的人臉,平均每個人具備6張照片及3張從影片中擷取的照片,並採用CC授權,除了York之外,資料庫中至少還有3名EFF董事會成員、1名記者、1名科技作家及3名中東政治家,不過,沒有一個人曾被徵求同意,他們都不知道自己的照片被納入人臉資料庫了。

CC授權為一網路版權協議,代表這些資料庫可被複製或使用,且同時支援學術與商業使用,等於是任何人都可存取。而不管是MS Celeb、Duke MTMC、Brainwash或Janus都可被用來訓練各種人臉辨識模型。

不只是Janus專門蒐集名人的臉部資料,微軟的MS Celeb也是。

微軟並未承認MS Celeb是因為該篇報導而被撤下,只表示那是個基於學術目的的網站,而原本負責的員工離職了,於是微軟便刪除了該資料庫。

不過,就算這些人臉資料庫已被下架,但它們也許還躺在全球研究人員的硬碟裡,或者有朝一日仍然會在網路上曝光。


Advertisement

更多 iThome相關內容