年初時,中華電信研究院已將自家人臉辨識引擎,先用來管理總公司內部數百名委外清潔員工的上班出勤,現在每位人員上下班,都會先通過一臺刷臉打卡機來進行簽到或是刷退,以取代傳統上下班打卡。(攝影/洪政偉)

十年研發,蒐羅全球百萬張人臉照片訓練的臉部辨識引擎,遇上自家員工的臉,竟然出了狀況。去年10月,中華電信研究院信心滿滿地展開了一項實測計畫,在實驗室測試辨識度高達99%的臉部辨識引擎,卻在辨識員工人臉時,效果大打折扣,常常會認不出來。

用了全球人臉公開資料庫訓練,準確率有世界級水準的自製臉部辨識技術,實測為何失準?他們靈機一動,改換用在地人臉,僅增加數千張亞洲臉孔,在辨識人臉時就有了近1成的提升,甚至還比原先百萬張國外人臉訓練的模型辨識效果更好,大大改善了原有臺灣人臉辨識度的不足。該院巨量資料研究所所長汪世昌說:「這正是人臉辨識要在臺灣落地的應用關鍵,只有用臺灣人臉資料,才能打造出最符合在地化使用的人臉應用。」

引進當紅的深度學習技術,1年內就讓人臉辨識準度明顯提升

負責中華電信自主技術研發的中華電信研究院,從事AI影像辨識研發長達10多年之久,約2008年左右開始投入人臉辨識技術開發,不過一開始,僅以傳統機器學習技術(如LBP)來進行人臉模型訓練時,辨識度最高僅有8成,難以達到商用的水準,直到2年前,引進當紅的深度學習技術後,短短1年內,就讓自家人臉辨識準確度有了大幅度提升。

汪世昌指出,深度學習技術的出現,解決傳統演算法的諸多瓶頸,像是對於表情、年齡、化妝、戴眼鏡等臉部不同變化,準確度就比傳統人臉辨識技術來得高;另外,對於光影、人臉角度的變化,也有更高的辨識容忍度。更重要的是,藉由大量資料進行訓練,就能持續改善模型的辨識率。

但想要提升辨識率,訓練資料就要越多越好,汪世昌也大方分享自家經驗,在LFW測試(公開人臉資料集評比)上,大約20萬張人臉訓練資料,TAR辨識率就可以達到98%,但他進一步指出,想要在提高辨識度,接下來就只能靠資料量與技術上來突破。

因此,在技術上,中華電信採用深度學習的CNN(卷積神經網路)技術,搭配TensorFlow機器學習框架來進行人臉辨識模型開發,一舉將臉部辨識提高到九成八的辨識率,這還只是使用2千多人共計20萬張人臉資料進行模型訓練的成果。接下來,再從原先2千人增加到1萬人,訓練資料量也翻了3倍,以多達60萬張人臉影像進行訓練,辨識率也因此在短短不到1年內,就推升到99%以上,「如今,我們的訓練人臉資料已達到100萬張,在進行LFW測試時,辨識率高達99.78%。」汪世昌說。

在訓練摸型的同時,中華電信研究團隊還針對人臉影像進行校正、調校尺寸,來持續優化模型提高認臉能力,甚至還開發自動過濾演算法,增加訓練可用的大量人臉至4萬人。汪世昌也透露,為了要縮短模型訓練時間,還引進了運算力更強的硬體,如要價不菲的深度學習專用硬體DGX-1等,來加快深度學習模型的訓練,以百萬張人臉為例,他說,原先每次訓練模型最少要花3天,現在,只用不到1天就能訓練完,開發人員可以更快觀看測試結果與進行模型參數調效,來持續優化模型,讓它的辨識效果可以越來越好。

中華電信研究院巨量資料研究所所長汪世昌認為,當人臉辨識的辨識率已達到98%或99%以上時,產業應用才是發展重心,想讓人臉辨識可以落地為實際應用,在地化人臉資料是關鍵。(攝影/洪政偉)

要用當地臉部資料做訓練,人臉辨識模型才能更貼近在地需求

但是,就算測試辨識效果再高,並無法真正反應出實際應用場景也是如此,汪世昌就認為,當人臉辨識的辨識率已達到98%或99%以上時,產業應用才是接下來的發展重心。「而要讓人臉辨識可以落地成為實際應用,在地化人臉資料是關鍵。」他說。

他也以自家人臉辨識引擎來說明沒有在地人臉資料的影響有多大。去年底,研究院在內部展開一項實測時,卻發現原本在實驗環境測試辨識率有高達99.6%的人臉辨識模型,卻認不太出自家員工,甚至辨識率連8成都不到。更進一步分析才發現,這些辨識容易出錯的人臉影像,大多是屬於側臉,而不是正臉,甚至只要臉部角度稍有偏差,就容易被誤認成別人或無法辨識,但認外國人臉時,就幾乎沒有這個問題。

但改加入了亞洲人臉孔資料後,再重新對員工來進行辨識,汪世昌表示,結果就完全不一樣,馬上就有了明顯的改善,辨識度從原先低於80%,進而提升到了87%~88%,甚至比原本百萬張人臉訓練出來的模型還提高了近1成的辨識率,這也才僅花了數千張亞洲人臉當作訓練樣本。汪世昌指出,這次學到的教訓,也讓他們決定要建立臺灣自己的人臉資料庫。

因為一開始蒐集的一百萬張人臉資料,絕大多數都是外國面孔,這正是造成訓練出來的模型辨識亞洲人會不準的原因,他解釋,因為這些西方人臉五官通常較為立體,相較之下,東方人臉輪廓較為扁平,因此,以這些臉部資料訓練開發出來的人臉辨識引擎,辨識出來的結果,就容易會有差異。

但是,想要讓人臉辨識在臺灣落地且能夠廣泛應用,就不能只會認正臉,就連側臉,或甚至不同臉部角度也都要能正確識別。因此,為了解決這個難題,他表示,才要增加訓練用的臺灣或東方人的臉孔, 要讓自家人臉辨識引擎,不再只認得外國臉,也能認臺灣臉。

汪世昌也強調:「臺灣要發展人臉辨識,只有用自己在地人臉資料下去訓練,才能發展出符合臺灣在地化的人臉應用。」尤其是,未來只要是需要身分驗證的場所,都會是人臉辨識的應用範疇,但辨識過程中需要人臉特徵值做分析且涉及到個資隱私,需要高度資安保護,透過自行開發掌握關鍵技術,才能夠確保資安與個資保護。

年初院內已導入刷臉技術,委外員工出勤打卡先用

年初時,中華電信研究院也使用這套在地人臉辨識引擎,來開始管理總公司內部數百名委外清潔員工的上班出勤,現在每位人員上下班,都會先通過一臺刷臉打卡機來進行簽到或是刷退,以取代傳統上下班打卡。

這臺人臉打卡機就放置在門口警衛室旁出入走道,只要按下簽到鍵,以正臉面向鏡頭就會回傳照片到後端註冊人臉資料庫比對,大約2秒就能回傳辨識結果,一旦確定是本人,就會在螢幕上顯示姓名、完成簽到時間。

除了自己內部使用外,中華電信今年5月也推出商用服務,目前已有臺灣高科技業、建築業與政府部門採用,做為門禁、差勤管理的使用,另外也有花蓮大型購物中心,用於分析來客人流或VIP顧客識別等應用。


Advertisement

更多 iThome相關內容