為何臉部辨識需要大量在地人臉資料？

攝影／洪政偉

臺灣很早就展示自主研發實力，甚至臺灣第一套人臉辨識產品，早在10多年前就已問世，即使當時技術仍未成熟，應用受到侷限，但也開啟自主技術發展之路。甚至早在2013年時，臺灣最大桃園國際機場率先啟用的機場人臉通關查驗機制，背後使用的正是國產技術。

2014年的深度學習的出現，更加快臺灣臉部辨識技術發展腳步，不只讓人臉辨識落地成為實際應用，也開始有跨領域的公司，用於機器人、門禁考勤等人臉應用，而且厲害的還不少，比較代表性的廠商如訊連科技、中華電信、研勤科技等，都在最近1年內推出自家的臉部辨識產品，甚至現在全球已有80萬NAS用戶，都在使用臺灣群暉開發的人臉辨識偵測功能，來管理自己的相簿。

不只傳統廠商，更有實力堅強的AI新創加入，如SkyREC，靠著自創人臉辨識演算法，一次可偵測、辨識8千張人臉。就連原本只是使用者的金融業，現在也要轉變成為技術提供者，像是臺灣大型銀行中國信託去年公開展示自行發展的ATM刷臉提款應用，不只認臉，還能偵測異常提款行為，今年下半年也將在新成立的數位分行ATM啟用。

臉部辨識應用全球火紅，也有越來越多應用在臺灣落地，但也開始出現一些水土不服的情況。

10年前就投入刷臉研究的中華電信研究院，原本已經有了一套辨識度達99％的人臉辨識引擎，但是用的是100萬張國外臉孔的資料，來進行模型訓練，要在臺灣用時，辨識效果並不高，後來，決定自行建置臺灣自己的人臉資料庫，僅增加了數千張的亞洲人臉，在實際測試時，人臉辨識率就有將近1成的提升，甚至比起原先用100萬張人臉模型訓練的表現更好，大幅修正了臺灣人臉辨識的效果。

不只中華電信，就連今年3月在全球頂尖NIST人臉辨識大賽成績名列前茅的訊連科技，也都深知在地人臉的重要性。即使技術上已經達到國際一流水準，但是為了改善原本亞洲國家人臉辨識度較低的情況，還在原本的千萬人臉資料之外，另外增加包含臺灣在內多達百萬張的亞洲人臉，重新優化辨識模型，來開發出一個亞洲人專用版本，透過這個新版本，不只原先辨識率提升了0.9%，甚至更達到99.8%的超高辨識率，而且僅容許百萬分之一的誤判率。

資料量反而次要，應用場域的人臉資料才是關鍵

關鍵就在於應用場域不同，臉部辨識模型的辨識效果，就會有很大的不同。甚至可以說，資料量已經不是人臉辨識效果好不好的最主要因素，而是要用應用場域的人臉資料才是關鍵。因為只有從大量的現場拍攝的人臉資料，學習認得這個特定領域下的人臉特徵，才有辨法符合特定應用所需的人臉辨識準確度與穩定度的要求。

尤其，在非約束的複雜環境下，想要讓訓練的識別模型能應付動態多人的人臉辨識，所要面對的技術挑戰也更高。更需要有實際場域的人臉資料，因為，一般訓練用的人臉樣本，大多是在光線充足、不逆光環境下拍攝，而且多是正面照，相較之下，在實際的場域應用中，拍攝到的人臉照片常常會有視角差、光線不佳，也會受到周遭背景、拍攝的姿態角度、表情，以及人臉遮擋的影響（如頭髮、眼鏡、頭部飾品等）等多面向因素，都會影響到應用當下的人臉辨識正確率，也直接反應出這個人臉辨識產品技術力與穩定性。

人臉辨識不只要自己做，更得用臺灣自己的人臉資料

儘管，人臉辨識技術發展，在深度學習加入之後，有了許多重大突破性技術，讓它的辨識率可以大幅提高，甚至比人眼辨識還銳利，但在辨識一張人臉時，通常還是會經過人臉偵測、人臉校正、人臉特徵值擷取共3個步驟。

對於每張人臉進行辨識前，需要先找到人臉的位置，然後通過臉部校正，再取出人臉特徵來進行辨識。其中，特徵抽取步驟最為關鍵，要產生最具有鑑別力的人臉特徵，就必須要將大量人臉照片餵給多層的類神經網路，學習人臉主要特徵，讓它的辨識率盡量越高越好，而誤判率則是越低越好。

在訓練資料方面，現在免費好用的開源人臉資料庫也不少，如MegaFace資料集包含百萬張人臉圖片，因為取得容易，而且資料量夠龐大，常常被用來改進模型，讓研究人員可以設計出更多層的神經網路架構，可以應用在需要更複雜判斷的場域的人臉辨識上。

只不過，現在，這些公開的人臉資料庫，很多都是以國外臉孔居多。尤其，許多資料庫上的人臉資料，以歐美等白人國家的面孔占多數，也很直接反應在臉部辨識率，與誤判率上的差異，只對西方國家人臉辨識特別好，對於亞洲、印度和非洲國家人臉辨識效果就沒有那麼好，也容易發生誤判的情況。

以臺灣臉孔來說，因為和西方國家人臉相比，臺灣人臉輪廓較為扁平，在辨識臺灣自己的人臉時，只要拍攝的臉部角度稍有偏差，就容易會被誤認成別人或發生無法辨識的情況，如果換作是外國人就比較沒這個問題。更有研究發現，不論是使用微軟、或亞馬遜AWS的人臉辨識雲端服務，在測試亞洲臉孔時，辨識率也不如歐美人臉，甚至差距最大有6到8%之多。

就連在偵測如性別、年齡等不同人臉屬性時也容易受影響。例如，麻省理工學院媒體實驗室（MIT Media Lab）去年就曾測試不同家人臉辨識產品，發現除了白人比辨識黑人準確，辨識男性也比辨識女性較準確。這些產品不乏有知名人臉辨識大廠，如微軟、IBM與中國曠視等。甚至，因為人臉資料分布的偏差（bias），就連雲端龍頭亞馬遜AWS自己也都鬧出誤認美議員為嫌犯的烏龍事件。

又以辨識人臉年齡為例，即使是同樣20多歲的年輕人，歐美人臉看起來就是比亞州人臉更老，所以，用這些歐美資料訓練出來的人臉模型，在辨識亞洲人的年紀時就會不太準，或是測出來的年紀會和外國人差異很大。

人臉辨識更是下一代個人化的身分認證機制

從技術應用需求來看，人臉辨識更是未來所有企業需要，甚至所有IT都會用到的一門AI基礎技術。因為它就是下一代個人化的身分認證機制。以前，要登入桌上型電腦，得先輸入一連串密碼，現在更進一步用人臉確認身分，無需輸入密碼，使用者的臉就是通行密碼。甚至未來更大應用會是零售業，可以經由掃描人臉，來提供個人化的廣告服務，讓門市或店家可以依據消費者的年齡、性別、表情特徵，來提供量身定製的行銷廣告，或商品推薦。

但是想要讓這個人臉辨識引擎，可以認得一張人臉更多細節，就必須要支援在地的人臉辨識技術，如此一來，訓練出來的深度學習模型，辨識出來年齡的效果才會好。

如果用的都不是臺灣在地的人臉辨識技術，只能使用歐美或中國的解決方案，臺灣沒有自己一套在地化人臉辨識引擎，就很難普及。

由於現在全球還沒有一套人臉辨識引擎，可以適用所有人種、膚色，甚至不分應用場域都能用，這意謂著，即使用這個場域資料訓練完的人臉辨識引擎，也不見得在其他場域也能用得好，所以，臺灣也需要自己的一套人臉辨識引擎。

對於企業來說，也只有自己做，才能設計出真正合乎自己應用需求的人臉辨識應用，來滿足不同應用領域差異化的要求。

甚至針對每一個特定領域，未來都需要有這個場域吻合的訓練資料集，才能夠打造出貼近實際場域辨識需要的人臉應用。

臺灣人臉辨識技術進展

2004年 蒙恬科技推出國產第一套人臉辨識門禁系統

2013年 臺灣桃園機場外國旅客通關查驗導入浩鑫人臉辨識核心引擎

2018年1月 群暉科技替網路NAS管理軟體加入相簿人像自動標註、分類功能

2018年9月 訊連科技發表結合深度學習技術的FaceMe臉部辨識引擎，準確率可達98.50% （百萬分之一的誤判率）

2018年12月 中國信託展示國產人臉辨識ATM提款應用，異常提款也能認

2019年4月 研勤科技推出考勤人臉辨識引擎，準確率達99.32％

2019年5月 中華電信人臉辨識門禁系統正式推出上市，準確率達99.78%

2019年5月 本土AI新創 SkyREC公開展示一次可偵測、辨識8千人臉的人臉辨識引擎

資料來源：iThome整理，2019年7月

熱門新聞