中國信託數據研發團隊去年1月成立,並從零售、電商、科技業與學界中,招攬有相關經驗的專家,包括數據分析師、資料科學家、商業分析師以及架構師等,負責用AI來加值業務場景的服務與產品。(攝影/洪政偉)

今年4月中,國際臉部辨識資料庫LFW(Labeled Faces in the Wild)收到了一份來自臺灣企業自行研發的AI模型測試申請。在百萬分之一的誤判率(False Accept Rate,FAR)之下,準確率(True Accept Rate,TAR)達到99.81%,以第十名的成績贏過了騰訊、平安科技、百度等大廠。這家送測的企業就是中國信託。

打造出這項技術的是,中國信託去年1月成立的數研發中心(簡稱數研發),負責用AI來加值業務場景的服務與產品。先花7個月時間組成團隊後,中國信託開始投入臉部辨識研發,只用了半年多的時間,就從無到有研發出了一套不輸國外的人臉辨識技術。

「我們想從人臉看到客戶更深層的經營價值。」中國信託全球個金風險管理處兼數據研發中心處長王俊權強調。金融業擁有的大數據資料與客戶密切相關,若將KYC資料結合人臉辨識、衣著風格的辨識,是否能進一步預測客戶的財富、偏好、投資意願或信用評等?這是中國信託想做到的事。

要實現目標,得先有人才,除了招募數據分析師,運用機器學習來加值風險管理、行銷、反洗錢等業務,也要找資料科學家,開發人臉辨識與自然語言理解技術。為了借鏡其他產業的經驗與作法,王俊權更大舉從零售、電商、科技業與學界中招攬團隊成員。從1月數研發中心成立到團隊到位,一晃眼半年過去,才正式展開研發。

以遷移式學習,用數百萬張人臉優化模型

一開始,中國信託的目標就是通過國際認證,所以,也直接使用了國際上公開釋出的開源資料集,用了數百萬張人臉影像來訓練模型,希望在相同的標準下對決,來證明自家技術也有媲美國際大廠的實力。

蒐集大量訓練資料後,還要進行數據前處理,無論是人臉偵測(Face Detection)、矯正(Face Alignment)、或是特徵擷取(Feature Extraction),數研發以開源AI技術為基礎,加上自己的演算法來優化。

中國信託數研發智能視覺實驗室協理李藝鋒舉例說明,他們用了3D Face Landmark技術定位人臉,來校正因拍攝角度而變形的臉,處理流程中也使用了半自動作業,來減輕人工標記的負擔,進而擷取出更精準的特徵值來訓練模型。

用大量國外影像訓練出第一版的模型後,數研發再利用遷移式學習(Transfer Learning)的方法,用亞洲、臺灣公開的人臉資料集來優化這個模型的效果。除了網路上可以蒐集到的亞洲人臉,未來,中國信託也希望在個資法允許範圍內,使用內部開戶證件來訓練,每個人至少有一張以上的清晰正臉影像。

日後,中國信託要使用行內人臉影像時,將會有特別的管制作法,李藝鋒解釋,中國信託有一套非常嚴謹的個資使用規範,由於人臉無法去識別化,要取得資料必須先經由法遵單位審核和確認,甚至,在訓練模型時,也只限於在一間獨立且有人員控管的管制室內使用這些資料。獲得授權進入的操作人員,不僅不能攜帶任何通訊設備入內,管制室還全程攝影機監控,來避免個資外洩。

環境變因影響辨識率,ATM人臉辨識商用的挑戰

不過,研發出了自己的核心技術,要真正落地商用又是另一個挑戰。儘管數研發團隊打造的人臉辨識模型,在百萬分之一的誤判率下,準確率達到99.81%,但是,中國信託全臺擁有的ATM數量將近6,000臺,每月交易量更達3,000萬筆,如果每一筆都使用人臉辨識,王俊權表示,兩者相乘,還是可能出現幾十次人臉辨識出錯,若因如此而造成了客訴,仍舊是我們無法接受的程度。

「要給客戶方便,就需要有一定的容錯性,這是另一個層次的考量。」王俊權表示,商用時必須在安全性與便利性之間做取捨。考量到安全性,必須在誤判率極低的狀況下來提升模型準確度,但同時,也可能造成分明是同一個人,卻無法被辨識出來的情形,

此外,用來訓練人臉辨識模型的資料,大多為光線充足、人臉清晰的正臉、側臉資料,但ATM設置的環境中,光線相對較暗,更不是為了照亮用戶的臉而設置,無論是使用者人臉的角度、光線是否充足、有沒有背光甚至鏡頭解析度都會影響到辨識。為此,數研發也做了許多壓力情境的測試,例如用強光照射等,來觀察是否有資料偏誤(bias)情況,並逐步調整演算法使模型更能適應多樣的情境。

因此,綜合安全性、便利性、部署環境、硬體成本、資安政策等因素,在無法達到最佳解的情況下,中國信託最後還是先採用三因子驗證的方式,除了人臉辨識,還要輸入提款卡密碼與OTP驗證碼,就是要防止漏網之魚,阻絕如雙胞胎相似臉、或用照片影片等偽臉想矇混過關的情形。

人臉辨識自己做,結合行內資料推出創新金融服務

然而,雖然中國信託已經取得LFW認證,也為技術商轉做許多準備,但由於行內的自訂目標,是必須取得美國國家標準暨技術研究院(National Institute of Standards and Technology,NIST)的測試結果,因此,中國信託目前還持續送測NIST與同為國際資料集的MegaFace,要等最終的結果出爐,才能進一步應用在其他金融場景,這也是智能ATM人臉辨識技術將先採用NEC方案的原因。

王俊權也對此說明,中國信託必須要開發自己的人臉辨識演算法,是為了更彈性的符合研究方向、與行內資料結合應用,「廠商的人臉辨識演算法是屬於對方的智慧財產權,他未必能開放核心技術讓我們修改。」

再加上,市面上少有廠商能針對不同金融場景推出客製化服務,例如人臉辨識不僅可以應用在ATM提款時的身分比對,還能衍伸出防車手、是否受人指示、是否有人偷窺、以及意圖分析等加值應用,但廠商可能覺得市場不大就不開發,在面對競爭市場情況下,很容易就失去先機與優勢。

然而,這也不代表中國信託不需要合作夥伴。王俊權表示,找到能加值業務場景的新方法後,中國信託也願意跟其他業者合作,「畢竟我們不是科技業,AI的技術不可能一個人做完。」

圖為數研發團隊用遷移式學習訓練出能分辨手持電話的模型,來偵測是否有民眾受人指示匯款、被詐騙。除了受人指示,團隊也研發防車手、是否有人偷窺、以及意圖分析等功能。

除了ATM防詐,還要結合人臉與KYC資料認人心

目前,數研發中心即將上線的服務,是在去年臺北金融科技展展出概念機的智能ATM。雖然智能ATM為了提前推出,先採用了業界NEC的臉部辨識技術,但仍有許多結合人臉辨識的客製化的功能是由數研發團隊開發,包括防車手、是否受人指示、是否有人偷窺、以及意圖分析等功能。

為了辨識出潛在車手或詐騙受害人,中國信託先向警政署取得異常交易行為的資訊,例如詐騙被害人通常會一邊通話一邊操作ATM,而車手,通常會戴口罩、安全帽遮蔽五官。接著,研究團隊再以這些行為樣態去尋找相關影像資料來訓練模型。

以手持電話轉帳的偵測為例,研究團隊利用預訓練的模型,透過遷移式學習,從190萬張圖像的開放資料集中,挑選出「講電話行為」的影像作為訓練資料,來強化這類行為得辨識力;此外,研究團隊也採用工業電腦等級的GPU邊緣運算裝置,部署到ATM上,直接在邊緣端分析影像特徵值是否有符合詐騙的物件。

一旦偵測到符合的物件,ATM螢幕就會即時顯示資訊,例如,若偵測到有人站立在提款者後方半徑一公尺內,會顯示「請注意後方是否有人窺視」;偵測到安全帽或口罩會直接阻斷交易,要求用戶脫下來再試一次;偵測到手持電話的行爲會顯示「您是否接受他人指示在操作ATM?」,但王俊權也補充說明,雖然可以提醒用戶是否受人指示,但如果用戶執意要交易,仍無法阻斷,「但這個情況在分行的ATM可能可以被解決,會聯繫分行的經理來關懷。」

除此之外,研究團隊也開發出意圖分析的功能,智能ATM可以透過用戶的年齡、性別、衣著打扮,來推測客戶的特徵,接著針對個人去播送客製化廣告、推薦合適的金融服務。例如,透過年齡與孕婦裝,可以推測對方為準媽媽,再去更新她的身分來投放廣告。

未來,除了要辨識外顯的特徵,中國信託也要結合人臉辨識、物件辨識與客戶KYC資料來推測客戶內隱的意圖,王俊權稱為「認人心」,也就是要進一步分析個人投資喜好、信用評等,進而去推測客戶未來的金融需求。但,王俊權也強調,應用的前提是不能侵犯到客戶隱私,也不會以此作為評斷一個人是否可以借貸、投資的標準。


Advertisement

更多 iThome相關內容