【玉山AI實例3】自建反洗錢黑名單偵測模型，快速揪出問題

資料來源：玉山金控，iThome整理，2021年8月

反洗錢（AML）一直是整個金融業兢兢業業、嚴陣以待的議題，他們拼命抓漏，也不願放過任何風險。對玉山銀行來說，更是如此。

用NLP快速分類、揪出特定名詞，加速負面新聞分類

反洗錢機制如此重要，玉山銀行靠AI模型和三大步驟，來簡化傳統耗時耗力的AML負面新聞蒐集工作。他們設計一套新AML黑名單偵測流程，以自然語言處理（NLP）技術來加速負面新聞辨識；新流程拆解了玉山舊有的人工閱讀和辨識作業，可分為負面新聞分類、事件聚合分析、黑名單資訊擷取三大步驟。首先，團隊先用人工標註的新聞資料，來微調NLP經典預訓練模型BERT，建立二元分類器、分辨負面新聞。再來，第二步進入事件聚合分析階段，將相似的新聞文章歸為同類。此處會由預訓練模型產出文章語意向量，再將語意相似的文章向量，歸為相同事件。

最後進入黑名單資訊擷取階段，利用人工標註的文章黑名單出現位置、外部訓練資料和BERT模型，打造一套人名辨識（NER）模型、罪名QA模型和地名擷取模型，來產出黑名單預測結果。

這些資訊，最終會呈現在前端介面，包括新聞文本、涉案人名、罪名和犯案地等，同仁可直接編輯、驗證，省下原本要手動查詢大量新聞、將文章複製貼上的時間成本。

而且，新流程在閱讀上也大有幫助。因為，傳統方法需要人工閱讀所有與特定人物相關的新聞，一個人可能就有上百篇，但NLP模型可直接分類文章、挑出有問題的幾篇新聞，再由人工精讀即可。未來，玉山銀行還要讓這套AML黑名單偵測模型學會更多技能，比如能進一步回答人與時間、地點和金額的對應關係，變得更聰明。

熱門新聞