改善AI品質要多管齊下，不只強化歸因更讓模型自動優化

富士通研究所所長原裕貴

黑盒子AI，是深度學習的優勢也是包袱。正因為超越了人定規則的框架，才能從資料挖掘出更具預測力的推論模型，但也因此，無法讓人得知模型為何做出這樣的預測。這類無法解釋的AI，在深度學習爆紅之後，成為了學界和業界爭論不休的技術和信賴課題。

AI實用派有大量擁護者，例如Google，在2012年發現，深度學習可以大幅提高語音辨識的正確率後，就大力應用到各領域。同年的ImageNet影像辨識大賽中，CNN框架AlexNet也以85％的準確率大敗其他演算法而奪冠，更掀起深度學習在電腦視覺和影像處理上的風潮。CNN之父Yann LeCun還主張，不見得所有問題都需要AI解釋，因此力推不需仰賴人力標記的自監督式學習（Self-Supervised Learning，SSL），並認為，這是AI典範最有機會出現大變革的方向。

但，AI的解釋力，終究是業界無法閃躲的問題，尤其各國政府看見其爭議性後，已紛紛祭出法規來規範AI應用，歐盟GDPR的透明處理原則，更賦予用戶，對於個人化自動化決策（Automated Individual Decision-Making），擁有請求解釋、拒絕適用的權利，所以，像金融機構不靠人只用AI決定拒絕貸款時，就得給出拒絕的理由，或在醫療領域，也無法完全靠AI診斷，還需醫生綜合考量後做出決策，因為現有法律上認定，只有真人才能為診斷當責。

因此，也有一派專家積極尋找打開AI黑盒子的方法。例如IBM，應用LIME技術結合自行開發的對比解釋方法（Contrastive Explanations Method，CEM），來發展解釋機器學習模型的工具；而日本的富士通研究所，則是運用深度張量（Deep Tensor）以及知識圖譜（Knowledge Graph），試圖解釋深度學習模型，更結合傳統統計方法開發出廣泛學習（Wide Learning）技術，走出了可解釋AI的另一條路。

以深度張量與知識圖譜技術，提供DL模型解釋依據

富士通最著名的AI應用之一，是2017年與國際體操聯盟聯合開發的體操評分AI，結合雷射感測器，將選手的每個動作如四肢位置、關節曲直、旋轉角度等肉眼難辨的差異，即時建立成3D影像，再透過AI影像辨識來估算得分。這個全新的AI體操評分機制，目前已在2019年世界體操錦標賽中完成驗證，等奧會核准通過後，更可望成為2020年東京奧運的輔助裁判工具。這項技術的關鍵推手富士通研究所，就是富士通先進技術的第一線研發主力。

富士通研究所早在2017年，就揭露對可解釋AI的研究進展，結合了深度張量、知識圖譜兩種技術，來解釋以圖結構（Graph）類型資料所訓練的深度學習模型。

比如一項針對特定疾病與基因變異關聯性的研究，富士通研究所先用深度學習演算法，訓練出疾病與基因變異關聯預測模型，並將圖結構的訓練數據，改以張量（Tensor）這種數學表達形式來呈現。

接著，針對該模型的每個輸入數據及輸出結果進行反向驗證，以輸入數據中張量之間的相似性，來提取出影響AI決策的特徵，藉此來判斷哪些因素對AI推論結果有關鍵性的影響，再進一步以知識圖譜來呈現這些因素之間的關係，方便研究人員或醫生，來解釋特定疾病與變異基因的關聯。

不過，富士通研究所所長原裕貴表示，知識圖譜技術並非用來解釋AI的預測結果，而是呈現出各因素間的關聯，讓研究者自己找出有說服力的解釋。目前，日本醫學研究與開發機構（AMED）與京都大學合作的基因研究專案，已經開始採用這項技術。

另一個應用，則是金融業的融資信用評估模型，用來解釋信用評等與借貸者條件的關聯性。因為深度張量，能分析如匯款記錄之類的圖形結構數據，來確定影響信評AI決策的關鍵因素；而知識圖譜本身能收集廣泛的公司數據，包括有關母公司、子公司、股份持有人和董事會成員等，來呈現其關連性，並顯示出影響較大的因素，讓研究者能近一步解釋AI決策生成的原因。

以傳統統計方法建立多重假設，來解釋DL模型決策結果

2018年底，富士通研究所又揭露了可解釋AI研究的另一個新方向，稱為廣泛學習，專門用於個人化決策類型的深度學習模型。

一般深度學習，是尋找輸入數據與預測結果間的關聯，來建立起一個用來推論的模型，但廣泛學習，是先將數據屬性（欄位）進行排列組合，並從統計結果中找出更傾向標記結果（Labeling Categories）的重要假設，來建立起一個分類模型的方法。

原裕貴表示，快速從大量數據組合中提取出重要假設，同時快速消除不必要的假設，來建立一個分類模型，就是廣泛學習的技術概念。

而建立假設的過程，舉例來說，輸入數據有10項屬性，年齡、性別、有無駕照、是否結婚、興趣、職業、年齡、偏好的購物場所、網頁瀏覽紀錄、天氣等，每個屬性的變化可能是2種（是或否、男或女）、多種（年齡、興趣）到上百種（例如1％到99％），就需要將所有可能性進行排列組合，這也是建立假設的過程。

接著，廣泛學習會自動統計出每一種數據組合的結果，若統計結果中，100名擁有駕照的人，僅60人已經購買了該產品，購買率為6成，但10個已婚男子中，卻有9人都購買了該產品，購買率為9成，以此就能推斷，已婚男性相較於擁有駕照者更容易購買該產品，就能形成一條假設，富士通稱為這是一個知識區塊（Knowledge Chunk）。

廣泛學習模型，會建立大量知識區塊，並測試每一個區塊是否傾向標記結果，例如符合這些假設的人，是否會成為購買者（這就是標記結果）。接著，再透過知識區塊之間的關聯性，進一步調整其權重，讓模型做出比一般深度學習更精準的決策，比如富士通研究所在醫療數據的測試中，廣泛學習比深度學習的準確率提高了10～20％。

用AI來解決社會上的公平性問題，避免人為判斷偏差的爭議，是接下來的發展重點。─── 富士通研究所所長原裕貴　（攝影／洪政偉）

富士通研究所先將廣泛學習在應用到行銷業務場景中測試，除了能用來分析客戶是否將購買了特定產品，也能反推出哪個類型的客戶最有可能是該商品的購買者，比如在上述案例中的已婚男性可能有很高的購買率，就能主動向這類客群進行分眾行銷。富士通研究所指出，廣泛學習的優勢，不僅在於更精準的決策結果，更重要的是，這種模型決策過程，容易讓人解釋，哪些假設對預測結果具有更強的影響力，而且，在訓練資料不足情況下，就算只有幾十筆資料，廣泛學習仍然可以建立可供判斷用的假設，這也意味著，若日後積累了更多數據，還能執行更準確的測試。

未來，富士通研究所則希望能將廣泛學習應用到更多場景，例如製造業瑕疵檢測，試圖找出造成瑕疵的原因，並解決訓練資料不足的問題，或用於醫療診斷時的輔助，比如讓AI根據患者的治療用藥進行藥物分析，找出「40多歲吸菸男性患者服用A藥物可以大幅改善症狀」的證據，讓醫生更容易對患者解釋和說明開藥依據。

此外，原裕貴表示：「AI運算中，仍有一段最佳化、最佳解題的計算，可藉助DAU來處理，跟以前單純用AI演算法去處理相比，AI演算法加上最佳化解題的運算方式，可以算得更快。」這個DAU，就是富士通研究所研發的另一項技術，量子退火晶片（Digital Annealing Unit，DAU），可以平行計算上千個變數的多項式方程式，來找出最佳解，可用來處理特定AI問題的最佳解計算。

這項技術已經初步產品化，已先用於日本郵政的物流配送調度上，因為日本郵局調度貨車派送要考慮的因素很多，包括了車輛類型、郵差工時、運送成本、包裹種類、運輸距離、載重和容量限制、包裹重量、運送時間，甚至還要考慮道路情況等63項條件，光是5臺車派送包裹給6名顧客，就可能會有 10億種組合，想要找出最佳的物流調度方式，靠傳統的計算方法非常困難。

2018年時，日本郵政在埼玉市的新岩槻郵局進行了這項DAU實驗計畫，利用數位退火服務來尋找最佳物流路線和運輸方式，當時經過4～5個月的測試後發現，原有52輛貨車可以減少到48輛就夠了，貨物裝載率也提升12%，而且，只需要1秒，就可以依據輸入條件，找出一個物流方式最佳解。

不過，DAU也有其缺點，難以靠其他技術或演算法來驗證結果，得靠實證來檢驗。原裕貴坦言，數位退火技術不是尋求數學上的最佳解，而是找出一個比現在作法更好的答案，「富士通實測時，還沒有因此而帶來更高成本，但也有機會持續改進。」

透過自動化調校模型表現的技術，解決AI預測力下降問題

一邊打開AI的黑盒子，富士通研究所也要解決其他造成AI不被信賴的問題。其中，隨著時間、環境變化及新輸入資料的影響，AI模型預測準確率會逐漸下降，原裕貴稱之為「劣化」。

以金融信用風險評估模型為例，會受到經濟狀況變化、匯率、價格、利率的波動以及海外趨勢、法規的影響，在首次訓練完並部署後，準確度會逐漸變差，一般作法上，得定期增加新數據，重新訓練模型來改善。

可是，AI模型的維運人員無法時時監測模型表現，即使模型劣化嚴重也不一定能即時得知，若未即時改善，模型劣化後做出的錯誤決策，更可能降低企業內外部服務的效率，甚至造成業務過失，再加上，模型重新訓練的過程，又得再次耗費人力標注與訓練的成本。

為此，富士通研究所也在2019年10月時，發表了一個全球首創的AI模型「自動」修正預測力的技術，稱為「高耐久性學習技術（High Durability Learning）」。簡單來說，這項技術是將AI模型訓練用數據，繪製成分布圖，同時也將分佈圖轉換為拓撲空間（Durable Topology Space）的表現形式，接著，將模型使用過程中的輸入數據，持續繪製成兩種圖表，來看監看數據分布的趨勢變化。

藉由兩種數據分布圖的變化，AI模型就能自動偵測輸入資料跟模型表現之間的關係，並調整決策的參考依據，來維持模型準確率，延緩模型劣化速度及重新訓練的頻率。富士通研究所實際以3,800家企業的財務數據及信用風險評模型來測試，剛訓練完成的AI模型準確率為91%，隨著環境變化，當模型劣化到僅剩69%時，有應用高耐久性學習的模型還能維持在89%。

AI模型的品質，還有一個更根本的議題，就是AI倫理，原裕貴表示，這也是全世界都很關注的議題，富士通很早就開始關注，也在去年3月公開一份全集團都得遵守的AI承諾書，要來發展以人為本的AI技術。「用AI來解決社會上的公平性問題，避免人為判斷偏差的爭議，或是，建立公平處理的AI，來防止AI造成更多的不公平，就是接下來的發展重點。」他說。

CTO小檔案

原裕貴

富士通研究所所長

學歷：日本東京大學工學博士

經歷：1984年加入富士通研究所，並在1991年成為MIT營運研究中心客座研究員，2009年擔任軟體與解決方案研究部長、2013擔任社會創新研究部長，2015年則轉任知識情報處理研究部長，且兼任大數據戰略負責人，2017年起任職富士通AI事業部專員，直到2019年上任富士通研究所所長。

公司檔案

富士通

● 地址：東京都港區東新橋1-5-2汐留市中心

● 成立時間：1935年

● 網址：www.fujitsu.com/jp/

● 員工數：132,138人（2019年3月31日）

● 年營收：3兆9524億日圓

● 執行長：時田隆仁

● 科技部門：富士通研究所

● 科技部門主管：原裕貴

● 科技部門人數：約900名

公司大事紀

● 2015年：推出數位商務平臺MetaArc以及人工智慧系統平臺Zinrai

● 2016年：開發了類量子電腦的量子退火運算技術

● 2017年：與國際體操聯盟合作建立體操比賽的AI裁判系統

● 2018年：總部決定從IT企業轉型為DX（Digital Transformation）企業。開始開發可解釋AI技術Wide Learning

● 2019年：發表開發高耐久性學習技術（High Durability Learning）

熱門新聞