臺灣人工智慧實驗室(AI Labs)宣布成立臺灣醫療聯合學習AI聯盟,成員包括臺大醫院、三軍總醫院、臺北榮總、北醫附醫、臺北慈濟醫院、中國附醫。

圖片來源: 

攝影/王若樸

「我們要讓世界知道,臺灣也開始發展聯合學習了!」臺灣人工智慧實驗室(AI Labs)創辦人杜奕瑾說道。本月4日,AI Labs宣布成立臺灣聯合學習醫療AI聯盟,聯手六大指標醫院包括臺大醫院、三軍總醫院、臺北榮總、北醫附醫、臺北慈濟醫院、中國附醫,要藉聯合學習(Federated Learning)來打破醫療小數據瓶頸,讓各醫療機構以共享模型來取代共享資料,跨過資料隱私對醫療AI發展的限制。這次聯盟宣示還吸引了衛福部、國發會、科技部等政府部會的加入,就連前副總統陳建仁和流行病學權威張上淳都親臨會場,他們究竟看上聯合學習的什麼?

共享模型取代共享資料,聯合學習突破小數據痛點

杜奕瑾指出,AI大浪興起數年,近來國際AI趨勢逐漸由中心化,演變為去中心化,資料使用模式也漸從集中轉為共享,「聯合學習就在這股潮流下順勢而生。」科技部次長林敏聰也直指,聯合學習去中心化、共享的概念,是AI必然的趨勢。

也就是說,有別於集中式機器學習、需收集大量使用者資料,聯合學習不須集中資料,就能獲得與大數據相仿的訓練效果。它靠的是各端點各自訓練一套模型,再將訓練好的模型參數上傳至中央伺服器來優化,接著把優化過的參數下放到各端點,進行一下一輪訓練,如此反覆直到模型收斂。

如此一來,各端點不必上傳任何敏感個資,只靠各端點參數就能優化模型,繞過資料隱私障礙來達到集中式機器學習的訓練效果。

比如,Google在2017年發表的研究成果,就是聯合學習的經典案例。當時,Google為改善手機虛擬鍵盤輸入程式Gboard的選字建議,但又不想收集每位用戶的使用資料,於是設計一套分散式機器學習方法,讓每支手機從中央主機下載一套模型,在用戶端依使用者行為,來訓練Local端模型。

訓練好後,用戶手機會上傳模型權重至中央主機,中央主機收集一定數量的權重後,就會聚合(Aggregation),計算出一個優化過的權重,再回放到用戶端手機,進行下一輪訓練。後來,Google就將這套多次優化的模型,部署到數百萬支Android手機上。

負責臺灣醫療影像去識別化作業的國發會,也看好聯合學習。國發會副主任委員高仙桂指出,「聯合學習是未來精準醫療的關鍵。」因為,聯合學習發揮共享模型效益,等於間接共享醫療影像,打破過去醫療影像是敏感個資的藩籬。

指標醫院押寶聯合學習,要擴大AI訓練陣容

這次聯盟押寶聯合學習,就是看上這個不需大數據就能達到同等訓練成效的優勢,要來突破醫界深受資料隱私規範的限制。

身為聯盟成員之一的三總,近年開發不少AI應用,比如以心電圖來判斷血鉀濃度的AI、以眼底鏡來辨識視網膜病變的AI。三總院長王智弘直言,他們要藉這次聯盟經驗,將聯合學習技術擴大應用至全臺14家國軍醫院,也就是將14家國軍醫院納入來AI訓練陣容,來開發更多AI。

不只如此,北醫附醫院長陳瑞杰指出,今年3月,北醫附醫透過聯合學習與臺大醫院發展武漢肺炎X光片判讀AI,而後也擴展到其他國家。這次經驗,讓北醫附醫期望以聯合學習,來推動更多醫療AI應用,甚至包括遠距醫療。

臺北慈濟醫院副院長鄭敬楓也表示,今年初,臺北慈濟發展為以病人為中心的防疫醫療計畫,整合民眾門診、急診、檢查檢驗等資料來開發醫療應用。他期望未來藉聯合學習,來擴大醫療AI的訓練與應用。

醫療聯合學習大爆發,從Nvidia跨國醫療、李飛飛AIoT居家照護計畫到臺灣抗疫都靠它

聯合學習在國際上的應用,更是一波接一波。去年,英國倫敦國王學院就與Nvidia聯手,要透過Nvidia Clara聯合學習平臺,來聯合英國數家醫學中心打造12種臨床AI模型。

今年,為加強武漢肺炎疫情期間,對長者的健康照護,由李飛飛帶領的史丹佛大學人本AI學院,就研究以聯合學習方法,透過長者配戴的IoT裝置數據來訓練健康預警模型。

同時間,Nvidia更發起對抗武漢肺炎疫情的聯合學習計畫EXAM,聯手跨歐美亞三洲共20家醫療機構,來打造武漢肺炎病情惡化模型,預測未來數小時至數天內,患者是否需要氧氣治療。特別的是,臺灣醫學中心三總、臺灣大學醫學影像與數據人工智慧(MeDA)實驗室和臺灣健保署,都是計畫成員之一。

不只如此,臺灣本土也出現聯合學習先鋒案例。今年疫情爆發期間,臺大醫院就透過AI Labs自行開發的聯合學習平臺Harmonia與健保署資料,來優化原有的肺炎X光片判讀模型,作為武漢肺炎病灶判讀AI,準確率達9成以上。之後,臺大醫院也與北醫附醫採聯合學習,來共享、優化模型。

流行病學專家、中央流行疫情指揮中心專家諮詢小組召集人張上淳就指出,這種以聯合學習跨組織進行的科技防疫,就是臺灣控制疫情一個範例,他看好聯合學習集眾人之力的潛力,來發展跨組織甚至跨國應用。

其他醫療聯合學習案例,還包括由臺大醫院發起的遺傳疾病檢測平臺、帕金森氏症風險預測AI,以及由國內8家醫學中心發起的心血管影像資料庫建置和AI模型開發,都靠聯合學習打破醫療資料難以共享的壁壘。

不過,這類醫療影像判讀AI還是得接受法規規範,在臺灣負責醫材法規管理的就是衛福部食藥署。身為聯盟成員,衛福部食藥署出席代表主秘李明鑫指出,食藥署除了確保醫療器材的安全效能和品質外,也扮演AI醫材輔導角色。在法規佈局上,繼3年前發布了醫療器材軟體確效指引,食藥署在今年1月正式發布醫材專法,9月也發佈「人工智慧/機器學習技術之醫療器材軟體查驗登記技術指引」;明年5月醫材專法正式實施前,食藥署也將觀察產業狀況,來完成所有子法制定。

對聯盟來說,未來藉聯合學習開發的醫療AI軟體,就能與食藥署來諮詢、討論驗證事宜。

AI Labs自建開源聯合學習平臺Harmonia,成為臺灣聯合學習代表性工具

其實,臺灣醫療界之所以能順利以聯合學習訓練AI模型,一大關鍵就是支撐訓練和部署工作的聯合學習平臺Harmonia。這套平臺由AI Labs開發,有別於常見的聯合學習框架Tensorflow Federated和PySyft,Harmonia可真正部署聯合學習模型,更在今年6月開源釋出第一版,是臺灣聯合學習的代表性工具。

在平臺正式發表前,臺北榮總放射線部主任郭萬祐就已搶先試用了。早在今年初,他就以Harmonia和國網中心的超級電腦臺灣杉二號,來驗證醫療影像AI的聯合學習可行性。

他先將2年前與AI Labs打造的腦轉移瘤辨識AI:DeepMets,以健保大數據資料來優化,並將優化過的最終版DeepMets Plus,當作集中式機器學習代表。之後,他與一名瑞典交換生Lukas Nyström,在國產超級電腦的雲平臺環境中,建置5個節點,作為5家虛擬醫院,來模擬聯合學習訓練情境。

結果發現,光是迭代一輪,其模型相似係數DICE值就達0.77,甚至在一些領域如複雜的腫瘤形狀、大小,以及對不同廠牌、掃描參數的辨識率表現也特別好。就在前幾天,團隊也把DeepMets的程式碼與資料集都在GitHub上開源,提供下載。

除了先導應用,AI Labs本身也利用該平臺,來投入全球基因組與健康聯盟(GA4GH)、推動國際基因醫療研究。杜奕瑾期望,聯盟成員能透過該工具來跨組織發展醫療AI,甚至走出臺灣,在國際上打響臺灣醫療AI的名聲。最後,他也表示,「聯合學習聯盟不只是研究醫療問題,而是要縱向聯合醫療產業,最終要成為國家數位經濟的代表。」文◎王若樸


熱門新聞

Advertisement