臺大資工系教授賴飛羆指出,透過API技術串接環境開放資料、智慧裝置的數據,再加上院內電子病歷資料,可整合AI模型,來進行疾病風險預測。(圖片來源/賴飛羆)

網路技術讓資訊傳播更快速,也強化了資料的連接和使用,比如透過API串接開放資料和數據,再利用AI來分析、預測。曾任臺大醫院醫務秘書暨資訊長、現任臺大資工系教授賴飛羆就在這屆大會中,分享了臺大團隊近幾年如何利用開放資料、AI和大數據,來發展個人化精準醫療服務。

API打通任督二脈,打造準確率近9成的AECOPD風險預警系統

首先,臺大鎖定慢性阻塞性肺病(COPD),要透過開放資料、生理數據和電子病歷,來打造一個急性發作(AECOPD)的風險預測模型。

在資料處理上,臺大設置了一個資料庫,來整合不同來源的數據。這些數據分為兩種,第一是開放資料,比如臺灣氣象開放資料、LASS環境網路感測系統的開放資料,再來是不同裝置傳送的資料,像是空氣盒子、智慧手機和智慧手環等,透過各自的API串接到資料庫。

這些數據進入資料庫後,還會連同臺大醫院的臨床資料,一起傳送至自行開發的AI風險預測模型。而分析後的結果,會同時通知使用者和院方。

在模型建造上,臺大首先收集了去年3月至今年2月以來,65位COPD患者的臨床資料。這些資料包括了英國醫學研究委員會的mMRC評估表、COPD評估測試表CAT,團隊用來訓練了數十個模型,來預測AECOPD的發生機率。

在這個過程中,「我們也找出了判斷ARCOPD的重要特徵,」賴飛羆舉例,像是步數、樓層數、距離、心律等。

接著,臺大將模型打造為臨床試驗工具,利用環境資料、生活數據和患者電子病歷,來預測患者未來7天AEROPD的發生率。該試驗自去年4月開始至今年2月,結果發現,模型準確率達87.7%。

不只如此,團隊也同時進行另一個試驗,只利用環境開放資料和患者日常生活數據,來預測AECOPD機率。結果發現,「模型準確率達87.4%。」

網頁分享AI實力,ICD-10編碼自動轉換任你試

除了以開放資料和API來打造疾病預警系統,臺大團隊也利用網路,來分享自家開發的國際疾病分類標準ICD-10編碼自動轉換系統。

所謂的ICD-10編碼轉換系統,是指將醫師原本的診斷文字說明,自動換換為ICD-10編碼。

ICD-10共7碼,可分為ICD-10 CM診斷碼和ICD-10 PCS手術處置碼等兩種。ICD-10 CM中間有個分隔號,將前三碼和後四碼隔開。因為,前三碼為疾病類別,第四到第六碼是病因、解剖部位、嚴重程度,第七碼則是延伸補充。

而ICD-10 PCS並沒有間隔號,自第一碼到最後一碼,分別是科別、器官部位、手術目的、更詳細的部位、手術方式、材料、修飾。因此,要自動轉換並不容易,因為文字說明中,常出現中英夾雜、拼法錯誤等問題。雖然如此,團隊還是收集了近2年半的資料,包括14,602個ICD-10 CM、9,780個ICD-10 PCS,還有25萬筆的訓練和驗證資料,來訓練模型。

這個模型是改良版迴歸模型GRU,擁有近2萬個超參數,可針對ICD-10 CM和PCS分類預測。此外,團隊也採用注意力模型,來強化關鍵字義的理解力。

經驗證,ICD-10 CM分類模型的精確度評估指標F1-Score達0.68,ICD-10 PCS的則是0.58。賴飛羆坦言,模型能有這樣的表現,已不容易。而臺大團隊也不藏私,將自家打造的分類預測器,釋出網頁版(Web ICD10 predictor-GRU),來讓大家使用。


Advertisement

更多 iThome相關內容