臺美聯手建置全球腦中風AI影像資料庫，目標3年百萬筆來加速判讀AI的研發

NIH神經異常暨中風研究中心（NINDS）資訊科技與生物資訊部門主任范揚政指出，在打造醫療AI時，不只要加強影像標註的細緻程度，在清理資料階段時，也要進行臨床驗證，才能提高模型辨識準確度。

圖片來源:

攝影／王若樸

負責建置美國國衛院主要IT系統和大型資料庫的NIH神經異常暨中風研究中心（NINDS）資訊科技與生物資訊部門主任范揚政指出，美國去年啟動醫療AI資料庫建置計畫，其中包括了與臺灣合作的全球腦中風影像資料庫（GSDR），要透過不同國家的腦中風資料集，來打造腦中風AI工具，提高急診準確率。范揚政表示，就美國來說，中風（腦出血）是第三大死因，在臺灣則是第四大死因，而且中風會造成個人長期、嚴重的失能，對社會和經濟都有重大影響。

要改善這個問題，就得把握中風發生後的黃金3小時，只要及時正確診斷、對症下藥，就能大幅降低中風後遺症的風險。全球腦中風影像資料庫計畫就決定從這部分下手，先建置一套標註過的腦出血電腦斷層掃描（CT）和核磁共振影像（MRI），再來打造一套腦中風AI輔助判讀工具，來縮短人工判讀流程。

進一步來說，GSDR鎖定腦中風發生後的三階段，分別是急性腦出血的辨識和分類、臨床診斷的決策支援，以及康復情況的預測（也就是中風嚴重程度的MRS評分）。在辨識階段，NIH的AI工具會先前處理腦中風影像，再來判斷是否為缺血性或出血性腦中風。如果是缺血性，則會進行影像的語義分割，來預測缺血性中風初期會影響的腦部區域，並產生一份報告給放射科醫師（如下圖）。范揚政強調，要提升腦中風AI工具的附加價值，得從影像標註的類別下手。而在資料清理階段的臨床驗證（Clinical Validation），則是提升AI模型準確度的關鍵。

他接著舉例，腦中風AI在判讀影像時，除了要辨識出血性或缺血性腦出血外，還要顧及可能受影響的腦部區域，比如語言、動作區，如此才能「提供醫師後續治療和開藥的決策。」因此在標註資料時，也應考量這些功能，來提高AI工具的附加價值。

此外，他也提醒，在建置腦中風AI工具時，資料清理階段的臨床驗證非常重要，因為這是提高準確度的關鍵。他表示，許多團隊在資料清理階段時，多半只注重欄位缺失值或不合常理的輸入值，比如BMI 500。「但是，臨床驗證必須把關，」也就是要注意醫療診斷報告是否出現矛盾，比如判斷中風患者中高度失能，但卻註明能上、下樓梯，「這就前後矛盾了。」（如下圖）

他也指出，經實際測驗，利用臨床驗證的資料集訓練的中風嚴重程度AI模型，其準確度可高達96%至99%，而未經過臨床驗證的資料集打造的AI模型，準確度只達80%。（如下圖）

目前，這套資料庫有3大資料集，其中2個來自NINDS，約有6萬1千筆腦中風影像資料。另一個資料集則來自臺灣的貢獻，收集了臺灣中風登錄（TSR）中14萬筆資料，范揚政指出，今年將與更多單位合作來擴增資料集，如美國醫療保險服務中心CMS和英國政府，預估未來2、3年後，總資料量將超過100萬筆。

今年5月時，中研院也聯合交大、陽明，共同成立數位醫學聯盟要打造腦中風資料集，來開發國產AI工具。這個聯盟也與NIH合作取得他們的腦中風分析資料，甚至是日本、歐洲的資料，來打造因地制宜的腦中風AI模型。文◎王若樸

熱門新聞