【醫療影像AI新創：雲象科技】鼻咽癌AI偵測模組準確率已達97%，接著要挑戰血癌辨識AI

雲象科技共同創辦人暨執行長葉肇元4年前與好友共同創辦雲象科技，以數位病理起家，提供病理玻片掃描與資料庫服務，後來導入AI，以數位病理為基礎，打造出特定疾病的細胞辨識AI模型。（攝影／洪政偉）

臺灣醫療影像AI生態圈中，不只醫院和學界在耕耘，還包括新創公司的投入。我們看到有一家業者表現特別出眾，他們選擇了高難度的數位病理領域，短短1、2年內，就掌握了國內大半的數位病理AI市場，更於去年國際醫療影像年會MICCAI上，擊敗了來自史丹佛大學、卡內基美隆大學和騰訊的團隊，在一場數位病理影像分析競賽中拿下第7名。

這家新創，就是4年前由3位對醫學充滿熱忱的年輕人所成立的雲象科技，以數位病理起家，提供玻片掃描、建立數位病理資料庫的服務，讓醫生不必再捧著一盒盒玻片到實驗室用顯微鏡觀察組織切片。本是要改造數位化程度落後的病理科，但見識到深度學習在ImageNet影像辨識大賽的潛力後，雲象科技決定轉型為醫療影像AI公司，以原有的病理影像為基礎，來打造可辨識特定細胞的AI模型。

轉型至今才不過2年，雲象科技就獲得了匹茲堡大學醫學中心（University of Pittsburgh Medical Center）、美國錫安山醫學中心（Cedars-Sinai Medical Center）青睞，共同發展數位病理AI。在國內，則掌握了大半數位病理AI市場，合作對象包括臺大醫院、林口長庚醫院、臺北榮總、國泰醫院、北醫附醫等，現階段成果除了有與林口長庚醫院開發的鼻咽癌AI偵測模組，還有骨髓抹片細胞分類、肺癌、腎臟病理研究等10幾項AI專案在進行。

代表性成果：能偵測鼻咽癌風險的AI模型

與林口長庚醫院共同開發的鼻咽癌AI偵測模組，是雲象科技最具代表性的成果。該專案自去年2月開始，使用了260張病理玻片，由林口長庚指派6位醫生來標註影像，雲象科技則負責訓練卷積神經網路（Convolutional Neural Network，CNN）模型。

在模型建置的過程中，雲象科技面臨的挑戰是，病理玻片數位化後，影像解析度非常高，「每張的解析度高達幾十億畫素。」雲象科技共同創辦人暨執行長葉肇元解釋，高解析度數位病理影像的檔案大小，遠高於GPU內建記憶體。受限於既有硬體，雲象科技只能切割影像為數個小區塊，來訓練AI模型。

葉肇元舉例，當醫生先標註完數位玻片中的癌症區域後，團隊便將該區域切割為每張256×256的小區塊，再由醫生進一步標註每個小區域的細胞，而非單純判斷影像類別，再分批將切割後的檔案提供給深度學習神經網路，來學習辨識癌症。

經過10個月的努力，這套鼻咽癌AI偵測模組已能在鼻咽組織的數位病理切片上，自動標示出癌症高風險區域，葉肇元表示，準確率已達97%。目前，雲象科技正準備這套模組的相關文件，要送至美國食品藥物管理局（Food and Drug Administration，FDA）進行醫材審查認證，以便日後上市。

雲象與林口長庚醫院病理科合作，共同開發出鼻咽癌癌AI偵測模組，可顯示癌症高風險區域，準確率達97%。(圖片來源／雲象科技)

新挑戰：要教AI來辨識近40種骨髓細胞

談起眼下最有挑戰度的案例，「骨髓細胞自動分類是最有野心的嘗試。」葉肇元說，骨髓抹片是判斷血癌（又稱白血病）的關鍵檢查，因為血癌是由骨髓內白血球系列細胞惡性增生而成。根據細胞增生種類和細胞成熟度，血癌又可分為好幾種，比如急性骨髓性白血病、急性淋巴球性白血病、慢性骨髓白血病和慢性淋巴球性白血病等。

「這個題目難度非常高，全球幾乎沒有人做。」葉肇元表示，除了資料收集不易，還因為一張骨髓抹片，就包含多種細胞，依其種類和成熟度來分，就有將近40種。然而，要判斷這些細胞，還得仰賴經驗豐富的專科醫生和醫檢師，但這類專業人力光對醫院而言，已是相對稀少吃緊的資源。

儘管如此，雲象科技和臺大醫院仍決定挑戰這個題目，由臺大醫院血液科提供影像，派出12名專業醫療人員來協助標註影像，雲象科技則負責開發影像標註介面、訓練AI模型。這個專案自去年5月開始收集資料、標註影像，不過，葉肇元預估，要打造出骨髓細胞自動分類的AI模型，至少需要幾萬張影像，還要標註10萬多顆細胞才能完成，是一項大工程。

他也坦言，雖然目前還未達臨床可用階段，「還有很長一段路要走。」但他期待，這個AI系統一旦完成，未來病患進行白血病檢查時，就可免去數天的等待，不僅病人受益，也可造福專業人力吃緊的醫療界。

葉肇元指出，骨髓抹片細胞分類專案是與臺大醫院血液科共同開發，要打造世界僅有的骨髓抹片分類計數模型。該模型能在臨床血癌的診斷工作中，來計算、分類骨髓細胞。(圖片來源／雲象科技)

數位病理AI的高門檻

與其他醫療影像相比，數位病理在影像解析度上有著極大差異，光是一張影像就可高達1GB至2GB。這是因為，數位病理觀察的是微米等級的細胞，而非公釐或公分等級的腫瘤，因此需要高解析度呈現，醫生才能清楚辨識。

這一點，也影響了打造AI的難易度。葉肇元比喻，要AI看出3公尺外的人有無雙眼皮，或是否有2隻眼睛，後者不需要太多影像資料就能做到，「甚至影像有點模糊也沒關係。」但對前者來說，就「必須使用好的鏡頭與清晰的對焦。」

由於數位病理的高解析度特性，對硬體的需求也隨之提高。葉肇元舉例，他們遇過最有挑戰性的狀況，是當一個100層的ResNet分析一張解析度為10,000×10,000的影像時，GPU甚至需要搭配600GB的系統記憶體才能運算，遠遠超過單張32GB內建記憶體的頂級GPU的能力。

也因此，雲象科技採用影像切割的方式來訓練模型。這個做法，雖然能克服硬體的局限，但葉肇元認為，縮小影像仍會流失一些資訊，例如切割後無法宏觀來看整張影像。對此，雲象團隊正研究如何處理高解析度影像的AI模型訓練。

為加快數位病理AI開發時程，雲象要從人才下手

「開發醫療影像AI的瓶頸，就是漫長的標註過程。」葉肇元指出，雖然醫療影像AI的目的，是要減輕醫生看診負擔，但要打造AI模型，還需要醫生花時間來標註影像。「他們已經很累了，要怎麼幫忙？」

於是，在過去3個月，雲象科技開始將人才延攬對象擴展至醫生，要聘請醫生加入影像標註團隊，加速整體開發時間。葉肇元希望雲象的標註團隊成員背景，能涵蓋專業醫科、醫學檢驗，以及護理相關等領域，來負責不同程度的影像標註。「甚至，我們也要有自己的醫療團隊，」以便開發或推展高醫療專業度的題目。

熱門新聞