人工智慧現在可以透過氣味診斷患者的疾病了,由於人類呼出的氣體包含數千種揮發性有機化合物(VOC),透過氣相色譜法-質譜聯用(Gas chromatography–mass spectrometry,GCMS,氣質聯用)資料,分析VOC就能知道病患身體狀況,但這個過程非常耗時。研究團隊使用卷積神經網路(CNN)分析VOC原始資料,能直接檢測出包括癌症在內的疾病

肺部代謝以及全身氣體血液交換的產物,構成了人體呼出氣體所攜帶的數千種VOC,而這些氣體樣本的資訊可以被用來診斷人體健康狀況,近期的幾項研究顯示,VOC組成模式與乳腺癌、直腸癌和肺癌息息相關,因此目前氣息分析被認為,極具發展潛力,是一種全新無創且精準的診斷方法。

而氣質聯用技術是分析VOC的主要方法之一,能用作針對性與非針對性分析化學物質,針對性分析可以尋找感興趣的化合物,而非針對性分析則是用來觀察VOC的變異,以發現特定疾病的潛在生物標記。氣質聯用會產生極高維度且許多雜訊的資料,一個樣本包含了高達900萬個高解析度的變數。而為了要處理這個複雜的資料,過去已有研究發展出降噪、基準校正、光譜反褶積和峰值檢測等方法,來幫助統計與分析VOC。

不過這些預處理的方法仍需要分析以及設置參數的專業,而且其資料的複雜性以及處理資料的的多變性,也造成結果的差異,因此要處理分析氣質聯用資料,即便有經驗的人平均仍要花費90分鐘處理一個樣本。來自拉夫堡大學、西部綜合醫院、愛丁堡大學和英國愛丁堡癌症中心的研究人員共同提出了新方法,使用卷積神經網路(CNN)直接分析原始氣質聯用以檢測VOC,跳過勞動密集且耗時的資料預處理過程。

拉夫堡大學博士研究生Angelika Skarysz提到,他們使用Nvidia Tesla GPU、加速CUDA深度神經網路函式庫Keras以及TensorFlow深度學習框架來訓練他們的神經網路,來處理來自放射治療癌症受試者的資料。而且為了提高神經網路的效率,研究團隊以資料增強方法增加原始訓練資料,另外,卷積神經網路也增加了100倍。

一開始研究團隊利用專業知識,創建VOC資料庫及其相對應的模式或是特徵,接著使用這些模式資料集,以特別設計用來學習氣質聯用資料的一維卷積濾波器,來訓練特定類型的卷積神經網路。一旦系統學會辨識特定感興趣的VOC,就能用來快速掃描呼吸資料樣本以自動偵測目標化合物。

該研究團隊所發展的方法,比目前最先進的手動方法更快,且更具可擴展性,現在只需要幾分鐘就能完成過去需要花費數小時才能分析完成的樣本,而這是第一個使用卷積神經網路,從原始氣質聯用資料分析VOC離子模式的方法,用於診斷患者疾病的方法。

熱門新聞

Advertisement