圖片來源: 

辜騰玉攝影

最近因冰桶挑戰而受到大量關注的漸凍人罕見疾病(ALS,肌萎縮側索硬化症),其中的病因就是染色體基因缺陷導致。人體染色體異常很可能導致遺傳性疾病,對於這些罕見疾病,華聯生技建立了遺傳疾病資料庫,並研發染色體晶片,讓胎兒、新生兒與兒童可以及早做染色體異常的篩檢。

華聯生技的大數據業務處副處長劉家宏博士在「臺灣資料科學愛好者年會」中分享了醫學研究背後的資料科學應用,從染色體晶片的設計與開發,到晶片的檢測資料分析。劉家宏在資料科學領域做了10年,目前也是元智大學資訊工程系的兼任助理教授。

劉家宏表示,傳統的色帶分析法需用人工的眼力來做判讀,受技術員的視力狀況影響,可檢測的資料量也較少。但使用染色體晶片,可布放多達3萬個探針,並藉由影像軟體分析並校正染色體訊號,並改由電腦分析軟體進行判讀。

染色體晶片透過一次性檢測,可以檢測370種智能遲緩、發育障礙等遺傳疾病,提供家人及醫療人員做整體的評估。現在已經有婦產科醫師將染色體晶片拿來做做臨床的判斷依據。

染色體晶片的檢測流程,利用DNA互補概念,將受檢樣本與參照樣本的染色體標定不同的螢光訊號,並進行雜交,掃描晶片後再透過影像分析軟體來分析螢光訊號,找出變異的染色體。

檢測後的四個資料分析步驟分別為正規化、異常訊號偵測演算法、視覺化與疾病區域註解。首先,用回歸方法找出平滑曲線,校正偏移的螢光訊號,再使用CBS演算法,從訊號中偵測出Gain或Loss的異常區域,找出受檢測樣本中基因的拷貝數變異,和資料庫中的疾病區間位置做比對,判斷出可能的遺傳疾病。

華聯將重要的遺傳疾病定義出基因變異的區間,並建立了遺傳疾病資料庫,劉家宏表示,除了華聯內部的生醫專家之外,他們還另外找來10多位碩博士學生,從2000篇論文研究中,找出疾病區域,再請專家與醫生協助把關。

染色體檢測後的四個資料分析步驟分別為正規化、異常訊號偵測演算法、視覺化與疾病區域註解。首先,用回歸方法找出平滑曲線,校正偏移的螢光訊號,再使用CBS演算法,從訊號中偵測出Gain或Loss的異常區域,找出受檢測樣本中基因的拷貝數變異,和資料庫中的疾病區間位置做比對,判斷出可能的遺傳疾病。

 

用CBS演算法分析的結果‵可以看出圖中上面為染色體的正常訊號,下面則是染色體的異常訊號。異常訊號中顯示,在第15條染色體上有較少的基因拷貝數Loss,表該基因有缺陷及不足的狀況。


Advertisement

更多 iThome相關內容