臺灣醫學資訊學會秘書長潘美連

圖片來源: 

iThome

「熱情」是資料科學家須具備的必要特質之一,臺灣醫學資訊學會秘書長潘美連這麼認為。「我一直抱持著一個很Open的心,只要是我不會的,我都很願意學,我把它歸納為熱情,」這也是讓資料科學家能持續進行資料科學研究的重要因素。

她回想自己是碩士生時,積極主動參與各式各樣的課程,她幾乎參與過陽明大學所有的統計課程,她表示,不管自己聽不聽得懂,就也跟著做作業。在這過程中,她慢慢累積了自己的統計和邏輯能力,也不斷地跟資料相處,培養出了對資料的敏感度和感情。她甚至也參與臺灣大學資工系程式設計課程以及中研院的統計營。

「我可以試試看,」潘美連於訪談中多次強調,她將這個願意嘗試的心態,通稱為熱情。每當有新的學習機會,「我可以試試看」這個念頭總在潘美連的腦海裡第一時間浮出,她不會先去考慮種種不能嘗試這個研究的理由,而是勇於接受各式各樣的研究邀約。

除了熱情之外,她也表示,好奇心和耐心也很重要,找尋新的研究主題時,得對這些事情(醫療)充滿好奇心,也要很有耐心地分析資料和拆解問題。

潘美連表示,在能力方面,資料科學家須具備統計學和數學知識,才能知道這樣的資料和問題,該用什麼模型。另外,要成為資料科學家,要學著去質疑事物,培養科學精神。

資料科學家須集多種才能於一身

另外,潘美連認為,資料科學家須集多種才能於一身,要有統計和程式設計的基礎,還要了解特定領域的知識,也要能跟寫程式的人、會統計的人和特定領域的專家溝通。「必須要去學習這三個不同領域的知識,然後你就可以扮演好資料科學家的角色。」

她說明,資料科學家必須要收集、整理、分析資料,最後再產出結果來回答問題。她也表示,收集到的資料常常跟分析要用的資料長得不一樣。雖然整理資料對資料科學家來說,既花時間又麻煩,不過潘美連在這過程中,發現了極大的樂趣,「看資料看到會High,」她說。

她興高采烈地解釋,資料裡有人死兩次是發生什麼事情?「這些事情會讓你覺得有新的發現,尤其當你看到一個不符合常識的現象時,你其實會很想知道:是我做錯了或者這是一個真實的現象,」她目光炯炯有神地接著說,「當你發現了一個問題,試著用你有限的能力,去找出可能的答案,那個過程其實會讓你覺得很開心。」

而在研究過程中,她認為研究者最容易犯思是「預設立場」,她解釋,當你在做研究時,你可能已有一個想法是答案應該是這個,但當你預設立場,已認定了某個答案,你分析的所有資料和去找的材料,都是去證明這個答案,但這不是資料科學,資料科學家應該是要找尋不是這個答案的證據。

相關報導請參考:「大資料三部曲之3|資料科學在臺灣」「大資料三部曲之2|資料科學走入企業」「大資料三部曲之1|顛覆傳統的大資料處理新思維」


Advertisement

更多 iThome相關內容