圖片來源: 

iThome

在國外火熱了數年的大資料風潮,去年開始慢慢地吹向了臺灣,不再只是少數企業搶先機的應用,而是多數人看好的未來趨勢,也帶動了「資料科學家」人才的需求萌芽,開始有企業想要卡位未來的大資料商機,到處尋覓臺灣的資料科學人才。

尋覓人才的企業不只是網路或電信業者如中華電信、IT廠商如趨勢科技、精誠資訊,或像是廣告公司如威朋,電子商務業者如東森集團,甚至連臺灣半導體龍頭台積電都出手了。

早在去年,台積電就默默地派出多位主管,赴全臺各地大學資訊科系演講,介紹台積電在半導體產線上的大資料運用經驗,試圖挖掘更多資料科學分析人才。今年,台積電為了吸引更多年輕人才投入大資料分析領域,大動作地和清華大學聯手舉辦「半導體大數據分析競賽」開放學生參加,提供晶圓數百道製程的實際機臺資料作為大資料實戰競賽之用,並在臺灣新竹和臺南兩地舉辦半導體大資料應用的培訓課程,優勝隊伍成員,台積電承諾優先面試。

六、七年前就投入大資料分析技術Hadoop平臺研究的臺灣Hadoop社群發起人王耀聰觀察,連台積電都開始帶頭推廣大資料技術,今年臺灣製造業的大資料應用也將起飛。

但是,為何不是金融、零售流通、超商百貨這些擁有大量消費資料的產業龍頭積極推廣大資料或培訓資料科學家,反倒是世界數一數二的高科技製造業龍頭,更渴求地尋覓這類人才?

參與過2百多個半導體或高科技工程資料分析專案的亦思科技系統發展處處長江孟峰解釋,目前臺灣製造業大資料分析主要運用於機臺設備資料的分析,也就是Tool Log資料的分析。因為這類資料數量龐大,資料欄位繁雜,資料產出的速度又快,過去以關聯式資料庫處理時會遭遇一些技術困難,只能先在檔案層次預先處理後,才能整理成適合分析的資料格式。但是,「改採大資料分析技術後,可以節省很多前處理的麻煩,甚至可以進一步同時分析這些大資料,這是過去不容易做到的事。」他說。

在這群積極覓才的企業中,有的企業不是只想聘用1、2位專家而已,甚至要自己培養一個資料科學家團隊,像華聯生技今年8月決定將研發部門改組為大數據、產品開發和檢測等3個業務處。率領大數據部門的主管是華聯大數據業務處副處長劉家宏,他直接對總經理報告,旗下團隊有5名員工,以及7位協助處理資料的實習生。

劉家宏表示,要處理龐大的基因資料,非得靠資料科學技術不可,也因此,成立大資料部門後,「現在,我們擁有更大的空間,能夠以資料導向,從大數據和資料科學的角度來開發產品和服務。」華聯生技這個大資料部門成了企業創新產品的先鋒。

臺灣資料科學家約百人,資料科學分析師則超過2千人

臺灣有多少資料分析人才?根據中研院資訊科學研究所副研究員陳昇瑋的觀察,對資料科學家的定義不同影響了人數的估算,若以狹義的角色來看,與傳統資料分析師最大的不同是,資料科學家的工作通常是處理異質且大量的資料,要解決問題也大多是未知的挑戰,資料科學家的任務涵蓋了資料收集、整合以及最終的資料決策系統開發。

陳昇瑋估計,臺灣也許只有百位資料科學家的規模。但是若以廣義的資料分析師來看,臺灣至少有2、3千人,在各領域從事企業資料分析、報表分析或輔助決策的工作。因為有經驗的人非常難找,也難怪他評估,臺灣資料科學家的年薪「起薪」約100~150萬元左右。

在8月底,由陳昇瑋發起的臺灣首屆資料科學愛好者年會,就吸引了來自學術圈、商業顧問、行動廣告、醫學生技、氣象、行動應用、金融、電子商務,甚至是生物保育、公益協會等四面八方的資料科學專家現身分享,也吸引了750位對資料科學有興趣的參與者。

臺灣大學資工系特聘教授林智仁表示,如今是資料科學的時代,企業搜集到的資料量及種類都大幅增加,不僅能用來分析企業營運相關資訊,甚至資料已經可以產生商業價值,這意味著資料科學家在企業中的角色不再是輔助,進而轉變為企業的生產主力。這股由大資料喚醒的資料科學風潮,開始吹進了臺灣的企業,將成為企業新的競爭力來源。

相關報導請參考:「大資料三部曲之3|資料科學在臺灣」「大資料三部曲之2|資料科學走入企業」「大資料三部曲之1|顛覆傳統的大資料處理新思維」

熱門新聞

Advertisement