還記得10年前爆發的SARS(嚴重急性呼吸系統綜合症)疫情嗎?臺灣及鄰近國家都陷入社會恐慌、人人自危的不安局面,為了控制病毒蔓延,疾管局全面展開通報機制,不僅醫療單位要在第一時間向上通報可疑的發燒及呼吸道感染等疑似案例,機關、學校及民間企業也都全面加入量測體溫的行列,以便及早發現SARS的徵狀。

落實通報機制,證實發揮了很大的效果。從臺灣在3月出現首宗SARS案例,到7月世界衛生組織確認SARS在臺灣已終止人際鏈的傳播,疫情在4個月內就獲得了有效的控制。

然而,透過基層通報的疫情監控機制,在2009年美國H1N1流感大爆發時,顯得捉襟見肘。因為美國幅員遼闊,層層通報機制下的訊息傳播速度較慢,等到疾管局收集到資料,通常已經與事發有1至2個禮拜的時間差了。當流感傳播的速度快於疫情通報時,疾管局無法掌握實際的疫情狀況,也就難以做出正確的判斷與資源調度。

正當美國疾管局大傷腦筋之際,Google的工程師發表了一項以資料分析技術預測流感傳播趨勢的研究成果,說明他們不必依賴基層醫師回報流感案例,只要分析人們使用搜尋引擎的行為,透過分析龐大的搜尋資料,找到流感與搜尋字詞之間的相關性,預測流感未來的傳播趨勢。

Google的方法不僅是預測的結果與疾管局的疫情資料相符,而且更重要的是,這種利用電腦來分析的做法,可以馬上呈現即時的流感趨勢預測結果,不必等上1、2個禮拜才能知道結果;而這個方法所需要的成本,也遠低於疾管局現行的通報系統。

Google這項研究的成果,也就是目前仍在提供的Flu Trends服務,讓人看到了人類有機會成功對付病毒的一線生機。疫情監控人員將能擺脫追著病毒跑的宿命,可以及早依據預測的資訊,將疫苗、藥劑等醫療資源送到可能會需要的地方。

自2009年之後,這個流感預測服務陸續推廣至29個國家,後續也增加對於登革熱的疫情監控,Flu Trends逐漸成為傳染病監控的得力助手,也成為人們津津樂道的大資料(Big Data)應用案例。

不過,在2012年底冬季流感爆發季節,Flu Trends的預測結果卻突然大暴走,高估了疫情,出現與疾管局的資料有大幅度偏差的現象,引起了一些對預測準確性的質疑。事後Google並未說明問題原因,只交代會修正分析模型,而其他人則認為是搜尋行為的改變影響了分析結果,有可能是媒體大幅報導流感訊息及政府大力宣導,人們因而提高了對流感的意識,進而導致搜尋數量增多,使得Flu Trends的分析模型受到了干擾。

Flu Trends這個例子的過程,正是對大資料最好的詮釋。Google從大資料中找到有意義的資訊,所做出的預測與實際發生的狀況相去不遠,對過去監控疫情的做法無疑是個破壞性的創新;不過,大資料可也不是那麼神奇,必須不斷地監控、修正,才能一直確保大資料的分析價值。要挖掘大資料,可不像淘金客發現溪中金沙那樣碰運氣,在技術上必須下很大的功夫,可能得探勘多次才找得到真正有產值的油井,也可能油井突然枯竭了,要判斷是繼續挖深還是另尋他法。

資料被認為是未來世界的新石油,如同過往掌握石油的人能稱霸世界,未來能夠掌握資料的人,就有可能改寫既有的規則,雄霸新世界。在前進大資料時代之際,許多技術、觀念也都隨之改變。自本期封面故事開始的一系列大資料報導中,我們就先從資料處理的變革來談起。

吳其勳/iThome電腦報周刊總編輯

作者簡介


Advertisement

更多 iThome相關內容