如何快速藉助大資料分析「看」到趨勢呢?2015年Teradata在深圳舉行 Universe大會,展出了一系列由資料視覺化所構成的圖像,不只視覺張力強,由於圖的特性,也可讓人更容易判別資料中所隱藏的趨勢或現象。

 

這幅圖的名稱為風暴之眼,是是呈現當柴契爾夫人去世時,擁護者與反對者在Twitter上發表正反言論的狀況。圖中每個點都是Twitter的一個用戶,凡是提及或是轉推的行為,便會在點與點間產生連線,圖的中心則是柴契爾夫人,很明顯的這個圖分出了上下兩群立場不同的人。而這個圖的前身始於另一個在Twitter上的大事件,一個數位媒體IAC通訊部的全球主管Justine Sacco,在搭上前往非洲的飛機之前,發了一篇帶有種族歧視的短文給他的朋友,在她下飛機後,發現這篇短文在全球被瘋狂轉載並加以譴責,而Justine Sacco原本幸福的人生就這麼被摧毀了,此為有名的推特風暴事件由來。而風暴之眼就是由推特風暴發想而來。

 

這幅像是太陽閃焰的圖像的名稱是通話圈,是分析電信公司用戶間通話的情況製作而成的,每一個點代表一個電話號碼,當撥打另一隻電話號碼時,兩點便會用線連結起來,外圍有數個對對其他節點連線特別多的點,表示被撥打的次數特別多,有可能是互動式語音系統、安全系統或是警報系統等。

 

大資料分析也被用在臨床藥物實驗上,這個圖有4個星星,每個星星的5個角都是一個用藥病人,星星中間的點表示期望之外的副作用,將病人以及服藥後產生的副作用連接起來,便構成了這個星星與線條的圖。

 

這個有著複雜連結的圖名為星門,這是由臺灣電信商提供的資料繪製而成,每個點都是一個網頁頁面,頁面與頁面間的跳轉會由一條線連結起來,越外圍的點表示越少人訪問的頁面,中間幾個大白點表示民眾透過這個網頁跳轉到其他網頁的次數非常頻繁,細究這幾個網頁,其中80%都是惡意的廣告網頁。

 

英國慈善組織巴特爾透過資料分析,想找出問題兒童的強關聯因素。透過特工的訪問以及調查,他們記錄大量問題兒童個案的情況,並經過彙整後得到了這個圖,較大的文字表示是影響兒童的關鍵因素,諸如雙親的精神狀態、貧窮以及藥物濫用的情形都是。

 

大資料也可用來分類單一麥芽威士忌的口味,這張圖利用了斯特拉斯克萊德大學的分類開放資料集,其中包含了12位專家對86種單一麥芽威士忌品牌的口味評定等資訊,圖中每一個節點都是一個威士忌品牌,根據味道的特性,諸如香甜味、煙燻味、蜂蜜味和果仁味等氣味特性,依相似程度給予節點間的權重,當兩個節點間的線越粗顏色越暗,表示兩個品牌的威士忌口味相近。這樣的分析可以用來改善商品,進而尋找適當的市場定位。


熱門新聞

Advertisement