圖片來源: 

iThome

分析機構Gartner副總裁Donald Feinberg表示,資料倉儲的角色之所以會有所轉變,其中一項因素就是資料不僅在數量上變多,而且日益複雜,對於5到10年前所設計出來的資料倉儲系統來說,就必須要能處理資訊的多樣性、複雜性、巨大的容量而且系統反應速度要即時等特性。而他認為,雖然巨量資料對不同產業都有不同的意義,但基本上,巨量資料代表的就是大量、複雜和非結構化的資料。

但是,對於擅長處理結構化資料的關聯式資料庫管理系統來說,是很難去處理巨量資料的。因此,Donald Feinberg表示,目前大部分的企業會特別打造一個空間或是平臺來存放非結構化資料或是巨量資料。

因應巨量資料的來臨,Donald Feinberg表示,未來邏輯資料倉儲的概念將會浮現,也就是將不同性質的資料存放在不同的資料庫中,就可以用適當的工具來獲取正確的資訊,同時,邏輯資料倉儲會利用適當的後設資料連結所有資料倉儲系統中不同的資料。

Donald Feinberg也表示,有許多工具都是用來處理巨量而非結構化的資料,但是,將有很多應用程式是使用MapReduce技術開發。

資料倉儲廠商面臨必須快速回應查詢的挑戰

巨量資料影響層面之廣,IDC軟體市場分析師鍾翠玲表示,巨量資料對於各方廠商都是新的戰場,其中也包含了儲存廠商,像是EMC買下資料倉儲軟體業者Greenplum就是一例。原因正是,她認為,資料倉儲的確是可因應巨量資料的主力。

不過,對資料倉儲廠商來說,還是有不少挑戰存在,首當其衝的是,他們必須要強化關聯式資料庫的效能,增加資料管理和資料壓縮的功能。

因為過往關聯性資料庫產品處理大量資料時的運作速度都不快,需要引進新技術來加速資料查詢的功能。另外,資料倉儲的廠商也開始嘗試不只採用傳統硬碟來儲存資料,像是使用快閃記憶體的資料庫、記憶體式資料庫等,都逐漸產生。

另一個挑戰就是傳統關聯性資料庫無法分析非結構化資料,因此,併購具有分析非結構化資料的廠商以及資料管理廠商,是目前資料倉儲大廠擴增實力的方向。

資料管理的影響主要是資訊安全的考量。IDC軟體市場分析師吳乃沛表示,巨量資料對於儲存技術與資訊安全也都會產生衝擊。首先,快照、重覆資料刪除等技術在巨量資料時代都很重要,就衍生了資料擷取權限的管理。

舉例來說,現在企業後端與前端所看到的資料模式並不一樣,當企業要處理非結構化資料時,就必須界定出是IT部門還是業務單位才是資料管理者。而吳乃沛表示,由於這牽涉的不僅是技術問題,還有公司政策的制定,因此界定出資料管理者是臺灣企業目前最頭痛的問題。

 


相關報導請參考「PB級資料的挑戰:巨量資料來襲

熱門新聞

Advertisement