因應Hadoop系統資料處理需求,大資料解決方案廠商Splunk最近一年來積極推出相關產品,去年底,在Splunk Enterprise平臺的基礎上,推出Hadoop連接器之後,日前又宣布推出新的Hadoop產品Hunk測試版,讓使用者能以Splunk搜尋語法直接將Hadoop系統的資料擷取出來,然後進行分析並且以視覺化方式呈現分析結果,不再需要另外以Pig套件的特殊語法來處理Hadoop的資料,Splunk資深產品行銷經理Andy Ho表示,Hunk正式版將會在今年底推出。

Splunk新推出Hadoop分析套件Hunk,可直接存取Hadoop檔案系統來產生視覺化分析報表。
相較於去年底推出的Hadoop連接器,Splunk資深技術顧問陳哲閎表示,Hunk的資料處理效能更好。

以等量的資料處理時間來說,陳哲閎表示,Hunk至少可以縮短十分鐘以上,主要因為原本的做法必須先經由連接器將Hadoop的資料取出,然後,再將資料重新寫入Splunk Enterprise平臺才能處理,這種做法比較間接而且費時。新推出的產品Hunk,由於整合Splunk專屬的資料處理技術,因此可以直接在Hadoop系統建立資料索引,讓使用者能以Splunk搜尋語法來處理Hadoop系統的資料,不再需要為了處理Hadoop系統的資料,另外學習特殊的語法Pig等來處理Hadoop系統的資料,預計將能有效縮短相關資料處理時間。

Andy Ho表示,目前Hunk已經可以支援十多種與Hadoop相關的專案,包括ZooKeeper以及Mahout等等,除此之外,Hunk還可支援以Java、Python、PHP、C#、Ruby、JavaScript等程式語言開發出來的應用,企業可以在Hunk平臺上另外開發其他應用。文⊙楊惠芬

熱門新聞

Advertisement