圖片來源: 

MapR

Hadoop企業版發行商MapR於3月8日宣布,旗下融合資料平臺(Converged Data Platform)正式上市,並加強Docker容器(Container)、安全性、資料治理等功能。另外,此平臺現在也包含了開源Hadoop專案Apache Myriad,讓叢集管理工具YARN和Mesos間共享資料中心的資源,並支援多租戶環境。

MapR融合資料平臺將Hadoop和Spark、網路規模(Web-Scale)的儲存、NoSQL、資料串流功能等整合到一個統一的叢集,提供用戶可以部署即時資料應用程式。而該平臺主要由大資料事件串流系統MapR Streams、NoSQL資料庫管理系統MapR DB,以及基於POSIX檔案系統型態的儲存系統MapR FS所組成。

在這次的更新中,MapR透過狀態資料(Stateful Data)來加強Container與持續儲存(Persistent Storage)的互動,而狀態資料就是指資料的背景,舉例來說,顧客的銷售歷史記錄,每個重要資訊構成了歷史記錄,歷史記錄則構成了資料背景,而此資料能供應用程式持續檢索。另外,融合資料平臺之於Docker Container就像資料服務層,提供Container分散式且彈性的儲存,也包含容器化(Containerized)應用程式所需的資料庫和訊息與串流功能。

在安全性方面,融合資料平臺現在利用存取控制運算式(Access Control Expressions,ACE)來描述使用者存取的資料權限,根據MapR,ACE讓系統管理員可用1~2行的程式碼,就能描述指定的存取權限。而除了ACE外,MapR也在MapR Volume多加一層資料檔案的防護,加強多租戶控制,以確保資料僅供指定群組存取。

而在效能的部分,研究機構ESG進行MapR Streams的基準測試,結果顯示在每秒3.5GB的吞吐量下,每秒可處理超過1.8千萬筆訊息。另外,MapR DB現在支援原生JSON文件儲存格式,使用者可在SSD中,透過平行I/O即時存取NoSQL資料。

熱門新聞

Advertisement