近日結束的Hortonworks的Dataworks用戶大會,在高峰會中該公司發布了一些重要產品更新,像是自家資料平臺Hortonworks Data Platform(HDP)3.0版正式推出,除了鎖定容器化、支援深度學習工作負載外,也支援重要三大公有雲AWS、Azure及GCP。而該產品可以達成跨雲架構的背後重要工具,就是該公司的Hortonworks Cloudbreak。

此工具是該公司併購Hadoop快速部署工具供應商SequenceIQ的結晶,透過Docker容器技術,讓企業可以公有雲、私有雲或任意支援Docker的IT環境,自動化部署Hadoop叢集。而Cloudbreak在最近正式釋出2.7版了,同樣依循HDP的跨雲策略,讓使用者使用單一工具,就能統一設定三大公有雲的雲端儲存服務設定。現在可以支援的公有雲儲存服務,包含AWS S3、Azure Data Lake Store(ADLS)、Windows Azure Storage Blob (WASB) ,還有Google Cloud Storage(GCS)。在設定介面中,開發者利用既有Instance profile,就能從儲存實例存取雲端儲存服務。

為了加強資料平臺的安全性,Cloudbreak也結合Apache Knox專案,「將叢集打包在安全Gateway內」,Hortonworks表示,只有被使用者存取的叢集服務,才會與網路連線,藉此減少平臺與外部網路的接觸面。而這次Cloudbreak發布的新功能Dynamic Blueprints,讓使用者的資料叢集能整合外部資料庫或是LDAP。Hortonworks表示,只需單次操作,企業就可以設定外部儲存認證及資料庫。而這些設定,未來可以被匯出變成新設定模版,「減少使用一次性模版,讓組態設定可以重複使用。」

除了正式功能外,這次Hortonworks也推出一個技術預覽版功能,稱為共用資料池服務(Data Lake Shared Services)。Hortonworks表示,利用這個功能,開發者可以定義Schema、資安管理政策、審核機制,將這些設定打包成一組共用服務,並且套用至各雲端環境的工作負載。

Cloudbreak 2.7版現在可以支援的公有雲儲存服務,包含AWS S3、Azure Data Lake Store(ADLS)、Windows Azure Storage Blob (WASB) ,還有Google Cloud Storage(GCS)。在設定介面中,開發者利用既有Instance profile,就能從儲存實例存取雲端儲存服務。之後,使用者還要設定新資料的儲存位置。 圖片來源:Hortonworks

 

為了加強資料平臺的安全性,Cloudbreak結合Apache Knox專案,「將叢集打包在安全Gateway內」,Hortonworks表示,只有被使用者存取的叢集服務,才會與網路連線,藉此減少平臺與外部網路的接觸面。Cloudbreak也會動態判讀Cluster blueprint,主動挑選出適合讓使用者存取的系統服務。而此功能,也能支援單一登入(Single Sign On,SSO)認證機制。 圖片來源:Hortonworks

 

這一次Cloudbreak也推出了新功能Dynamic Blueprints,讓使用者的資料叢集能整合外部資料庫或是LDAP。Hortonworks表示,只需一次操作,企業就可以完整設定外部儲存認證及資料庫。而這些設定,未來可以被匯出變成新設定樣板,「減少一次性模版的出現,讓組態設定可以重複使用。」Hortonworks表示。 圖片來源:Hortonworks

 

除了正式功能外,這次Hortonworks也推出一個技術預覽版功能,稱為共用資料池服務(Data Lake Shared Services)。Hortonworks表示,利用這個功能,開發者可以定義Schema、資安管理政策、審核機制,將這些設定打包成一組共用服務,並且套用至各雲端環境的工作負載,「當任務開始執行時,預先設定的Schema、管理政策等,都會自動套用至工作負載。」 圖片來源:Hortonworks


Advertisement

更多 iThome相關內容