雲端AI儲存管理平臺結合了「雲端集中管理控制臺」、「自動化系統診斷」、「自動化維護支援服務」、「儲存資源分析與預測」與「AI輔助管理」等幾個概念,可為用戶的儲存環境管理,提供雲端管理控制臺、自動化系統診斷與報修,以及基於AI輔助的儲存資源分析與預測等3大服務。

以往,企業IT管理人員面對錯綜複雜的儲存環境,可以依賴的管理工具,只有系統控制臺提供的訊息、自己的經驗與知識,以及連絡供應商的電話。得時時緊盯控制臺畫面,碰到複雜問題時,還得仔細檢視系統日誌與圖表,並聯繫供應商協助,不僅耗時費力,也經常充滿挫折感。

而現在正開始興起的「雲端AI儲存管理平臺」,則企圖透過雲端與AI技術的結合,提供一個自動化與智慧化的嶄新管理工具,讓用戶一舉擺脫繁雜的儲存環境作業負擔。

所謂的「雲端AI儲存管理平臺」,是「雲端集中管理控制臺」、「自動化系統診斷」、「自動化維護支援服務」、「儲存資源分析與預測」與「AI輔助管理」等幾個概念的結合。就其中涉及的個別功能來說,例如集中管理控制臺、Phone-Home維護服務,以及儲存資源分析預測等,早在多年以前,就已有許多儲存管理平臺、SAN網路管理或儲存資源管理軟體產品,可以提供,然而,把這些功能整合在雲端平臺上,透過雲端來提供管理服務,並結合AI技術的應用,則是這幾年的事情。

這種管理平臺最初是由新創廠商領頭發展,先驅是Nimble Storage於2013年發表的InfoSight雲端管理平臺,接下來SolidFire、Pure Storage也分別於2014與2015年,推出自身的Active IQ與Pure1平臺。大廠方面,IBM將其Spectrum Control Storage Insights結合雲端平臺後,於2015年加入了這個領域,接著Dell EMC則在2016年中推出了CloudIQ。隨後,當SolidFire與Nimble Storage分別併入NetApp與HPE,Active IQ與InfoSight也成為NetApp與HPE旗下產品。

目前包括Dell EMC、HPE、IBM與NetApp等一線大廠,以及全快閃儲存領導者之一的Pure Storage,都提供了雲端AI儲存管理平臺服務。

提高管理效率的關鍵作法

雲端AI儲存管理平臺的目的,是幫助用戶減輕管理負擔、提高管理作業的效率,我們可以運用帕累托法則(Pareto Principle),也就是80/20法則,來理解雲端AI儲存管理平臺的基本構想。

企業儲存環境日常維運所遭遇到各式各樣事件中,簡單、常見的狀況占了80%(如硬碟等硬體元件故障等),複雜事件則占20%(如非預期的效能問題、系統擴充升級等)。

雲端AI儲存管理平臺則是透過自動化的診斷與報修,來因應常見的簡單問題,並利用AI技術的分析與預測,來為罕見的複雜問題提供指引,再以一個透過雲端存取的控制臺介面,讓用戶能隨時取得儲存環境的狀態,與取用分析與預測等功能。

雲端AI管理平臺的3大效益

雲端AI儲存管理平臺的個別功能,早已有不同的管理平臺與軟體產品可以提供,但把這些功能結合在一起,透過雲端來提供管理服務,再結合AI的應用,所能發揮的綜合效益,遠遠超出一般管理控制臺或儲存資源管理軟體產品。

透過雲端,提供了無遠弗屆的儲存環境管理能力;自動化的診斷與報修功能,則大幅減少管理者日常維護工作負擔;至於AI分析與預測功能,則能為用戶的組態調整與升級需求提供指引。

便利的雲端集中監控服務

雲端的最大特點,便是能夠跨越環境的限制,隨時隨地為管理者取用,無論用戶身處何處,只要網路能連接雲端,便能透過瀏覽器登入雲端AI儲存管理平臺,檢視自身儲存環境的狀態。

一般儲存設備本身的控制臺,雖然也能檢視同樣的資訊,但使用上多會受到時空環境的限制,不如雲端平臺方便。

自動化的主動健康偵測與報修服務

持續收集用戶儲存環境的運行資訊,是雲端AI儲存管理平臺的基本功能,在用戶允許的範圍內,可以收集到從儲存硬體、儲存網路、不同層級的儲存區,甚至VM層級的詳細資訊與日誌記錄。

利用收集到的資訊,雲端管理平臺除了匯整資訊,為用戶提供集中監控服務外,更進一步的應用,便是檢視收集到的資訊中是否含有異常,當檢測到訊息中的異常時,主動向用戶發出警示。

由於雲端平臺對用戶端環境的資料收集,是7×24持續不斷的,所以在許多時候,往往可以比用戶端的管理者,更早、更即時地發現用戶儲存環境的異常。更進一步,雲端管理平臺發現異常後,還能主動建立對應的報修案件,幫助用戶及時處理異常現象。

而這種自動化的主動健康偵測與報修服務,也逆轉了企業儲存環境的維運模式,從以往由企業自行監控、發現狀況時再自行報修,轉為雲端平臺主動監控與主動報修,進而可讓用戶端的管理者,從日常的系統監控工作中解放出來,減輕維運負擔。而對儲存供應商而言,也能藉此為用戶提供更即時的維護服務。依照HPE Nimble與Pure Storage的說法,當啟用這種自動化偵測與報修功能後,超過80%甚至90%的故障支援,都是由原廠主動發現與告知用戶,在用戶報修之前,廠商就能先行準備更換備品因應。

AI輔助的儲存資源分析與預測

雲端AI儲存管理平臺的終極功能,是扮演類似專家系統的角色,是利用收集到的資訊,分析用戶使用行為,然後預測未來需求,從而為用戶的調整組態或升級需求,提供自動化的諮詢與指引。

單論儲存環境的資源分析與預測,先前許多儲存資源管理軟體便能提供類似功能。但雲端AI儲存管理平臺擁有兩項以往儲存資源管理軟體不具備的特點:

首先,儲存資源管理軟體的資料收集範圍,僅限於特定用戶環境;雲端AI儲存管理平臺則能從全球範圍收集用戶環境資訊,資料收集的「廣度」更大。

其次,儲存資源管理軟體是在用戶端運行,採用的分析預測方法也大多局限在傳統統計分析;雲端AI儲存管理平臺則是在雲端資料中心運行,可以引進包括AI在內更多樣化的分析技術,提供可自我進化、更「深度」的分析功能。

也就是說,雲端AI儲存管理平臺形同於是從全球範圍收集經驗資訊,然後,以AI分析得出最佳實作模式(Best Practice),從而可為用戶提供更有效的指引與參考,不僅可以降低對於儲存廠商人力諮詢的依賴,而且還更方便,隨時都可進行分析預測。

對於儲存供應商來說,也能利用這項功能減輕技術諮詢人力的負擔,甚至還能降低概念驗證測試(PoC)的需要,無須實際執行PoC,用戶透過雲端管理平臺的AI分析與預測模擬,就能精準得出儲存設備組態調整或升級後的表現。

邁向IT維運自動化與智慧化的台階

雲端AI儲存管理平臺的3大功能——雲端集中監控、主動健康偵測與報修,以及AI輔助資源分析與預測,不僅能用於儲存設備與儲存架構的管理,也有擴展到一般IT環境管理的潛力。

事實上,部份雲端儲存管理平臺已能提供儲存設備以外的管理能力,如HPE Nimble的InfoSight,以及Pure Storage的Pure1,都已經開始跨入一般IT環境的管理應用。

這也意味著,只要持續增加雲端AI儲存管理平臺的前端裝置資料收集範圍,從最初的儲存裝置,擴展到包含伺服器、網路設備,或是Hypervisror平臺在內的所有IT基礎設施,就能讓雲端AI儲存管理平臺的監控、診斷與分析服務範圍,從儲存領域擴展到整個IT環境,形同於讓雲端AI儲存管理平臺,進化為通用的企業IT基礎設施管理平臺,進而讓整個企業IT環境的管理,也進入雲端化、自動化與AI化的新時代。

 相關報導  新世代智慧儲存管理平臺來了


Advertisement

更多 iThome相關內容