為求降低企業儲存環境的維運成本,改善管理效率,基於雲端環境、以AI技術為支撐的雲端儲存管理平臺,可說是近年來儲存管理領域的一大潮流,可以透過雲端提供無遠弗屆的用戶環境集中監控能力,以及自動診斷、自動通知異常狀態的自動化管理能力,還能在AI的幫助下,提供用戶使用狀況的分析、預測,與升級與組態調整的自動化諮詢與建議功能。

這類平臺一開始是從Nimble Storage、SoldFire等新創廠商先行投入,到了現在,幾乎所有一線儲存大廠都擁有了這類服務,如Dell EMC的CloudIQ、HPE的InfoSight、IBM的Storage Insights,Hitachi的HIAA,Pure Storage的Pure 1,以及華為的eService等,我們這裡介紹的NetApp Active IQ也是其中之一。

最初,Active IQ原是SolidFire為其SF系列全快閃儲存陣列,於2014年推出的雲端集中管理平臺,當NetApp於2015年併購SolidFire後,Active IQ也跟著轉到NetApp旗下,再結合NetApp自身的AutoSupport服務,擴展成為橫跨NetApp產品線的統一管理平臺。

目前的Active IQ平臺可支援SolidFire SF全快閃儲存陣列、FAS/AFF系列儲存陣列、E/EF系列儲存陣列、StorageGRID物件儲存設備,也能支援軟體定義的ONTAP Select儲存裝置、雲端版Cloud Volumes儲存裝置、NetApp HCI超融合系統,以及先前稱為AltaVault的Cloud Backup等產品,幾乎涵蓋了NetApp旗下所有主要產品線。

Active IQ是NetApp的雲端管理平臺,可以支援NetApp旗下所有主要產品線,提供雲端監控、資源分析分析,以及組態升級建議等服務。除了標準的網頁介面外,Active IQ也有手機App版本可用。

從雲端管理NetApp全線產品

只要用戶擁有NetApp的主動支援合約(Active Support),然後在儲存設備上啟用啟用AutoSupport功能,Active IQ平臺便能與用戶的儲存設備連結。其中FAS/AFF系列的AutoSupport功能,是透過ONTAP作業系統的CLI指令來設定;其餘NetApp產品,則直接透過網頁控制臺就能啟用AutoSupport功能。

開始AutoSupport後,用戶儲存設備便會持續將設備組態、運行狀態、日誌與效能等資訊,上傳到NetApp的Active IQ雲端資料中心進行匯整,然後透過雲端管理控制臺,向用戶提供一系列服務,包括系統監控維運,以及分析預測與諮詢這兩大面向:

(1)系統監控維運服務:藉由匯整與檢測用戶端儲存設備回傳的系統參數,提供雲端集中監控,自動化系統健康診斷、異常狀態通報等監控等功能,還能針對故障事件,自動開立備品更換報修案件,大幅簡化與加快報修流程。

(2)分析預測與諮詢:利用持續累積的用戶端設備運行歷史資料,在AI技術的支援下,提供用戶儲存環境資源的使用分析與預測,以及軟、硬體組態升級調整建議等功能。

另外Active IQ也提供了配合手機環境的App軟體版本,包含iOS與Android兩種平臺,管理者無論身在何處,都能透過手機登入Active IQ,隨時檢視自身儲存環境的狀態。

Active IQ的3大效益

藉由結合雲端平臺,以及基於AI技術的分析、預測功能,與自動化的管理與諮詢服務,Active IQ這類管理平臺可為用戶提供3大效益。

首先,是透過雲端,提供不受環境限制、無遠弗屆的集中監控能力。用戶端的管理者無論身在何處,只要能連上雲端,就能藉由Active IQ監控自身儲存環境的狀態,大幅提高了用戶管理作業的彈性。

其次,是提供自動化、主動式的儲存環境維運支援服務。

Active IQ藉由7x24小時持續地收集用戶儲存環境的運行資訊,可從中診斷用戶端系統的健康狀態,並在發現異常時自動觸發維運支援服務,除了通報用戶外,也能主動建立對應的報修案件,並連繫NetApp原廠與協力廠商,幫助用戶及時處理異常現象,從而大幅加快問題的解決時間,提高用戶系統的正常可用時間。

第三,透過Active IQ後臺系統的機器學習等AI技術,扮演類似專家系統的角色,利用收集到的用戶設備資訊,分析用戶使用行為,然後預測未來需求,從而為用戶的調整組態或軟、硬體升級需求,提供自動化的諮詢與指引,不僅可以降低對於儲存廠商人力諮詢的依賴,而且還更方便。

 

Active IQ儲存管理平臺的基本架構

Active IQ的基本概念

如同其他雲端AI儲存管理平臺,Active IQ運作也可分為3個階段:

(1)收集資訊:利用AutoSupport功能,將儲存設備的組態、系統版本與運行日誌等資訊,上傳到NetApp資料中心。

(2)匯整與分析:NetApp資料中心透過Active IQ資料庫收集用戶端資訊後,利用AI、機器學習等技術,彙整與分析用戶設備運行資料。

(3)提供服務:透過雲端控制臺介面,向用戶提供設備監控,儲存資源分析預測、診斷與問題警示,並視用戶需求提供建議與指引。(資料來源:iThome整理,2019年9月)

如Active IQ這類雲端儲存管理平臺,可以看作是phone home功能的進化發展。過去的phone home,只是在背景將用戶端設備的特定訊息發送給供應商,讓供應商可以掌握用戶端情況。而Active IQ這類平臺則在phone home的基礎上,進一步結合雲端平臺與AI技術,來為用戶提供加值的管理服務。

Active IQ的基礎,是透過AutoSupport資料回傳機制,收集用戶端設備運行資料。視設備款式不同,AutoSupport收集的資料型式也有所差異,不過基本上都會包含設備型式(型號、系統版本等)、組態(磁碟區設定等)與運行日誌(系統服務日誌、容量與效能耗用統計等)這3大類。

Active IQ資料中心收到AutoSupport回傳的用戶端設備資料後,便能視資料類型分別組織與處理,並套用AI與機器學習模型分析。而經由Active IQ處理後的資料,再透過雲端控制臺,為用戶提供狀態監控、檢視、異常警示與處理、資源使用分析與預測,以及組態調整或升級建議等一系列服務。

Active IQ的資安防護措施

由於Active IQ的基礎,是藉由AutoSupport上傳用戶端設備資料,由此衍生的疑慮,便是資料上傳的安全性,上傳的資料可能外洩,而資料上傳的通道也可能成為入侵的管道,所以NetApp也在不同環節採取了防護措施。

首先,用戶可以選擇遮蔽部份AutoSupport上傳資訊,刪去其中的識別性資訊(如內部網址、裝置名稱等),只上傳非識別性的環境運作資訊(日誌與參數資料等)。

其次,AutoSupport的資料上傳可使用加密的HTTPS協定。

第三,NetApp用於Active IQ服務的資料中心,擁有ISO/IEC 27001認證的資安防護,有助於保護用戶上傳的資訊不至外洩。

Active IQ的資料傳輸

AutoSupport的資料上傳可支援HTTPS或SMTP協定,將訊息發送到NetApp的Active IQ資料庫、用戶端管理者,以及對應的協力廠商。為確保資料安全,NetApp建議採用加密的HTTPS協定。(圖片來源/NetApp)

 

Active IQ的雲端控制臺

總體儀表板

提供了用戶端NetApp儲存環境的總體狀態,整個頁面由上到下分為4個欄位,最上面一排列出了高風險事件、警示與服務合約到期日等資訊;中間欄位左方是整個儲存環境的資產統計,右方是容量預測資訊;最下面2個欄位則提供支援合約更新、儲存效率統計、系統風險評估與建議、追蹤案件等資訊。

雲端管理控制臺是用戶存取Active IQ所有應用功能的入口,Active IQ的所有服務,都是透過雲端控制臺向用戶提供。

Active IQ經由AutoSupport所收集到的用戶端儲存設備資訊,經分析、彙整後,再透過雲端控制臺的網頁式介面,以圖形化儀表板方式呈現給用戶。而Active IQ後臺提供的各式分析與自動建議功能,也是透過雲端控制臺介面來操作。

除了被動接收Active IQ的資訊外,用戶也能針對升級或其他需求,透過Active IQ雲端控制臺通報NetApp原廠。

Active IQ提供了總體儀表板與系統儀表板兩種基本控制臺介面。登入後的Home首頁,便是總體儀表板,可以從這個單一檢視畫面,總覽整個用戶端的NetApp儲存環境狀態,包括系統健康狀態、容量預測與空間效率、效能與保謢狀態,以及支援服務合約的到期日,與系統升級建議訊息等資訊。用戶也能將這些資訊輸出為PDF或CSV格式的報表。

若用戶想要得知個別儲存系統的狀態,則可切換到該系統的系統儀表板(System Level DashBoard),檢視個別系統的組態資訊、健康狀態與容量效率等訊息,不過Active IQ目前能檢視的資訊,還只有儲存設備層即,不像HPE與Pure Storage的同類平臺已能檢視到VM層級資訊。

由於Active IQ可以橫跨支援NetApp旗下多個產品線,而不同產品的架構、規格與功能都有所差異。所以Active IQ在對應不同NetApp產品時,所提供的功能與畫面也有所區別。例如E與EF系列是傳統的雙控制器儲存陣列,也沒有重複資料刪除功能,所以在Active IQ的控制臺介面中,便沒有ONTAP系統的Cluster相關頁面,在計算容量效率時,也沒有考慮重複資料刪除功能。

除了標準的網頁介面外,Active IQ也提供了iOS與Android兩種行動平臺下的行動App控制臺。行動App版的Active IQ控制臺,也提供了檢視整個儲存環境到個別系統的狀態資訊,以及分析、自動建議等功能,可以讓用戶更容易地使用Active IQ的服務。

系統層級儀表板

提供儲存環境中個別系統的資訊,由上到下分為3個欄位,最上面一欄是高風險事件、警示、升級建議與支援合約狀態;中間欄位左邊是系統組態資訊,右邊是容量預測資訊;下面欄位則是系統風險與儲存效率資訊。

App行動儀表板

行動App版的Active IQ主頁面,是總覽整個系統狀態的儀表板,包含了資產統計、高風險事件、升級狀況與已開立案件等資訊,可從中點選進入個別系統的頁面,並啟用升級分析建議等服務。

 

Active IQ的分析與自動建議服務

多樣化的儲存資源分析工具

Active IQ透過總體與系統層級儀表板介面,提供了容量預測、系統風險評估、以及升級建議等工具,可幫助用戶解決容量耗用、系統健康狀態與軟體升級等問題。

類似其他同類平臺,藉由用戶端持續上傳的系統資訊,Active IQ能夠分析與預測用戶端的儲存資源使用狀態,並為用戶端提供升級建議。Active IQ可透過稱作Community Wisdom的AI輔助機制,每天從全球30萬臺設備上收集的超過200萬個資料點,在NetApp資料中心利用機器學習等分析方法,建立針對不同應用情境的最佳實作模型,為用戶提供諮詢。

Active IQ的自動化分析與建議功能,可大致分為3個類型:

(1)系統風險評估與建議:依據自動化診斷結果,在總體儀表板介面中提供了高風險事件警示,以及系統風險預測。Active IQ可針對診斷出的高風險事件,分別提出影響評估,以及解決辦法的建議。

(2)容量預測:預測用戶的儲存容量使用情況,並列出已經達到90%容量耗用、或將在1~6個月內達到90%容量耗用的系統,用戶還可以在容量預測工具頁面中,向NetApp原廠發出擴充容量需求的申請。

(3)系統擴展與升級建議:透過控制臺頁面的升級建議(Upgrade Advisor)功能,為個別系統產生系統軟體的升級計畫。針對NetApp HCI超融合系統,還能提供整個超融合應用環境的擴展升級規劃,包括具體的升級型號、數量等,然後向NetApp原廠與協力廠商發出需求申請。

自動化系統擴展建議

搭配NetApp HCI超融合系統時,Active IQ提供了自動化的擴展建議工具功能,可依照用戶設定的升級目標,產生具體的升級組態建議,包括擴展的超融合伺服器型號、數量等具體指引資訊。

系統健康趨勢與風險分析與建議

透過Active IQ控制臺的健康趨勢分析工具(Health Trend),可以追蹤關於系統健康、資安效能等方面的風險。而透過風險建議工具(Risk Advisor),則可針對風險事件逐議列出評估結果,以及解決方法的建議。

 

產品資訊

NetApp Active IQ

●原廠:NetApp(02)8729-5000

●建議售價:廠商未提供

●支援儲存產品:SolidFire SF系列快閃儲存陣列,FAS/AFF系列儲存陣列、E/EF系列儲存陣列、StorageGRID物件儲存系統,Cloud Backup、Cloud Volumes與NetApp HCI

●主要服務:儲存設備雲端集中監控,自動化系統健康診斷,故障自動報修, 儲存資源使用分析與預測,自動化升級建議


Advertisement

更多 iThome相關內容