以InfiniBand與乙太網路交換器與網路卡著稱的Mellanox,旗下其實也有管理軟體類型的產品,像是用於InfiniBand運算環境的Unified Fabric Manager(UFM),以及網路調度指揮平臺NEO,而今年4月底完成併購該公司程序的Nvidia,在6月底發表了Mellanox UFM Cyber-AI 平臺,就是從UFM發展而來的產品,當中將運用基於AI的分析能力來偵測資安威脅與營運問題,並且預測網路故障,以便針對採用InifiBand網路技術的資料中心環境,將停機時間減至最低。

Nvidia表示,這套解決方案是既有UFM平臺產品系列的延伸,將導入AI來學習資料中心的運作步調與網路工作負載模式,也一併擷取即時與歷史遙測與工作負載數據。而有了這樣的基準線,UFM Cyber-AI得以追蹤系統的健康狀態與網路異動狀況,並且偵測效能下降走勢、用量起伏與組態變更。

UFM Cyber-AI若察覺異常系統與應用系統的行為,以及潛藏的系統故障與資安威脅,可發出警示,以及採取修正的動作。如果有人嘗試侵入系統執行惡意應用程式,像是數位貨幣挖礦,這套平臺也會發送資安警報。

UFM分為三種版本,因應不同的網管功能需求

就產品功能搭配與包裝而言,UFM將區分為3種等級:基本款UFM Telemetry、中階款UFM Enterprise、高階款UFM Cyber-AI。

首先,UFM Telemetry提供網路驗證工具,能夠監督網路效能與運作狀況,即時擷取豐富的網路遙測資訊(交換器、網路卡、網路線),以及應用程式工作負載的網路用量、系統組態等,可執行網路效能測試與系統驗證,並且持續傳輸送至企業內部建置或位於雲端環境的資料庫,以便後續進一步分析。

接著是UFM Enterprise,它包含UFM Telemetry所有功能,並添加多種特色,像是強化的網路監控管理、工作負載最佳化,以及定期組態檢查,也提供豐富的網頁圖形管理介面、進階的統計報表產生機制、廣泛的REST API。

在網路監控的應用上,這個版本提供自動化網路探查與驗證、網路線安全管理、壅塞追蹤與流量瓶頸識別,同時,還支援工作排程的自動產生機制,可整合Slurm、Platform LSF這兩大工作負載調度與管理平臺,以及網路自動設置,可在OpenStack、Azure Cloud、VMware等IT基礎架構使用。

至於UFM Cyber-AI,包含UFM Telemetry、UFM Enterprise的所有功能,它可基於長期擷取的豐富遙測資訊,運用深度學習演算法,來持續了解資料中心的「心跳」、運作模式、遭遇的各種狀況、資源用量,以及工作負載的網路特徵,能夠藉此構建一套儲存大量遙測資訊的資料庫,協助發現事件之間的交互關連,並且提升預測準度。

對於經年累月的網路效能下滑、用量與組態變更,這樣的平臺也能夠偵測出來,並且警示異常的系統與應用程式行為,以及潛在的系統故障狀況,及早實施預防性維修,此外,還能執行各種修正動作。

 

從扮演支援角色的產品,逐漸發展成可獨當一面的平臺

整體而言,UFM Cyber AI的推出,讓業界重新認識了UFM的價值。但在此之前,這套產品已歷經將近10年的發展。

早在2011年5月Interop Las Vegas大會,Mellanox就推出了UFM,但當時該公司主打SX1000系列的10GbE/40GbE交換器,以及ConnectX-2乙太網路卡、QSFP銅線與光纖纜線,UFM成了配角。

到了隔年11月,Mellanox推出整合應用設備UFM-SDN,強調軟體定義網路支援的搭配,裡面也採用了UFM軟體的4.0版,可增進網路互連管理的有效性,能夠記錄監控歷程,將效能與狀態資訊存放在個別的資料庫,以利持續追蹤,這裡也提供多站點管理的功能,企業可透過單一、集中的管理主控臺來監督多個站點的狀態。

UFM軟體這個版本也提供新的部署形式,能以整合應用設備來販售,當中搭配了MLNX-OS的使用介面,而MLNX-OS正是Mellanox InfiniBand交換器的作業系統。Mellanox也推出多款UFM-SDN Appliance機型,來管理不同規模的節點叢集。

在2016、2017年,IBM和Mellanox合作,於是在IBM旗下出現了UFM for Power Systems伺服器(裡面採用Xeon E5-2630處理器),有兩款機型,分別是:8867-FM1、8867-FM2,可協助大型資料中心IT人員,針對運算與儲存系統互連基礎架構,進行更有效率的監控、設置、維運。

產品資訊

Nvidia Mellanox Unified Fabric Manager
●原廠:Nvidia Mellanox
●建議售價:廠商未提供
●解決方案類型:UFM Telemetry、UFM Enterprise、UFM Cyber AI(包含UFM Telemetry與UFM Enterprise)
●部署形式:軟體、應用設備、Docker container
●軟體安裝作業系統需求:RHEL/CentOS 7、SLES 12/15、EulerOS 2.0 SP2/SP3
●應用設備硬體配置:1U伺服器搭配ConnectX-6 200Gb/s InfiniBand網卡

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】


Advertisement

更多 iThome相關內容