為了加速企業數位轉型,採用高效能運算與人工智慧應用系統,已成為逐漸許多公司所認可的作法,而針對這樣的IT發展趨勢,HPE在2017年11月發表了多種解決方案,而其中最吸引眾人目光的產品,就是該公司首款基於Arm架構的高效能運算系統(HPC System),稱為Apollo 70 System,整合了HPE多種伺服器管理技術,可搭配他們發展的軟體,支援系統建立、叢集管理與效能監控等功能。

基本上,這套伺服器系統,是專為記憶體密集型的高效能運算工作負載所建構的產品,當中採用Cavium的64位元Arm處理器ThunderX2,因此,在記憶體資源的應用上,最高可支援8通道存取的規格,而讓這套Arm伺服器獲得比x86伺服器更高的記憶體頻寬(6通道)。

而在Apollo 70 System發布當時,HPE也提到,其他合作夥伴將以這套產品搭配伺服器作業系統,像是Red Hat Enterprise Linux、SUSE Linux Enterprise Server for ARM,以及Mellanox的InfiniBand與乙太網路解決方案,協助用戶建構高效能運算環境。

從硬體規格來看,Apollo 70 System本身是一臺高密度伺服器,採用的2U尺寸的機箱Apollo z70 8LFF Chassis,前端面板可安裝8臺3.5吋SATA硬碟或SSD,後側可置入多臺Arm架構的2路伺服器節點,像是4臺1U尺寸的AR44z,或是2臺2U尺寸的AR64z,並且搭配2臺1600瓦的80 Plus白金級電源供應器,以及8臺新一代的單轉子風扇。這些運算節點本身還可支援熱插拔,提供更大的維護與管理彈性。

       

而上述HPE運算節點搭配的Cavium ThunderX2處理器,也有兩種選擇:32核心的CN9980-2200,或是28核心的CN9975-2000,因此,整臺機箱最多可提供256顆處理器核心(32 x 2 x 4)。在記憶體的配置上,AR44z和AR64z均設置了16條插槽,可支援DDR4-2666與的規格,最大能提供512GB的容量(16 x 32GB)。而網路介面的部份,它們則是內建了2個SFP+接頭的10GbE埠(Mellanox CX4 LOM)。

若基於Apollo 70 System這樣的機箱與伺服器配置,來衡量大量部署時的運算資源規模,我們可以得出下列結果:每一座標準42U機櫃,最多可安裝20臺Apollo 70 System,而能提供80臺Arm伺服器節點,以及5120顆運算核心。

Apollo 70 System上市至今,也已經累積了一些使用案例。像是HPE與美國能源部、Sandia國家實驗室,在2018年6月宣布合作,主要目的是發展全球最大型的Arm架構超級電腦,名為Astra,將用於美國能源部國家核子安全總署(NNSA)的Vanguard計畫,針對國家安全、能源、科學等領域,執行進階建模與模擬的工作負載。

經由該項計畫,將會評估新興高效能運算架構,是否能作為實際支援NNSA任務的生產力平臺,舉凡整體安全性的強化,以及美國核子武器儲備的防護與有效性。

而Astra部署的位置是在Sandia國家實驗室,由多臺HPE Apollo 70 System設備搭建起來,根據當時的規畫,會基於這款產品的2U、4節點的高密度配置,架設2,592臺的2路運算節點,每臺節點搭配2顆Cavium Thunder-X2的28核心Arm處理器(CN9975),整座超級電腦可提供14.5萬個以上的運算核心(28x2x2592=145,152)。

若以機櫃設置的角度來看,Astra總共包含了36座運算機櫃,而每座機櫃(42U)置入18臺Apollo 70機箱(36U),等於可提供72臺運算節點(36x72=2592)。

而在全球500大超級電腦的排行榜當中,Astra在2018年11月拿下204名(125,328個核心、1,529.0 TFLOPS),今年6月拿下156名(138,096個核心、1,758.0 TFLOPS)。

產品資訊

HPE Apollo 70 System
●原廠:HPE(02)2652-8700
●建議售價:廠商未提供
●機箱尺寸:2U
●組成元件:Apollo z70 8LFF機箱,搭配HPE AR64z節點或HPE AR44z伺服器節點
●處理器規格:2顆Cavium ThunderX2 (CN9975-2000或CN9980-2200)
●記憶體:16個DDR4插槽(最大為512GB)
●儲存配置:8臺3.5吋硬碟(可搭配8TB硬碟或1.92TB SSD)
●網路介面:2個10GbE埠
●電源供應器:2臺1600瓦(1+1備援)

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】

熱門新聞

Advertisement