【Arm伺服器平臺的兩大陣營】目前市面上的Arm架構伺服器CPU分為兩大類型,一種是雲端服務廠商自行開發、用於自家資料中心,另一種則是由CPU廠商開發的Arm處理器,可供應雲端服務與伺服器廠商使用。 圖片來源/Arm

關於公有雲資料中心底層環境的伺服器處理器平臺,長期以來,都以x86架構為主,仰賴英特爾與AMD的CPU,僅有少數業者額外提供基於Power架構伺服器而成的服務。

這段期間,雖然有些硬體晶片廠商與伺服器廠商試圖發展Arm架構的伺服器,市面上也出現幾種類型產品,例如:支援小型、輕量運算需求的單節點嵌入型設備,用於高效能運算(HPC)領域的多節點伺服器,可惜因為相關公司的產品發展路線改變,合作廠商生態系統的規模拓展速度緩慢,種種因素使得這類解決方案陷入幾年的停滯。

直到2018年底,這個困局終於出現解開的曙光,那就是公有雲龍頭業者AWS在年度用戶大會期間突然宣布消息,表示他們設計Arm架構處理器Graviton,並且以此建置EC2執行個體服務A1系列。

相隔一年後,AWS預告將推出第二代Graviton處理器,並以此提供3種用途的執行個體服務:M6g系列、C6g系列、R6g系列,分別對應一般用途、運算最佳化、記憶體最佳化等產品定位。

到了2020年中,AWS陸續發表這些產品,下半年又拓展更多用途的Arm執行個體服務,例如因應暴量效能需求的T4G,同時,他們也宣布關聯資料庫服務RDS的底層運算平臺可改用C6g系列、R6g系列,踏出AWS其他雲端服務也能選用Arm執行個體服務的第一步,強調用戶可獲得更佳的單位成本效能。

2021年AWS發表更多基於Graviton2的執行個體服務,並陸續宣布旗下多款雲端服務可支援或搭配Graviton2處理器,並於年底的用戶大會預告將推出第三代Graviton處理器,以及以此建立的執行個體服務C7g系列。到了今年5月,基於Graviton3而成的C7g系列正式推出。

至此,各界見識到AWS持續發展Arm架構處理器的企圖心,而非玩票或標新立異,而是提供自家服務內容的多樣選擇,幫用戶與AWS本身省錢之餘,面對左右IT基礎架構的兩大處理器廠商,想必也增加了更多談判籌碼。

除AWS開發Arm架構伺服器級處理器,推出多款執行個體服務,與其競爭公有雲市占的微軟Azure,今年4月宣布推出6款Arm架構執行個體服務預覽版,搭配的處理器是安培運算(Ampere Computing)發展的Altra,再掀公有雲採用Arm架構及Arm伺服器的話題。

AWS自行設計的兩代Arm處理器

公有雲龍頭AWS打破Arm伺服器應用困局!他們在2018年底宣布自行發展Arm處理器Graviton,並推出執行個體服務,兩年後,他們基於二代Graviton,推出多項支援不同用途的執行個體服務,幫業者與用戶提供省錢新選擇。圖片來源/AWS

軟體就緒:兩大企業級Linux系統廠商與VMware均支援Arm

公有雲業者若要導入Arm運算架構,進而提供各種內外部的IT服務,首先要關注的系統軟體平臺能否充分支援。

事實上,從32位元Arm架構盛行的時期開始,Linux核心就已陸續支援,而企業級Linux作業系統對Arm的支援,是這十年內就緒。至於伺服器虛擬化平臺,開放原始碼的Xen、KVM,在2012、2013年支援Armv7,而商用領域的VMware ESXi/vSphere對Arm的支援,目前以發布社群早期試用版本的形式,持續推動支援Arm的工程。

Red Hat

2014年Red Hat針對Arm合作夥伴推出早期存取計畫,希望強化廠商合作,以及64位元Armv8-A架構的系統設計。隔年,他們推出Red Hat Enterprise Linux(RHEL)Server for ARM 開發預覽版,供硬體晶片廠商Cavium、Qualcomm,以及伺服器廠商HPE搭配。

2017年Red Hat與Cavium、HPE在6月的國際超級電腦大會,公開展示RHEL支援64位元Armv8-A架構,同年11月,Red Hat預告將推出RHEL 7.4 for ARM,搭配HPE的多節點伺服器Apollo 70。

到了2018年上半,7.4版與7.5版的RHEL for ARM陸續登場;同年10月底發布的RHEL 7.6,也將64位元Arm架構併入主要支援的運算平臺,不再發行獨立版本。或許是基於這樣的支援,AWS年底順勢推出Arm執行個體服務EC2 A1,Red Hat也在AWS提供的RHEL 7.6系統映像的名稱當中,特別標示支援Arm。

SUSE

另一家Linux作業系統大廠SUSE,最初在OpenSUSE社群提供Arm支援,2015年正式擴充合作夥伴計畫,目的是開發64位元Arm伺服器的應用。隔年6月,他們推出SUSE Linux Enterprise Server(SLES) for ARM,是第一款強調64位元Arm架構最佳化的商用Linux,也是SUSE Linux Enterprise 12共通程式碼基礎的一部分,預計支援AMD、Applied Micro、Cavium、NXP、Xilinx等廠商的系統單晶片(SOC)。

到了2018年上半,SUSE先後發表SLES for ARM的12 SP3版與15版,而能陸續支援多種Arm架構系統單晶片,例如:單板電腦Raspberry Pi 3 Model B,以及安培運算(Ampere Computing)買下Applied Micro業務而得到的64位元Arm伺服器CPU:X-Gene 1與X-Gene 2。同時,HPE Apollo 70也成為首款通過HPE認證的Arm系統,可執行SLES 12 for HPC與SUSE Enterprise Storage軟體。

2019年1月,SLES for ARM 15正式推出,SUSE列出支援的9個品牌、共14款的Arm架構系統單晶片;同年6月發布的SLES for ARM 15 SP1,支援品牌達到11個(新增華為、Mellanox、Socionext,海思半導體未列入)。此外,這一年的4月,SLES for ARM也登上公有雲AWS環境,支援他們在2018年底推出的Arm執行個體服務EC2 A1。

下一個版本SLES for ARM 15 SP2於2020年7月推出,宣布支援幾款近期相當知名的Arm架構系統單晶片,例如:AWS第二代自製處理器(Graviton2)、Fujitsu用於多次蟬聯500大超級電腦榜首「富岳」的A64FX,以及安培運算這年發表、現有多家伺服器廠商搭配的80核處理器Altra;而在伺服器的部分,則有Fujitsu的F700、Nvidia的Tegra X1與Tegra X2,以及Raspberry Pi的3A+、Compute Module 3B+、4等產品,通過SUSE認證。

2021年6月,SUSE發布SLES 15 SP3,在Arm架構系統單晶片支援清單中,增加了Nvidia的Xavier,以及BlueField-2。

VMware

關於系統軟體對Arm伺服器的支援,有了兩大企業級Linux作業系統持續投入,使得Arm能夠拓展更多軟體與雲端服務應用,然而,在企業資料中心環境普遍採用的伺服器虛擬化軟體平臺,也因為幾家廠商合作的促成,使得Arm在幾年前也完成與其搭配使用的驗證。

例如,在伺服器虛擬化軟體領域具有高市占率的大廠VMware,在2018年8月的年度用戶大會,公開展示ESXi on Arm邊緣運算應用──他們在風力渦輪發電機機組的應用情境中,以Arm單板電腦SolidRun MacchiatoBin,執行VMware的Hypervisor(ESXi),上面執行多臺監控設備狀態的虛擬機器,示範可做到線上不停機遷移vMotion,以及容錯移轉Fault Tolerance(FT)。

隔年9月,VMware展示ESXi on Arm的SmartNIC應用,將Hypervisor執行在多種Arm架構系統單晶片,如Mellanox BlueField、Marvell Armada、Raspberry Pi4,印證這類晶片的卸載/加速效果。

關於ESXi on Arm的雲端服務應用,VMware在10月公開將Hypervisor執行在AWS EC2 A1,以及由vCenter Server集中管控的操作畫面,希望拓展VMware Cloud on AWS的應用選擇(但目前仍只能搭配裸機執行個體服務i3.metal)。

關於VMware支援Arm的發展,在2020年10月舉行的Arm開發者高峰會期間,宣布成立專屬的社群早期軟體試用計畫ESXi-Arm Fling,推動ESXi Arm Edition(ESXi-Arm)發展,他們表示,將ESXi從x86移植至64位元Arm架構的工程,是幾年前就開始進行,所面臨的挑戰不只是ESXi的程式碼基礎相當龐大,也涉及許多細節的處理,包括Arm處理器底層的語意處理與x86架構差異很大,因此需要謹慎測試與修改,確保ESXi能執行在兩種運算架構之上。

同時,VMware也與Arm緊密合作,期盼透過他們推動的Project Cassini,促使ESXi-Arm可廣泛執行在各種設備,支援資料中心、邊緣運算,以及其他領域的應用。由於這項工作涵蓋了既有Arm伺服器生態系統延伸的硬體標準、韌體標準、認證,因此,也使得VMware需支援SmartNIC、Raspberry Pi等運算裝置,以及驅動程式的發展。

截至目前為止,ESXi-Arm最新版是今年3月發布的1.9版,雖然目前無法得知商用版本正式推出的時程,但值得注意的是,在2021年10月VMware年度用戶大會,他們針對OCI公有雲的Arm架構裸機執行個體服務Ampere A1,展示安裝與啟動ESXi-Arm之後的狀態。

Ampere揭露Arm處理器發布時程

公有雲或企業資料中心若要導入Arm架構,可直接採用現成的Arm處理器與伺服器產品,目前多數廠商搭配的CPU是Ampere Computing在2020年推出的80顆核心Altra,而在2021年,該公司接續發表128顆核心的Altra Max,未來將持續提升記憶體頻寬與I/O頻寬。圖片來源/Ampere Computing

硬體就緒:Arm與多家廠商積極合作,壯大雲服務與伺服器生態系統

有了日趨廣泛、成熟的系統軟體支援,Arm架構要能支撐公有雲業者龐大的服務規模需求,需要有效能強大、持續改良的硬體晶片,以及與時俱進的高性能、高延展性系統架構作為基礎。

關於上述要求的達成,由於Arm更積極拓展雲端服務與伺服器的應用生態,再加上多家晶片廠商投入,大幅推動相關產品開發與市場需求,於是,從2018年起,Arm伺服器發展步上正軌。

關於Arm伺服器的發展,雖然有廠商投入,但成長步調相當緩慢,直到2018年10月有了大轉變,因Arm對5G網路與一代雲端服務至邊緣運算應用,特別揭示專屬發展藍圖,以及全新品牌的基礎架構智慧財產,並將這類解決方案命名為Neoverse,他們的目的是帶動晶片、軟體、系統的創新,協助各家廠商設計具有高效能、安全性、延展性的產品。

在這段時間,針對採用Arm架構的伺服器,他們宣布推出ServerReady相容認證計畫,這也是Neoverse發表的重頭戲之一。

他們與基礎架構供應鏈業者合作,對象包含晶片供應商、獨立韌體廠商、作業系統與Hypervisor軟體廠商、OEM廠商、ODM廠商、獨立硬體廠商,以及雲端基礎設施供應商,共同定義伺服器基礎系統架構(SBSA)規格的最低硬體需求,以及伺服器基礎啟動需求的最低韌體規範,同時,也運用所有可行的產業標準,並且建立新的Arm規格,促成不同廠商產品得以享有互通性。

而在標準驗證上,Arm與眾多廠商建立架構遵循套件(ACS),可查核伺服器產品是否符合SBSA與SBBR的要求。若要進行驗證,可由廠商或Arm支援團隊協助進行,而受測的伺服器需啟動標準作業系統與執行ACS,若通過檢測,可獲得Arm ServerReady的標章。

隔年2月,Arm發表兩種平臺,分別是:Neoverse N1(代號Ares),以及Neoverse E1(代號Helios),分別對應雲端至邊緣基礎架構,以及5G邊緣運算設備的應用需求。同年10月,Arm宣布Project Cassini計畫,希望能著重在人工智慧邊緣運算(AI Edge)這類應用的發展變革,協助整個產業在橫跨多樣、安全的邊緣運算生態系統之下,能夠持續確保雲端原生體驗的提供。

2020年9月,Arm公布Neoverse新一代解決方案發展藍圖,將硬體智慧財產分為E系列、N系列、V系列等三大平臺,而當時進入量產階段的產品,是7奈米製程的Neoverse N1與Neoverse E1,支援PCIe 4.0介面、DDR4記憶體、HBM2高頻寬記憶體、CCIX 1.0晶片互連介面。

接下來Arm推出的平臺,是Neoverse V1(代號Zeus),橫跨7奈米與5奈米製程,支援PCIe 5.0介面、DDR5記憶體、HBM2e高頻寬記憶體、CCIX 1.1晶片互連介面,以及2021年登場的Neoverse N2(代號Perseus),採5奈米製程,同樣支援PCIe 5.0介面、DDR5記憶體,但新支援HBM3高頻寬記憶體、CCIX 2.0與CXL 2.0晶片互連介面。

2022年以後,則是代號為Poseidon世代的平臺,橫跨5奈米與3奈米製程,支援PCIe 5.0與6.0介面、DDR5記憶體、HBM3高頻寬記憶體,以及CCIX與CXL下一代規格的晶片互連介面。

2021年4月,Neoverse V1、Neoverse N2正式推出,Arm同時發表網狀互連平臺Neoverse CMN-700,可針對處理器核心、快取容量、記憶體類型,以及連接的I/O裝置,提升存取效能,協助基於V1與N2而成的系統單晶片發揮成效。

而關於ServerReady計畫的推動,後續有更大規模擴充。例如,2020年10月Arm宣布SystemReady計畫,以4大方案囊括更多伺服器類型──SystemReady SR對應的是伺服器,SystemReady ES對應的是嵌入式伺服器、SystemReady IR對應的是物聯網設備、SystemReady LS對應的是LinuxBoot Server(使用LinuxBoot韌體的伺服器),此計畫將依據上述4大產品認證,明確定義出Arm伺服器與應用設備的不同樣貌,同時,這項系統就緒認證計畫,也成為建構Project Cassini計畫的重要支柱。

1年後,涵蓋物聯網與基礎架構邊緣運算的Project Cassini,參與廠商從30家增加到超過70家,參與ServerReady計畫的廠商名單,Arm也予以公布,總共有將近60家廠商,其中通過認證的廠商有13家、26款產品。以SystemReady SR為例,有Ampere、Avantek、技嘉這3個廠牌,共5款產品或參考平臺符合標準。

根據Arm今年5月最新發布的消息來看,參與ServerReady計畫的廠商達到67家公司,超過50款產品通過認證。以公有雲而言,有微軟Azure與Google;軟體平台廠商囊括三大Linux系統業者:Red Hat、SUSE、Canonical,以及微軟、VMware;處理器廠商的部分,有Ampere Computing、Fujitsu、Nvidia;至於伺服器廠商,有技嘉、HPE、浪潮、聯想、緯穎。基本上,這些廠商都是推動資料中心領域發展的重要推手。

整體而言,基於Arm架構的伺服器與雲端服務,在軟體支援與硬體供應方面已累積許多成果,展望未來,對於建置這類運算環境的企業與服務商而言,使用門檻應該越來越低 ,更有機會去運用Arm架構特有的開放性與高效能特色。

提升軟硬體支援,Arm推動認證計畫

為了持續推動軟體與硬體支援,Arm成立SystemReady計畫來統籌產品認證的事宜,目前已有67家廠商參與。圖片來源/Arm

Arm公布Neoverse的2020至2022發展藍圖

早年Arm伺服器平臺發展生態系統相對受限,2018年Arm推出解決方案新品牌Neoverse之後,伺服器與邊緣運算產品規畫逐漸有了更清楚的系統化布局,2020年下半Arm公布Neoverse三大平臺發展藍圖,讓所有人掌握運用這些平臺的系統單晶片上市時程及預計支援規格。圖片來源/Arm

 相關報導 

熱門新聞

Advertisement