【AWS自行設計的3代Arm處理器 】歷經3年多的時間演進,公有雲業者AWS設計的Arm架構Graviton處理器,已邁入第三代,基於這些處理器晶片,他們截至目前為止,總共已經推出十多種Arm執行個體服務。圖片來源/AWS

憑藉著低功耗與高效能的特性,很多廠商都對Arm架構處理器能否跨入資料中心伺服器領域,抱持著很大的期望,然而,在x86架構長期壟斷市場的局面之下,整個Arm伺服器的生態系統要成形,並不如很多人想像中來得一帆風順,早年投入此領域的廠商,有的因為被併購而改弦易張,有些廠商可能因為手上有其他更熟悉、更容易獲益的產品線,而未聚焦在伺服器領域,導致Arm運算架構只能以FPGA加速卡、DPU這類輔助加速運算產品搭配的CPU,而非以伺服器CPU的形式,進入企業資料中心領域。

不過,這個局面在3年半前開始改寫,因為,公有雲龍頭業者AWS在2018年底召開的年度用戶大會期間,突然宣布推出Arm架構執行個體服務EC2 A1,相較於該公司其他通用執行個體服務,成本節省幅度高達45%,而且,所用的處理器竟是他們自行設計的64位元Arm處理器Graviton,而非當時市面上Arm伺服器廠商所搭配的Cavium ThunderX2,自此大家不僅獲得Arm用在雲端服務的實際印證,也了解到企業與服務廠商可活用Arm硬體智慧財產、自行設計處理器,不一定要用市面上現成的Arm架構處理器產品。

歷經幾年的發展,AWS仍持續推動自行設計晶片(custom silicon)的作法,身為該公司四大半導體產品線之一的Arm架構處理器Graviton,如今發展到第三代,而採用Graviton作為CPU的EC2執行個體服務,已開設到10種以上。

除此之外,他們還有更早發展的硬體加速Hypervisor晶片Nitro System,以及專攻機器學習推論與處理加速的Inferentia、Trainium等晶片。

在這段期間,Arm伺服器CPU領域出現新的廠商Ampere Computing,在2020年、2021年先後推出了Arm架構處理器Altra與Altra Max,使得不打算自行設計CPU的伺服器廠商與雲端服務業者,有了新的選擇,也因此,從2021年起,開始陸續傳出多個公有雲服務開始採用Arm伺服器,或提供Arm執行個體服務的消息。

例如,以CDN、防DDoS攻擊服務而著稱的雲端網路與安全廠商Cloudflare,在去年3月公開評估Ampere Altra伺服器性能結果(搭配Altra Q80-30處理器),比較AWS搭配Graviton2處理器的執行個體服務,他們認為Ampere Altra伺服器具備更高效能。到了7月,他們表示將開始部署Ampere的Arm架構處理器,再次強調效能優異──就每瓦電力可處理的網際網路請求數量而言,比起搭配AMD第二代EPYC處理器的邊緣伺服器Gen X,Arm伺服器可再額外處理57%的請求。

2021年5月,公有雲業者OCI(Oracle Cloud Infrastructure)加入Arm架構行列,他們宣布推出Ampere A1 Compute執行個體服務,提供虛擬機器與裸機等兩種型態的選擇,主打特色是費用低廉(每顆CPU核心每小時為0.01美元,每GB記憶體每小時為0.0015美元),以及運算效能強大(每個執行緒可對應每顆CPU核心)。

到了2021下半,有多家雲端服務廠商釋出採用Arm架構運算平臺的消息。

例如,阿里雲在10月舉行的年度用戶大會期間,發表Arm架構處理器,名為「倚天710(Yitian 710)」,這款晶片由阿里巴巴集團的平頭哥半導體公司設計,號稱是第一款採用Armv9架構的伺服器晶片,導入5奈米製程,支援DDR5記憶體,以及PCIe 5.0介面。

到了2022年4月,阿里雲宣布新設置的Arm架構執行個體服務ECS g8m系列,開放試用申請,而根據各媒體的相關報導來看,當中採用的處理器正是去年10月發表的倚天710。

同樣在2021年10月,中國另一家公有雲業者騰訊雲也跨入Arm架構,宣布推出Arm執行個體服務「標準型SR1(Standard SR1)」,隸屬於Cloud Virtual Machine(CVM)系列運算服務產品線,Standard SR1所採用的處理器是Ampere Altra。

以網路網路交換中心(IBX)業務聞名的大型資料中心業者Equinix,2020年3月完成併購裸機系統即服務公司Packet之後,半年後結合Packet的硬體自動化供應技術,以及他們擅長的全球網路互連能力,成立新的裸機服務Equinix Metal,而在2021年底,他們預告將更新第三代服務的組態,當中提供搭配不同處理器的硬體產品線,例如,皆於2021年上半正式發表的AMD第三代EPYC系列、英特爾第三代Xeon Scalable系列,同時還有Arm架構處理器Ampere Altra的選擇。

Azure導入Arm的下一步是支援AKS

身為主要公有雲業者的微軟Azure,採用Arm處理器不只是推出執行個體服務,5月在Ampere Computing揭露公司策略與產品發展藍圖的影片中,他們不僅提到Arm執行個體服務特色,也預告將在代管容器服務平臺Azure Kubernetes Service當中,提供基於Ampere Altra的新選擇。圖片來源/Ampere Computing

AWS自造處理器邁入第三代,開拓效能與伺服器平臺新局

縱觀整個公有雲服務市場,AWS是最早自行設計Arm架構處理器Graviton,並以此推出多款執行個體服務的廠商,不過短短3年,Graviton如今已推出第3代,幾乎以1年翻新1代的速度發展,帶來的規格變革與改善成效也相當驚人。

若就Graviton與Graviton2的規格來進行比較,前者採用16奈米製程,以及Arm Cortex-A72應用處理器,電晶體總量為50億個,內建16顆核心,後者採用7奈米製程,以及Arm Neoverse N1平臺,電晶體總量暴增至300億個,內建64顆核心,每顆核心效能增至2倍,記憶體速度增至5倍。

至於最新推出的Graviton3,採用5奈米製程,以及Arm Neoverse V1平臺,電晶體總量達到550億個,內建64顆核心,支援DDR5記憶體(DDR5-4800控制器)、PCIe 5.0介面,相較於Graviton2,每顆核心效能提升25%,浮點運算與密碼學處理的效能均增至2倍,機器學習的效能增至3倍。

值得注意的是,Graviton3導入小晶片(chiplet)設計,整顆處理器是由7個晶粒所組成──1個主運算晶粒位於CPU中間,CPU邊緣有4個DRAM控制器晶粒與2個PCIe晶粒。

有別於現行部分伺服器CPU的配置,Graviton3的運算晶粒是以單體的形式存在,64顆實體核心全部坐落在同個晶粒之中,目的是讓所有核心擁有一致的記憶體存取延遲速度,而非將其揭露出來、迫使應用程式開發人員需處理本地與遠端的記憶體存取複雜度;而在記憶體資源的運用上,它會統合所有的核心與記憶體來進行配置。

在設計上,AWS主要是透過內含多顆晶片的模組(Multichip Module)形式,來進行Graviton3處理器的實作,目的是減低成本、提升收益,因應當代伺服器處理器尺寸與複雜度持續提升的狀況,利於未來Graviton能夠採用先進的製程節點,又能讓PCIe晶粒這類規格更迭速度較慢的I/O模組,維持不變。

除了晶片、封裝的架構組成,在主機板搭配方式上,AWS也針對Graviton3提出前所未見的配置,可實現業界首創的3路伺服器設計。以最新推出的C7g執行個體服務為例,每一張Graviton3主機板支援3臺伺服器的使用,而這3臺伺服器都由單個Nitro處理器來支援──1張Nitro Card可同時管理3個Graviton3。

而基於這樣的配置,每個機櫃所能容納的CPU總數可再提升50%。一般而言,單座42U機櫃,最多可容納42臺1U伺服器,原本1U尺寸的Graviton伺服器與Graviton2伺服器,皆配置2顆處理器,因此,每座機櫃最多可安裝到84顆處理器。

AWS表示,他們之所以採取這樣的配置是因為耗電考量,實務上,若以伺服器機箱裝滿整個機櫃空間之前,電力可能就不夠用了,而接下來既然要重新設計下一代伺服器的晶片、封裝,主機板的配置也可以考慮一起調整。所以,AWS決定改變策略,先設法善用更多機箱內部空間,再考量電力需求配置,於是,造就Graviton3伺服器出現3顆處理器搭配1張Nitro Card的系統組態,他們宣稱,這麼做能比其他廠商解決方案更貼近整體電力需求,而基於運算密度比過往配置更高的1U伺服器,也使得每座機櫃最多可安裝到126顆處理器,提升至傳統配置的1.5倍。

微軟引進Ampere Altra處理器,將推出Arm架構執行個體服務

當市面上出現越來越多雲端服務業者發展與運用Arm架構處理器的案例後,在今年4月,另一家大型公有雲業者微軟Azure宣布將推出Arm執行個體服務,再度為Arm躍上公有雲舞臺這股趨勢,打了一劑強心針。

他們目前在Azure虛擬機器系列,發布3個系列執行個體服務的公開預覽版本,均採用Ampere Altra處理器,運作時脈最高可達到3 GHz。透過這些虛擬機器,微軟認為可以更有效率地執行橫向擴展的工作負載、網站伺服器、應用程式伺服器、開放原始碼資料庫、雲端原生應用系統,以及.NET應用程式、Java應用程式、遊戲伺服器、多媒體伺服器。

這些開放用戶預覽的Arm執行個體服務,主要可分為3大系列:Dpsv5、Dplsv5、Epsv5,前兩個是針對一般用途,最多均可提供64顆vCPU,最後則是主打記憶體優化應用,最多均可提供32顆vCPU。

用戶若需要更低成本的執行個體服務,微軟Azure還提供未內建硬碟儲存的服務項目,例如,Dpsv5預設不搭配硬碟(沒有本機暫時儲存體)),Dpdsv5提供硬碟(本機暫時儲存體);Dplsv5預設不搭配硬碟,Dpldsv5提供硬碟;Epsv5預設不搭配硬碟,Epdsv提供硬碟。用戶可自行掛載標準固態硬碟、標準硬碟、進階硬碟(Premium SSD),未來將支援極致磁碟(Ultra Disk)

以Dpsv5與Dpdsv5這組而言,最多提供64顆vCPU,每顆vCPU可對應4 GiB容量的記憶體,整臺虛擬機器最多可配置208 GiB容量的記憶體。在工作負載類型上,Dpsv5系列可設置應用程式伺服器、小至中型資料庫、網站伺服器、微服務。

另一組Dplsv5與Dpldsv5最多提供64顆vCPU,每顆vCPU可對應2 GiB容量的記憶體,最多可配置128 GiB容量的記憶體。在工作負載類型上,Dplsv5系列可用於多媒體編碼、遊戲伺服器、小型資料庫。

Epsv5與Epdsv5最多提供32顆vCPU,每顆vCPU可對應4 GiB容量的記憶體,最多可配置208 GiB容量的記憶體。在工作負載類型上,Epsv5系列可用於記憶體密集的系統或服務,例如,資料庫、快取、分析型作業。

AWS EC2 C7g伺服器的3大特色

 2022年上半Ampere Altra伺服器平臺總覽 

AWS在2021年底宣布推出第三代的Graviton處理器,以及採用這款Arm架構CPU的執行個體服務C7g,然而,其重要的技術創新特色,不僅在於是業界率先採用Arm Neoverse V1平臺(如下圖1 ),而順勢導入5奈米製程,以及支援DDR5記憶體、PCIe 5.0介面等先進規格(如下圖2)。

 1. 晶片 

 2. 封裝 

同時,他們也在整顆處理器晶片的封裝設計方式,以及伺服器系統的主機板配置等層面,下了很大的功夫(如下圖3),因而造就業界首創的1U尺寸的3路伺服器(如下圖4),也使得單一機櫃能夠提供更高的CPU運算密度。圖片來源/AWS

 3. 主機板 

 4. 執行個體服務 

 相關報導 


熱門新聞

Advertisement