Arm

談到Arm處理器,多數人的既定印象可能都是用於智慧型手機或物聯網裝置,然而,由於其具備省電、高效能的特性,早在十年前,就開始有廠商想要基於這個架構,發展伺服器等級的處理器,像是ZT Systems、Calxeda、AppliedMicro、Cavium、Broadcom、Qualcomm等公司,都曾著手進行,但大多因中途取消或後繼無力,而遲遲無法建立整個Arm伺服器生態體系。

不過,到了2018年10月情況開始改觀,因為Arm決定親自出手,發展這部份的技術智財與推動相關業務──他們推出一個新的產品線,稱為Neoverse,但他們的目標不僅是打造高效能、低功耗的伺服器平臺,而是希望能夠提供生態系統,使其建構一系列橫跨雲端服務到邊緣運算(cloud to edge)的產品。當時,雲端服務當紅,而邊緣運算正要崛起,因此,如果是軟體、雲端業者,或是兩大處理器平臺廠商喊出這樣的口號,還算合理,但過去從未親自涉入如此廣大領域的Arm,竟喊出這樣的口號,不免讓人懷疑是否真的可行。

時至今日,他們提出的應用案例已能回答這個問題。首先,公有雲龍頭業者基於Neoverse智慧財產,設計出兩代處理器,而以此推出多個執行個體服務;再加上日本理化學研究所的超級電腦「富岳」(Fugaku),憑藉著富士通發展的Arm架構處理器A64FX,在2020年6月一舉拿下全球500大超級電腦榜首,震撼整個IT界,而至今這座超級電腦仍蟬聯冠軍寶座,也在在證明了Arm架構在高效能運算領域的確是表現不凡。

就技術而言,最晚進入市場的Arm伺服器平臺,在新規格的採用上,也比較沒有顧忌和包袱,當然,當用戶將這些設計實作成處理器時,還是要根據系統或服務承載需求來考量。

以2019年2月登場的N1平臺(代號為Ares),以及E1平臺而言,一推出就是64位元運算架構,而且是採用7奈米製程、支援PCIe 4.0介面,前者的設計可支援4到128顆核心,後者則支援100 Gbps的網路處理能力。相較之下,市場上現行的處理器廠商,過去都花了不少時間,才在這幾年間推出具備部分上述規格的產品。

相隔兩年之後,Arm在今年4月發表的V1平臺(代號為Zeus),以及N2平臺(代號為Perseus)當中,又繼續將規格推升到新的高度。例如,均可導入5奈米製程,而且支援PCIe 5.0介面與DDR5記憶體。

|Arm Neoverse公布最新發展藍圖|從2018年宣布推出Neoverse產品線,Arm至今已發布兩次平臺更新,第一次是2019年登場的N1與E1,第二次是今年發表的V1與N2。從歷代規格的演進,可看出Arm最大的優勢在於可以導入最新的處理器製程,以及記憶體、I/O介面規格。(圖片來源/Arm)

定出每個世代平臺效能增長目標是30%,打破多年來的業界慣例

Arm最初發表Neoverse之際,曾列出他們規畫的4個處理器平臺世代發展藍圖,並表明到2021年之前,每年、每一世代的效能提升幅度將會是30%,並將一路從16奈米製程走向7奈米製程、5奈米製程。

在IT業界,我們很少看到廠商膽敢提出這樣的承諾,因為根據過往經驗來看,每一世代處理器的效能增長幅度是難以預期的,總要等到廠商正式發布產品之後才能見真章,而Arm居然勇於對市場提出這樣的目標,實屬罕見。

若從現在回顧過往Arm是否兌現對於Neoverse的發展承諾,至少在前次與這次世代交替的過程中,他們都提出了新平臺效能增長比例,符合、甚至超越當初的規畫預期。

以2019年推出的N1為例,比起2018年Neoverse第一代的16奈米製程Cosmos平臺(相當於Arm處理器平臺Cortex-A72),N1在整數運算效能提升了60%,關鍵雲端作業負載效能也提高2.5倍。Arm同時推出的另一款E1,比起Cortex-A53平臺,可提供7倍的效能、2.4倍的每瓦效能。

而2021年發表的V1,相較於N1,新登場的V1整體效能提高50%,針對各種層面的工作負載增長了1.8 倍,在機器學習工作負載的效能,則是提升4倍。

另一款同時發表的N2,是率先採用Armv9架構的Neoverse產品,在單執行緒的效能上,比起N1,可提升40%。在超大規模雲端環境中,若N2用於網站伺服器Nginx,相較於N1,效能增長1.3倍。

另外,在供電吃緊與空間侷促的邊緣,以及5G應用場域中,比起N1,N2對DPDK封包處理速度,可快上1.2倍。

從雲端服務突圍,SmartNIC/DPU也開始搭配

Neoverse幾年前之所以開始受到IT界的關注,AWS應該是最大功臣。因為他們在2018年11月底舉行的年度用戶大會上,宣布推出第一款基於Arm架構的執行個體服務:EC2 A1系列。他們標榜這當中採用自行設計的Graviton處理器,然而,公有雲業者發展自家專用的處理器、加速器晶片,並不是新鮮事,若採用Arm架構,也在眾人的意料之內,然而,這卻是Neoverse初試啼聲。

根據Arm官方部落格當時的文章指出,這款由Annapurna Labs設計的AWS Graviton處理器,其實就是基於Neoverse Cosmos平臺而成。

一年過後,AWS發表Graviton2處理器,並推出M6g 、C6g 、R6g 等3個系列執行個體服務,分別對應通用型工作負載、運算最佳化型工作負載、記憶體最佳化型工作負載。而Graviton2採用的正是這一年推出的Neoverse N1平臺。

而Arm在2021年上半發布Neoverse V1與N2的同時,也揭露更多公有雲業者將基於Neoverse處理器或平臺,推出執行個體服務。例如,Oracle Cloud Infrastructure(OCI)、阿里雲。

果不期然,OCI在5月底宣布,正式啟用執行個體服務Ampere A1 Compute,當中採用Ampere公司的Altra處理器,而CPU裡搭配了Arm Neoverse N1核心。阿里雲則是在ECS ARM執行個體服務採用Neoverse N1,4月公布測試結果。

在Arm這波宣布的Neoverse案例裡面,有個最近也受到熱烈關注的企業IT產品,那就是DPU。

Arm表示,Marvell公司將會基於Neoverse N2平臺,推出OCTEON系列的網路解決方案,預計今年底開始小量出貨,相較於OCTEON前代的網路解決方案,可獲得3倍的效能提升。

而在6月,Marvell也宣布,OCTEON 10 DPU將採用5奈米製程,以納入Neoverse N2平臺,預計可獲得3倍效能提升與50%的省電幅度。

|Neoverse V1的兩大特色|在Arm現有的處理器設計中,Neoverse V1是他們實現效能第一理念下的產品,當中提供最寬闊的微架構,以便在執行過程中能夠容納更多指令,如此可因應高效能運算,甚至ExaFLOPS等級的運算需求。(圖片來源/Arm)

|Neoverse N2提供專屬運算資源|N2最顯著的特色在於單一執行緒效能,以及每瓦效能的表現。而比起前一代平臺N1,N2在單執行緒的效能可提升40%。為何能有這樣的改進幅度?因為N2能讓每個執行緒對應單一核心來執行,而傳統處理器對於執行緒的資源採用共享的方式配置。(圖片來源/Arm)


熱門新聞

Advertisement