長期以來,中央處理器(CPU)運算效能的增長,是企業資料中心x86伺服器世代交替的關鍵,例如,在2017年,Dell EMC的PowerEdge系列發展到第14代、HPE的ProLiant系列發展到第10代,都跟英特爾Xeon處理器平臺的更迭有密切關係,然而,近幾年,這樣可預期的推陳出新規律,已經被打破了──直到英特爾在2020年發表第3代Xeon Scalable系列處理器,幾個大型品牌的伺服器廠商,至今都未跟進推出新世代的機型。
為何會這樣?是因為英特爾推出新款伺服器處理器的速度太慢?資料中心運算技術架構發展重心發生重大轉變?通用伺服器的市場需求到達瓶頸?或許有些分析師能提出解答,但就我們這幾年持續報導相關新聞的角度來看,有更多運算廠商浮出抬面,受到用戶與合作廠商青睞。
舉例來說,資料中心處理器的發展不再獨尊英特爾。隨著AMD陸續推出3代EPYC,IT市場與媒體關注的焦點開始轉移,而且他們提出的規格也引發關注,例如,提供更多運算核心的選擇(第1代EPYC可達32顆,第2代、第3代EPYC是64顆),而I/O介面PCIe 4.0的採用,也是他們率先推動。
而除了Intel Xeon、AMD EPYC這兩種採用x86架構的中央處理器,採用RISC架構的Arm處理器,也開始在高效能運算(HPC)、公有雲服務等領域崛起。例如,在2020年6月,由日本理化學研究所與富士通共同開發的Fugaku奪得全球500大超級電腦第一名,並在11月繼續蟬聯冠軍,而這套系統就是採用Arm架構處理器;公有雲業者AWS基於Arm架構與Neoverse核心的設計,陸續發展出Graviton、Graviton2處理器,並以此推出多種EC2執行個體服務。
在此同時,IT產業對於加速運算技術的發展與應用,更是如火如荼。例如,Nvidia持續發表資料中心等級的高性能GPU,像是Tesla P100、Tesla V100、A100,不只是引領GPU架構的世代變革(Pascal、Volta、Ampere),隨著他們基於這些GPU推出整合式AI應用設備DGX系列,也開創了新一代GPU伺服器(HGX系列)、GPU加速的融合式基礎架構(DGX POD),甚至是超級電腦的參考設計(DGX SuperPOD)。
不只是將GPU用於資料中心的大數據分析、機器學習訓練等加速運算處理,Nvidia還將GPU拓展成多種專屬加速卡,像是針對機器學習推論(inference)的T4,之後,又基於這張推論加速卡,以及搭配Arm處理器與Nvidia GPU的單板電腦,像是Jetson系列,建構了EGX平臺,以此支援多種產業的邊緣運算應用需求。
隨著GPU市場需求聲勢的水漲船高,基於FPGA晶片的加速技術,也受到資料中心領域的重視,尤其是前幾年,正值5G通訊走紅,帶動電信業IT基礎架構的軟體定義技術變革,為了提供軟體定義網路(SDN)、網路功能虛擬化(NFV)、更好的效能,透過SmartNIC來卸載運算負擔的作法,因此受到關注,IT廠商也基於FPGA、DPU/SPU等加速運算技術來發展這類產品。
以FPGA而言,英特爾與賽靈思這兩家廠商都陸續推出鎖定資料中心應用的加速卡,可涵蓋串流資料分析、視訊轉碼,而且,也都為SmartNIC設置專屬機型。賽靈思去年還推出了基於FPGA的運算型儲存裝置(CSD),能夠在伺服器的固態硬碟儲存,就近進行運算處理。
上述加速運算產品雖然如雨後春筍出現在市場,但似乎離企業主流IT應用需求,還有一些距離,然而,去年9月VMware與Nvidia共同宣布Project Monterey,將讓企業有更多機會,將加速運算技術用在分攤伺服器虛擬化平臺主機的負載,而且是能處理儲存、資安、網路的作業,而不只是像現在僅能用於卸載網路連線處理,以及GPU相關的運算負擔。若能實現這樣的目標,原為輔助運算的FPGA、DPU/SPU,可望搶進更核心、更通用的企業IT領域,而不只是針對特殊用途。
專欄作者
熱門新聞
2024-10-05
2024-10-07
2024-10-07
2024-10-07
2024-10-07
2024-10-07
2024-10-07