今年英特爾陸續揭曉與發表最新一代資料中心CPU與GPU的相關消息,例如,5月在2022上半年度用戶大會Intel Vision,宣布下一代伺服器處理器平臺Sapphire Rapids,正式定名為第四代Xeon Scalable;8月初與月底正式推出首款商用獨立GPU產品Arc Pro系列,以及首款資料中心GPU產品Data Center GPU Flex系列;9月底舉行的2022下半年度用戶大會Innovation期間,他們展出代號為Ponte Vecchio的旗艦級資料中心GPU成品,並宣布這款GPU與內建高頻寬記憶體(HBM)的第四代Xeon Scalable處理器(代號為Sapphire Rapids HBM),開始以刀鋒模組的型態出貨,率先供應美國能源部的阿貢國家實驗室(Argonne National Laboratory)使用,目的是建構效能領先全球的超級電腦Aurora。

  

而在11月9日、SC22超級電腦大會前夕,英特爾搶先其他運算廠商一步,公開HPC與AI產品相關消息,主角正是上述CPU與GPU——設立名為Intel Max系列的產品線,成員包含:Sapphire Rapids HBM中央處理器,定名為Intel Xeon CPU Max系列,以及Ponte Vecchio繪圖處理器,定名為Intel Data Center GPU Max系列。

根據英特爾的新聞稿指出,Intel Max系列預定上市時間是在2023年1月。其中的GPU產品,已透過刀鋒模組的形式供應阿貢國家實驗室的Aurora超級電腦;Intel Max系列的CPU產品則將提供多個超級電腦設置單位,例如:洛斯阿拉莫斯國家實驗室、京都大學。

關於與阿貢國家實驗室的合作,英特爾預告,在SC22大會期間,將共同揭露測試開發系統Sunspot,這裡面包含了128臺可用於正式環境的刀鋒運算模組,若是參與Aurora Early Science Program計畫的研究人員,在今年稍晚可開始存取這套系統。

而在Aurora超級電腦的發展上,英特爾期望能使其成為第一臺雙精度運算尖峰效能超越2 Exaflops的系統,未來也將藉此展示同時搭配Intel Max系列CPU與GPU的單一系統配置,當中使用超過1萬臺刀鋒模組,每臺模組的運算配置是2顆Xeon Max與6顆Data Center GPU Max。

除此之外,英特爾表示,目前已有多個與國家級安全與基礎研究密切相關的高效能運算系統,都將採用Intel Max系列,像是洛斯阿拉莫斯國家實驗室的Crossroads,洛斯阿拉莫斯、勞倫斯利物浦、桑迪亞這三個國家實驗室共有的CTS-2,以及京都大學的Camphor3

而在採用Intel Max系列的伺服器部分,英特爾預告,在SC22大會現場,將會展出12個廠牌、超過40款即將上市的系統設計。以Xeon Max系列而言,系統設計超過30款,響應英特爾號召的廠牌,有HPE、聯想、Dell、Supermicro、Atos、華碩、雲達、富士通、技嘉、浪潮、NEC、Hyve Solutions;而在Data Center GPU Max系列的運用上,系統設計超過15款,廠牌有HPE、Dell、聯想、Atos、浪潮、Supermicro、雲達。

揭露更多規格與效能標竿數據,以及隨之增加的驚人耗電量

關於SC22宣布的兩大新產品,英特爾在2021年8月舉行的架構日,就已公開當中所採用的技術,以及組成的重要元件,而現在則是更多規格、外形選擇、效能表現見真章的時刻。

  

Intel Xeon CPU Max系列

根據英特爾最新公布的資訊,此系列處理器最多可內建56顆高效能核心,而且這些核心是由4片晶磚所組成的,晶磚之間的相互連接,則是運用英特爾的嵌入式多晶片互連橋接(EMIB)技術,耗電量控制在350瓦以內;除此之外,這系列處理器在晶片封裝整合了64 GB容量的高頻寬記憶體HBM2/e,以及PCIe 5.0、CXL 1.1等系統I/O介面。

基於這樣的配置,Xeon CPU Max系列的每顆核心均可配備超過1 GB容量的高頻寬記憶體,足以適應最常見的高效能運算工作負載。就實際的高效能運算工作負載而言,若以 AMD EPYC 7773X為基準,Xeon CPU Max系列可提供4.8倍的效能;若以Intel Xeon 8380為基準,Xeon CPU Max系列可提供3倍的效能。

在提供同樣效能的條件之下,Xeon CPU Max系列搭配DDR5記憶體的系統,相對耗電量(Relative Power)減少幅度為63%,若Xeon CPU Max系列僅搭配HBM記憶體的系統,相對耗電量減少幅度達到68%;

而在兩種高效能運算測試標竿——全球氣象系統模擬MPAS-A、分子動力學深度學習模型開發DeePMD,Xeon CPU Max系列加速或改善幅度,可分別達到2.4倍(僅用HBM記憶體),以及2.8倍(搭配DDR5記憶體)。

  

Intel Data Center GPU Max系列

這是英特爾最頂級的資料中心GPU,鎖定高效能運算與機器學習應用等類型的大型運算工作負載,提供原生的光線追蹤加速能力,是專為科學圖解與動畫處理需求所設計的產品,最多可搭配128顆Xe-HPC架構的核心、128 GB的HBM2e記憶體、64 MB的L1快取記憶體,以及打破業界紀錄、內建高達408 MB的L2快取記憶體。

而在產品外形的部分,這裡有兩種選擇,一是雙寬尺寸的PCIe介面卡,名為Max 系列1100 GPU;另一是開放加速器模組(OAM),提供Max 系列1350 GPU、Max 系列1550 GPU等兩款機型。

  

這些機型本身也內建了53 Gb/s的序列/解序列轉換器(Serdes),可透過Intel Xe Link橋接器串聯同樣形式的Max系列GPU,例如,用戶可串聯4張PCIe介面卡形式的Max 1100,或是8臺OAM形式的Max 1350、Max 1550。

在系統運算單元與耗電量等規格配置上,Max 1100搭配56顆Xe-HPC架構的核心與48GB的HBM2e記憶體,熱設計功耗(TDP)為300瓦,本身也內建53 Gb/s的序列/解序列轉換器(Serdes),可透過Intel Xe Link橋接器串聯4張同款GPU加速卡;Max 1350搭配112顆Xe-HPC架構的核心與96GB的HBM2e記憶體,熱設計功耗為450瓦;Max 1550搭配128顆Xe-HPC架構的核心與128 GB的HBM2e記憶體,熱設計功耗為600瓦。

值得注意的是,在Max系列GPU的硬體形式上,英特爾還提供一種搭載4臺OAM模組的子系統主機板,同樣透過Intel Xe Link串聯多臺GPU,而這個單板型態的子系統最多可提供512GB的HBM2e記憶體,記憶體總頻寬達到12.8 TB/s,熱設計功耗為1800瓦和2400瓦。

而在運算效能的呈現上,英特爾也首度揭露Max系列GPU的測試數據。以物理領域的虛擬反應爐模擬處理NekRS為例,英特爾Max 系列GPU領先Nvidia A100的幅度為50%;另一個金融交易領域用到的Riskfuel信用選擇權定價分析處理,英特爾Max 系列GPU效能可達到Nvidia A100的2.4倍。

超算產品線到齊,下一代CPU、GPU、AI晶片名稱陸續揭曉

在今年2月召開的英特爾投資者大會,該公司加速運算系統與繪圖處理事業群(AXG)列出三大主攻領域,與高效能運算、機器學習密切相關的超級運算(Super Compute)就是其中之一,這裡面提到英特爾今年會推出Sapphire Rapids HBM與Ponte Vecchio,也就是現在定名的Max系列CPU與GPU,關於明年登場的超級運算產品,則以Xeon Next HBM與Ponte Vecchio Next代稱,並提到2024年預計推出融合CPU與GPU的XPU,代號為Falcon Shores;而除了CPU與GPU,英特爾也將推出專攻多媒體與分析應用領域、代號為Arctic Sound-M的晶片(也就是8月推出的Intel Data Center Flex系列GPU),並將此系列晶片放置在超級運算產品線。

5月底舉行的歐洲年度國際超級電腦大會(ISC 2022)期間,英特爾首度揭露Ponte Vecchio之後接班的資料中心GPU,會是代號為Rialto Bridge的產品,將搭配160顆Xe架構核心,提供符合OAM 2.0規格的模組外形選擇,預計2023年提供樣品。Sapphire Rapids HBM之後的下一代產品,則以Xeon Next稱呼。

到了11月初英特爾發表Max系列CPU與GPU之際,也重新彙整了超級運算的產品發展藍圖。

以通用伺服器CPU而言,在第四代Xeon Scalable系列處理器推出後,下一代由代號為Emerald Rapids的Xeon處理器接棒,再下一代則是 Granite Rapids;而最新登場的Xeon CPU Max系列,將橫跨第四代Xeon Scalable與Emerald Rapids,後續交由Falcon Shores這款XPU產品。

在資料中心GPU的部分,現在主打代號Ponte Vecchio的Max系列GPU,下一代仍將繼續以Max系列GPU為名,但會是代號為Rialto Bridge接棒,再下一代同樣是交由Falcon Shores。

  

至於超級運算的第三條路線,原本英特爾在自家投資者大會與ISC 2022大會,都是以Arctic Sound-M作為代表產品,只是前者將其定位歸類於多媒體與分析,後者改為視覺處理雲端服務(Visual Cloud),但英特爾在11月初SC22大會前夕發布的影片中,深度學習成為第三路線,主打Habana Gaudi系列晶片,而今年5月已發表Habana Gaudi 2,在這份最新公布的超級運算發展藍圖中,英特爾列上了Habana Gaudi 3,表示此系列還有後繼推出的產品,但其後同樣是交由Falcon Shores總其大成。這也意味著未來英特爾超級運算產品線將整併為兩大解決方案,一是Xeon處理器,另一是結合x86與Xe架構的XPU。

熱門新聞

Advertisement