英特爾發表超級運算CPU與GPU，更新未來兩代的加速運算產品發展藍圖

今年英特爾陸續揭曉與發表最新一代資料中心CPU與GPU的相關消息，例如，5月在2022上半年度用戶大會Intel Vision，宣布下一代伺服器處理器平臺Sapphire Rapids，正式定名為第四代Xeon Scalable；8月初與月底正式推出首款商用獨立GPU產品Arc Pro系列，以及首款資料中心GPU產品Data Center GPU Flex系列；9月底舉行的2022下半年度用戶大會Innovation期間，他們展出代號為Ponte Vecchio的旗艦級資料中心GPU成品，並宣布這款GPU與內建高頻寬記憶體（HBM）的第四代Xeon Scalable處理器（代號為Sapphire Rapids HBM），開始以刀鋒模組的型態出貨，率先供應美國能源部的阿貢國家實驗室（Argonne National Laboratory）使用，目的是建構效能領先全球的超級電腦Aurora。

而在11月9日、SC22超級電腦大會前夕，英特爾搶先其他運算廠商一步，公開HPC與AI產品相關消息，主角正是上述CPU與GPU——設立名為Intel Max系列的產品線，成員包含：Sapphire Rapids HBM中央處理器，定名為Intel Xeon CPU Max系列，以及Ponte Vecchio繪圖處理器，定名為Intel Data Center GPU Max系列。

根據英特爾的新聞稿指出，Intel Max系列預定上市時間是在2023年1月。其中的GPU產品，已透過刀鋒模組的形式供應阿貢國家實驗室的Aurora超級電腦；Intel Max系列的CPU產品則將提供多個超級電腦設置單位，例如：洛斯阿拉莫斯國家實驗室、京都大學。

關於與阿貢國家實驗室的合作，英特爾預告，在SC22大會期間，將共同揭露測試開發系統Sunspot，這裡面包含了128臺可用於正式環境的刀鋒運算模組，若是參與Aurora Early Science Program計畫的研究人員，在今年稍晚可開始存取這套系統。

而在Aurora超級電腦的發展上，英特爾期望能使其成為第一臺雙精度運算尖峰效能超越2 Exaflops的系統，未來也將藉此展示同時搭配Intel Max系列CPU與GPU的單一系統配置，當中使用超過1萬臺刀鋒模組，每臺模組的運算配置是2顆Xeon Max與6顆Data Center GPU Max。

除此之外，英特爾表示，目前已有多個與國家級安全與基礎研究密切相關的高效能運算系統，都將採用Intel Max系列，像是洛斯阿拉莫斯國家實驗室的Crossroads，洛斯阿拉莫斯、勞倫斯利物浦、桑迪亞這三個國家實驗室共有的CTS-2，以及京都大學的Camphor3。

而在採用Intel Max系列的伺服器部分，英特爾預告，在SC22大會現場，將會展出12個廠牌、超過40款即將上市的系統設計。以Xeon Max系列而言，系統設計超過30款，響應英特爾號召的廠牌，有HPE、聯想、Dell、Supermicro、Atos、華碩、雲達、富士通、技嘉、浪潮、NEC、Hyve Solutions；而在Data Center GPU Max系列的運用上，系統設計超過15款，廠牌有HPE、Dell、聯想、Atos、浪潮、Supermicro、雲達。

揭露更多規格與效能標竿數據，以及隨之增加的驚人耗電量

關於SC22宣布的兩大新產品，英特爾在2021年8月舉行的架構日，就已公開當中所採用的技術，以及組成的重要元件，而現在則是更多規格、外形選擇、效能表現見真章的時刻。

Intel Xeon CPU Max系列

根據英特爾最新公布的資訊，此系列處理器最多可內建56顆高效能核心，而且這些核心是由4片晶磚所組成的，晶磚之間的相互連接，則是運用英特爾的嵌入式多晶片互連橋接（EMIB）技術，耗電量控制在350瓦以內；除此之外，這系列處理器在晶片封裝整合了64 GB容量的高頻寬記憶體HBM2/e，以及PCIe 5.0、CXL 1.1等系統I/O介面。

基於這樣的配置，Xeon CPU Max系列的每顆核心均可配備超過1 GB容量的高頻寬記憶體，足以適應最常見的高效能運算工作負載。就實際的高效能運算工作負載而言，若以 AMD EPYC 7773X為基準，Xeon CPU Max系列可提供4.8倍的效能；若以Intel Xeon 8380為基準，Xeon CPU Max系列可提供3倍的效能。

在提供同樣效能的條件之下，Xeon CPU Max系列搭配DDR5記憶體的系統，相對耗電量（Relative Power）減少幅度為63％，若Xeon CPU Max系列僅搭配HBM記憶體的系統，相對耗電量減少幅度達到68％；

而在兩種高效能運算測試標竿——全球氣象系統模擬MPAS-A、分子動力學深度學習模型開發DeePMD，Xeon CPU Max系列加速或改善幅度，可分別達到2.4倍（僅用HBM記憶體），以及2.8倍（搭配DDR5記憶體）。

Intel Data Center GPU Max系列

這是英特爾最頂級的資料中心GPU，鎖定高效能運算與機器學習應用等類型的大型運算工作負載，提供原生的光線追蹤加速能力，是專為科學圖解與動畫處理需求所設計的產品，最多可搭配128顆Xe-HPC架構的核心、128 GB的HBM2e記憶體、64 MB的L1快取記憶體，以及打破業界紀錄、內建高達408 MB的L2快取記憶體。

而在產品外形的部分，這裡有兩種選擇，一是雙寬尺寸的PCIe介面卡，名為Max 系列1100 GPU；另一是開放加速器模組（OAM），提供Max 系列1350 GPU、Max 系列1550 GPU等兩款機型。

這些機型本身也內建了53 Gb/s的序列／解序列轉換器（Serdes），可透過Intel Xe Link橋接器串聯同樣形式的Max系列GPU，例如，用戶可串聯4張PCIe介面卡形式的Max 1100，或是8臺OAM形式的Max 1350、Max 1550。

在系統運算單元與耗電量等規格配置上，Max 1100搭配56顆Xe-HPC架構的核心與48GB的HBM2e記憶體，熱設計功耗（TDP）為300瓦，本身也內建53 Gb/s的序列／解序列轉換器（Serdes），可透過Intel Xe Link橋接器串聯4張同款GPU加速卡；Max 1350搭配112顆Xe-HPC架構的核心與96GB的HBM2e記憶體，熱設計功耗為450瓦；Max 1550搭配128顆Xe-HPC架構的核心與128 GB的HBM2e記憶體，熱設計功耗為600瓦。

值得注意的是，在Max系列GPU的硬體形式上，英特爾還提供一種搭載4臺OAM模組的子系統主機板，同樣透過Intel Xe Link串聯多臺GPU，而這個單板型態的子系統最多可提供512GB的HBM2e記憶體，記憶體總頻寬達到12.8 TB/s，熱設計功耗為1800瓦和2400瓦。

而在運算效能的呈現上，英特爾也首度揭露Max系列GPU的測試數據。以物理領域的虛擬反應爐模擬處理NekRS為例，英特爾Max 系列GPU領先Nvidia A100的幅度為50％；另一個金融交易領域用到的Riskfuel信用選擇權定價分析處理，英特爾Max 系列GPU效能可達到Nvidia A100的2.4倍。

超算產品線到齊，下一代CPU、GPU、AI晶片名稱陸續揭曉

在今年2月召開的英特爾投資者大會，該公司加速運算系統與繪圖處理事業群（AXG）列出三大主攻領域，與高效能運算、機器學習密切相關的超級運算（Super Compute）就是其中之一，這裡面提到英特爾今年會推出Sapphire Rapids HBM與Ponte Vecchio，也就是現在定名的Max系列CPU與GPU，關於明年登場的超級運算產品，則以Xeon Next HBM與Ponte Vecchio Next代稱，並提到2024年預計推出融合CPU與GPU的XPU，代號為Falcon Shores；而除了CPU與GPU，英特爾也將推出專攻多媒體與分析應用領域、代號為Arctic Sound-M的晶片（也就是8月推出的Intel Data Center Flex系列GPU），並將此系列晶片放置在超級運算產品線。

5月底舉行的歐洲年度國際超級電腦大會（ISC 2022）期間，英特爾首度揭露Ponte Vecchio之後接班的資料中心GPU，會是代號為Rialto Bridge的產品，將搭配160顆Xe架構核心，提供符合OAM 2.0規格的模組外形選擇，預計2023年提供樣品。Sapphire Rapids HBM之後的下一代產品，則以Xeon Next稱呼。

到了11月初英特爾發表Max系列CPU與GPU之際，也重新彙整了超級運算的產品發展藍圖。

以通用伺服器CPU而言，在第四代Xeon Scalable系列處理器推出後，下一代由代號為Emerald Rapids的Xeon處理器接棒，再下一代則是 Granite Rapids；而最新登場的Xeon CPU Max系列，將橫跨第四代Xeon Scalable與Emerald Rapids，後續交由Falcon Shores這款XPU產品。

在資料中心GPU的部分，現在主打代號Ponte Vecchio的Max系列GPU，下一代仍將繼續以Max系列GPU為名，但會是代號為Rialto Bridge接棒，再下一代同樣是交由Falcon Shores。

至於超級運算的第三條路線，原本英特爾在自家投資者大會與ISC 2022大會，都是以Arctic Sound-M作為代表產品，只是前者將其定位歸類於多媒體與分析，後者改為視覺處理雲端服務（Visual Cloud），但英特爾在11月初SC22大會前夕發布的影片中，深度學習成為第三路線，主打Habana Gaudi系列晶片，而今年5月已發表Habana Gaudi 2，在這份最新公布的超級運算發展藍圖中，英特爾列上了Habana Gaudi 3，表示此系列還有後繼推出的產品，但其後同樣是交由Falcon Shores總其大成。這也意味著未來英特爾超級運算產品線將整併為兩大解決方案，一是Xeon處理器，另一是結合x86與Xe架構的XPU。

揭露更多規格與效能標竿數據，以及隨之增加的驚人耗電量

Intel Xeon CPU Max系列

Intel Data Center GPU Max系列

超算產品線到齊，下一代CPU、GPU、AI晶片名稱陸續揭曉

熱門新聞