英特爾將在今年將推出的Alder Lake(Intel 7製程技術)中採用效能與效率核心的混合式架構。

圖片來源: 

Intel

英特爾在今天(8/20)舉行架構日,對外揭露未來在PC、資料中心、HPC的全新架構,其中的PC處理器,今年將會採用效能與效率兩種x86核心的混合架構設計,而資料中心端,Xeon與HPC也將採用新架構,結合英特爾自家與台積電的製程技術,提升擴充性及資料吞吐能力。

英特爾在架構日的一開始,首先介紹了準備從今年開始,在PC處理器上採用新的混合式架構Alder Lake,為英特爾首款混合式架構,最大特色在於結合兩款x86核心,分別稱為效率核心(Efficient Core,先前代號Gracemont)、效能核心(Performance Core,先前代號Golden Cove)。

其中,效率核心追求在低功耗下有效率的執行工作負載,以滿足低功耗的行動應用到多核心微服務需求,相較於目前的Skylake微架構,效率核心在相同功耗下,可提高4成的效能,而在多核心處理之下,4個效率核心比4個執行緒的Skylake雙核心,高出8成的效能並降低功耗,或是在相同效能下,降低8成的功耗。

每核心1執行緒的x86效率核心:

而效能核心號稱是英特爾打造的最高效能CPU核心,提升平行作業處理,降低延遲提升效能,以支援大量資料、程式碼的應用。英特爾解釋,效能核心的原則是在低延遲下的最好單執行緒,最短時間做大量資料的處理,根據該公司的說明,效能核心和第11代Core相比,效能核心在相同頻率下,一般工作負載的效能平均能提升19%。

以低延遲、大量資料及程式碼處理為主的x86效能核心:

搭配效率與效能核心,Alder Lake還採用了Intel Thread Director排程器,Thread Director可根據核心的低階遙測資訊、指令混合比例,將需要較高效能的執行緒交由效能核心處理,或是將需要能源效率的執行緒移至效率核心執行。英特爾表示,該公司與微軟合作,以協助作業系統作出更好的排程決策,微軟將推出的Windows 11已針對Intel Thread Director優化效能。

Alder Lake將採用Intel 7製程技術,最高到16個核心(8個效能核心與8個效率核心),支援到24個執行緒,並且支援新的I/O,包括DDR5-4800記憶體、PCIe Gen 5、Thunderbolt 4、Wi-Fi 6E等,功耗設計從9瓦到125瓦,將涵蓋桌上型、筆電到以省電續航力為特色的Ultra Mobile筆電等PC用戶市場。

GPU部分,英特爾日前發表高效能GPU品牌Arc,將採用代號Alcemist的Xe-HPG微架構,將採用台積電6奈米製程,鎖定效能級遊戲玩家及內容創作者,預計明年第一季就會有產品問世。Xe-HPG微架構最多支援8個Render Slice及針對DirectX12的固定單元,並內建具有16個向量及距陣引擎的Xe-core。

資料中心端運算也將採用新架構

至於資料中心端,英特爾也揭露了代號為Sapphire Rapids的下一代Xeon可擴充處理器,英特爾表示,新的Xeon處理器可針對資料中心大量且多樣化的工作負載最佳化,在雲端、AI與微服務提升效能。Sapphire Rapids將採Intel 7製程技術,並使用新的效能核心微架構,為針對速度、低延遲,同時兼顧單執行緒應用程式效能所設計。

Sapphire Rapids在架構上採用可模組化的單元設計,搭配EMIB嵌入式多晶片互連技術,提供更高的擴充性。此外,還內建加速引擎,其中針對AI方面的深度學習及訓練需求,內建Intel AMX(Advanced Matrix Extensions),以專用硬體與指令集,加速距陣乘法的運算,與英特爾原有的指令集相比,AI運算速度提升超過7倍。

在記憶體方面,Sapphire Rapids也支援DDR5,以及PCIe 5、HBM等技術。

為了釋放資料中心CPU資源,英特爾從過去發展FPGA SmartNIC的經驗為基礎,揭露該公司首款ASIC IPU,稱為Mount Evans,提供高效能網路、儲存卸載功能,降低CPU工作負載。支援NVMe硬體加速、Intel QuickAssist加密及壓縮技術。

另外,HPC高效能運算架構也有革新,Ponte Vecchio採用Xe HPC的高效能運算架構,將在2022年推出,內部採用多種不同功能的晶片塊組成,搭配高速晶片互連技術。Ponte Vecchio結合多個製程技術,呼應英特爾日前發表的IDM 2.0策略,內部採用Xe-core的運算晶片塊使用台積電N5製程,基底晶片塊使用英特爾自家Intel 7製程,而Xe Link高速連結晶片塊則使用台積電N7,搭配英特爾Foveros 3D封裝技術,英特爾宣稱Ponte Vecchio為該公司打造最複雜的SoC。

英特爾以初期晶片測試AI表現,ResNet推論效能可達每秒超過4萬3千張照片,ResNet訓練可達每秒超過3千4百張照片。

熱門新聞

Advertisement