在2014年IBM發表了Power8,揭開OpenPOWER開放式架構的序幕,更多廠商得以參與Power System的開發,而到了2017年12月,下一代運算架構Power9終於正式亮相,該公司正式發表採用這顆處理器的伺服器AC922。

基本上,這款機型是專為運算密集的人工智慧工作負載所設計的,能夠搭配2顆Power9處理器,以及4或6個支援SXM 2.0插槽的GPU運算模組(Nvidia Tesla V100),可協助企業建立更精準、更快的人工智慧應用系統,例如,針對 TensorFlow、Caffe、Chainer等常見的深度學習框架軟體環境,以及Kinetica這類分散式記憶體內加速資料庫,能夠提供顯著的效能改善,適用於科學研究、即時詐騙偵測與信用風險分析等領域。

純就Power9處理器而言,IBM採用了14奈米製程(Power8是22奈米製程),並區分為SMT8和SMT4等兩種類型的核心,而AC922目前搭配的是由SMT4核心所組成的Power9處理器,可支援4種核心配置組態,對應不同散熱方式。例如,16核心和20核心搭配氣冷,而18核心和22核心則是水冷。

AC922搭配的Power9處理器,是屬於SMT4核心類型,而且是針對橫向擴展應用的組態,內建24顆運算核心,因此不論是8335-GTG(16核心和20核心)或8335-GTW(18核心和22核心)的伺服器機型,所搭配的Power9處理器核心數量,都在這個範圍內。

 

至於整臺伺服器系統的部份,AC922率先引進許多新發布的I/O規格,包含:PCIe 4.0,Nvidia NVLink 2.0、CAPI 2.0,以及OpenCAPI。以2017年10月底拍板定案的PCIe 4.0為例,傳輸速度為16 GT/s,是現行普遍採用的PCIe 3.0的兩倍,而就資料吞吐量來看,同樣都是x16的憑寬,PCIe 4.0可提供30.5 GB/s,而PCIe 3.0可提供15.8 GB/s,綜觀目前市面上的伺服器機型,AC922應是第一款採用PCIe 4.0的產品。

Power9處理器在I/O介面上,提供許多新標準的支援,包含PCIe 4.0、NVLink 2.0、Open CAPI 3.0。其中,PCIe的部份,可連接網路介面卡和ASIC、FPGA運算卡,也可用於CAPI 2.0介面的連接;而NVLink 2.0和Open CAPI 3.0,都是運用25GB/s的I/O連結,可分別搭配新一代的GPU,以及ASIC、FPGA運算卡。

AC922支援的另一個重要新規格,則是Nvidia NVLink 2.0。它同樣是在2017年正式亮相,隨著Nvidia發表旗艦型GPU——Tesla V100,以及AI應用開發工作站DGX Station,而開始浮上檯面,傳輸速度為25 GT/s(NVLink 1.0為20 GT/s)。

以運算效能而言,AC922可具備更強的處理能力。根據IBM的測試,在同樣搭配40個CPU執行緒,以及4顆Nvidia Tesla V100的GPU組態下,若是採用兩顆20核心Power9處理器的AC922,在深度學習框架的訓練效能上,能夠達到英特爾伺服器平臺(2顆Xeon E5-2640 v4)的3.7倍與3.8倍。

而在I/O的改進當中,因為有了上述多種新技術的支援,AC922在資料移動作業的速度上,有了很大的突破。舉例來說,基於PCIe 3.0的系統,尖峰I/O傳輸速度為15.75 GB/s;而在運用Power9和NVLink的系統當中,尖峰I/O傳輸速度可達到150 GB/s,是前者的9.5倍。

從伺服器內部實際的I/O頻寬,也可看出AC922的強項。根據IBM的測試,AC922在Power9(CPU)到Tesla V100(GPU)之間,最高為150GB/s,若以普遍支援PCIe 3.0的英特爾伺服器平臺做為基準,IBM這款伺服器可達到5.6倍。

Power9處理器搭配NVLink 2.0,能夠以極大的頻寬來連接支援該介面的Nvidia Volta架構GPU。若以8335-GTG搭配4個GPU的機型而言,在GPU之間,以及CPU與GPU之間的I/O頻寬都是150 GB/s。

圖中是新舊CAPI之間的架構比較,Power9導入的新一代Open CAPI不再架構在PCIe介面上,而是利用25G的I/O連結,藉此改善延遲、提升頻寬,能夠更充分支援FPGA與平行運算的應用。

打開機箱上蓋,我們來看看AC922內部的配置,分別被4排記憶體所圍繞的是兩顆Power9處理器,而GPU則是在機箱中間、橘紅色的部份,這裡配置了4個GPU,而其旁所預留的空間,其實可再分別容納1個GPU,以便讓整臺伺服器搭配到6個GPU。若以這樣的配置來看,單就所有GPU占用的機箱空間,已經快要逼近、甚至超過CPU加上記憶體的空間。

產品資訊

IBM Power System AC922
●原廠:IBM
●建議售價:廠商未提供
●尺寸:2U
●處理器:2顆Power9(每顆核心最大4個執行緒)。8335-GTG:可選擇16核心、2.6 GHz,或20核心、2.0 GHz;8335-GTW:可選擇18核心、2.98 GHz,或22核心、2.78 GHz
●記憶體:16個DDR4插槽,8335-GTG:256 GB、512 GB、1.02 TB,最大容量為1TB,8335-GTW:最大容量為2TB
●硬碟:2臺2.5吋SATA硬碟(1TB、2TB,整臺最大容量為4TB)或固態硬碟(960GB、1.92TB、3.84TB,整臺最大容量為7.68TB)
●搭配GPU:8335-GTG:2或4個Nvidia Tesla V100,8335-GTW:4或6個Nvidia Tesla V100
●網路介面:2個GbE埠
●擴充介面:2個PCIe 4 x16、PCIe 4 x8、PCIe 4 x4

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】


Advertisement

更多 iThome相關內容