就在AMD發布第2代EPYC系列伺服器級處理器的前一天,同時,也是2019全球快閃記憶體高峰會開始舉行的日子,賽靈思(Xilinx)也推出新款FPGA加速卡Alveo U50。

以運算架構來看,這套產品同於早先推出的U200、U250、U280,皆採用UltraScale+,但其外形是半高半長的單槽介面卡(Alveo其他機型皆為全高、3/4長的雙槽介面卡),耗電量最高為75瓦(Alveo其他機型皆為225瓦),並和AMD第2代EPYC系列處理器平臺一致,率先支援PCIe 4.0(也支援PCIe 3.0 x16與CCIX,可安裝在伺服器的PCIe擴充槽),足以支撐關鍵的運算環境、網路與儲存系統的工作負載,以及機器學習推論、視訊轉碼、資料分析、運算儲存、電子交易和金融風險建模等。

從記憶體的規格來看,Alveo U50和去年11月推出的Alveo U50一樣,均搭配8GB容量的HBM2、頻寬為460 GB/s,但並未配置DDR4記憶體。網路埠的部分,它也內建1個QSFP28規格的100GbE埠,可支援NVMe-oF(NVM Express over Fabrics)的架構,以及分散式運算型儲存環境、特定的金融財務服務。

在吞吐能力、延遲與電源使用效率上,Alveo U50都可提供10到20倍的改善,因應雲端微服務這類新興的動態工作負載。而在網路與儲存負載的加速處理上,這張FPGA加速卡可協助開發者找出,並將運算移至更接近資料的地方,以便消除延遲執行的狀況與資料搬移的瓶頸。

關於Alveo U50在不同應用領域的效益,賽靈思也在這套產品發布的新聞稿當中列出一些估算比較數據。

在深度學習推論的加速上,同樣都是單一節點,若用於語音翻譯處理時,以搭配Nvidia Tesla T4的系統為基準,採用Xilinx Alveo U50的系統,在低延遲性的表現上,具有25倍的效能,吞吐量是10倍,能源效率也較高。

若是資料分析的加速,像是執行TPC-H的資料庫資料查詢測試,並以採用Intel Xeon Platinum 8260處理器的系統、記憶體內CPU運算的模式來比較,採用Xilinx Alveo U50的系統在每小時吞吐量上,有4倍的表現,維運成本的減省幅度也高達3倍。

在運算型儲存的加速應用上,採用Xilinx Alveo U50的系統,面對壓縮與解壓縮處理時,相較於採用Intel Xeon Gold 6152處理器的純CPU運算系統,可提供20倍的吞吐量,可加快Hadoop與大數據的分析,而且可減少3成以上的成本。

關於網路加速的部份,採用Xilinx Alveo U50的系統在電子交易的處理上,相較於純CPU運算系統,其低延遲性的表現是20倍的領先幅度,交易時間則是低於500奈秒。

在財務建模的網格運算應用上,採用Xilinx Alveo U50的系統,若執行蒙地卡羅的模擬,相較於Nvidia Tesla V100的GPU伺服器系統,可提供7倍的能源效率,可縮短分析時間、處理延遲,以及營運成本。

當Alveo U50正式推出之際,幾家IT公司也表示支持的立場,像是處理器廠商AMD和IBM,主要是他們發展的第二代EPYC與Power9均支援PCIe 4.0,期盼能和Alveo U50搭配,供超大規模資料中心與企業採用;另一家則是Western Digital(WD),繼去年全球快閃記憶體高峰會,發布NVMe-oF軟體定義式IT解決方案OpenFlex,今年不只是推出新款Flash Fabric Device機型F3100,也宣布和賽靈思合作,並展示Alveo U50和OpenFlex搭配之後的效能與彈性。

產品資訊

Xilinx Alveo U50
●原廠:賽靈思(02)8177-7800
●建議售價:廠商未提供
●外型:半高半長PCIe介面卡(被動散熱)
●I/O介面:PCIe 3.0 x16、2個PCIe 4.0 x8、CCIX
●搭配記憶體容量:8GB HBM2、460GB/s
●傳輸介面:2個SFP-DD埠(50GbE) 或1個QSFP28埠(100GbE)
●耗電量:75瓦
●通過驗證的伺服器廠牌與機型:Dell EMC(PowerEdge R640、R740),HPE(ProLiant DL380 Gen10),Supermicro(7049GP-TRT)

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】


Advertisement

更多 iThome相關內容