在2016年4月初的GTC大會上,Nvidia以加速深度學習分析、因應AI運算需求為訴求,推出了全球首款整合型設備DGX-1,當中結合了硬體、深度學習軟體、程式開發工具軟體,有了這樣的設備,企業能快速、簡易地部署相關的運算環境。

而在效能方面,DGX-1號稱能提供的運算能力,相當於250臺2路Xeon E5-2697 v3伺服器組成的叢集。DGX-1之所以可以提供如此強大的處理能力,主要是因為採用了新一代的GPU加速模組Tesla P100。Tesla P100目前所採用的GPU,是Nvidia最新發展的Pascal架構,在深度學習的訓練處理上,若以4張2015年推出的Maxwell架構GPU加速卡為基準,可達到12倍的速度。

DGX-1本身在硬體架構上,也運用了多種高效能的技術,像是:內建NVLink的高速互連機制,能夠支援更大的應用系統執行規模;Tesla P100採用16奈米的鰭式場效電晶體(Fin Field Effect Transistor,FinFET)製造技術,提供極佳的能源效率;Tesla P100透過CoWoS(Chip on Wafer on Substrate)封裝技術,搭載HBM2 記憶體,能因應大數據的處理負載;Tesla P100支援全新的半精度指令,可為深度學習提供超過21 TFLOPS的尖峰運算效能。

在搭配的軟體部分,DGX-1直接內含一套經過效能調校的深度學習應用軟體,Nvidia稱為Deep Learning GPU Training System(DIGITS),研究人員與資料科學家能夠透過這樣整合好的套裝軟體,迅速、輕易地進行類神經網路的訓練。

DIGITS當中,主要由幾個部分所組成:CUDA深度神經網路程式庫(cuDNN)第五版、經過最佳化的深度學習框架——Caffe、Theano、Torch,以及雲端管理工具、軟體更新、以及針對容器化應用程式(containerized applications)的映像檔倉庫。

 

以軟體堆疊來看,DGX-1區分為深度學習框架、DIGITS訓練系統、Nvidia深度學習SDK(CuDNN、NCCL)、Nvidia Docker、GPU驅動程式、CUDA。

在軟體的搭配上,DGX-1也不只是基於Nvidia本身與開放原始碼的技術,也有其他的合作。例如,微軟在2016年11月也宣布與Nvidia合作,針對在Nvidia GPU當中執行微軟Cognitive Toolkit的各種平臺,提供最佳化,而這些平臺就包含了Nvidia DGX-1,以及配備了Nvidia GPU的Azure N系列虛擬機器服務,有助於強化深度學習處理的效能。而根據雙方的測試,在同樣使用微軟Cognitive Toolkit的狀況下,Nvidia DGX-1在AlexNet的訓練處理速度上,是x86處理器平臺伺服器的170倍。

產品資訊

Nvidia DGX-1
●原廠:Nvidia(02)6605-5700
●建議售價:廠商未提供
●機箱尺寸:3U
●處理器:2顆20核心Intel Xeon E5-2698 v4 2.2 GHz
●系統記憶體:512 GB
●硬碟:4臺1.92 TB SSD(RAID 0)
●GPU加速模組:8套Nvidia Tesla P100(3584顆CUDA核心、16GB CoWoS HBM2記憶體、732 GB/s記憶體頻寬)
●網路介面:2個10GbE埠、4個InfiniBand EDR埠
●軟體:Ubuntu Server Linux OS、DGX-1 Recommended GPU Driver

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】

熱門新聞

Advertisement