整合GPU加速器與深度學習框架軟體，Nvidia推AI專屬應用設備

在2016年4月初的GTC大會上，Nvidia以加速深度學習分析、因應AI運算需求為訴求，推出了全球首款整合型設備DGX-1，當中結合了硬體、深度學習軟體、程式開發工具軟體，有了這樣的設備，企業能快速、簡易地部署相關的運算環境。

而在效能方面，DGX-1號稱能提供的運算能力，相當於250臺2路Xeon E5-2697 v3伺服器組成的叢集。DGX-1之所以可以提供如此強大的處理能力，主要是因為採用了新一代的GPU加速模組Tesla P100。Tesla P100目前所採用的GPU，是Nvidia最新發展的Pascal架構，在深度學習的訓練處理上，若以4張2015年推出的Maxwell架構GPU加速卡為基準，可達到12倍的速度。

DGX-1本身在硬體架構上，也運用了多種高效能的技術，像是：內建NVLink的高速互連機制，能夠支援更大的應用系統執行規模；Tesla P100採用16奈米的鰭式場效電晶體（Fin Field Effect Transistor，FinFET）製造技術，提供極佳的能源效率；Tesla P100透過CoWoS（Chip on Wafer on Substrate）封裝技術，搭載HBM2 記憶體，能因應大數據的處理負載；Tesla P100支援全新的半精度指令，可為深度學習提供超過21 TFLOPS的尖峰運算效能。

在搭配的軟體部分，DGX-1直接內含一套經過效能調校的深度學習應用軟體，Nvidia稱為Deep Learning GPU Training System（DIGITS），研究人員與資料科學家能夠透過這樣整合好的套裝軟體，迅速、輕易地進行類神經網路的訓練。

DIGITS當中，主要由幾個部分所組成：CUDA深度神經網路程式庫（cuDNN）第五版、經過最佳化的深度學習框架——Caffe、Theano、Torch，以及雲端管理工具、軟體更新、以及針對容器化應用程式（containerized applications）的映像檔倉庫。

以軟體堆疊來看，DGX-1區分為深度學習框架、DIGITS訓練系統、Nvidia深度學習SDK（CuDNN、NCCL）、Nvidia Docker、GPU驅動程式、CUDA。

在軟體的搭配上，DGX-1也不只是基於Nvidia本身與開放原始碼的技術，也有其他的合作。例如，微軟在2016年11月也宣布與Nvidia合作，針對在Nvidia GPU當中執行微軟Cognitive Toolkit的各種平臺，提供最佳化，而這些平臺就包含了Nvidia DGX-1，以及配備了Nvidia GPU的Azure N系列虛擬機器服務，有助於強化深度學習處理的效能。而根據雙方的測試，在同樣使用微軟Cognitive Toolkit的狀況下，Nvidia DGX-1在AlexNet的訓練處理速度上，是x86處理器平臺伺服器的170倍。

產品資訊

Nvidia DGX-1
●原廠：Nvidia(02)6605-5700
●建議售價：廠商未提供
●機箱尺寸：3U
●處理器：2顆20核心Intel Xeon E5-2698 v4 2.2 GHz
●系統記憶體：512 GB
●硬碟：4臺1.92 TB SSD（RAID 0）
●GPU加速模組：8套Nvidia Tesla P100（3584顆CUDA核心、16GB CoWoS HBM2記憶體、732 GB/s記憶體頻寬）
●網路介面：2個10GbE埠、4個InfiniBand EDR埠
●軟體：Ubuntu Server Linux OS、DGX-1 Recommended GPU Driver

【註：規格與價格由廠商提供，因時有異動，正確資訊請洽廠商】

熱門新聞