Nvidia
在2022 GTC技術大會上,Nvidia執行長黃仁勳在主題演講中,一連發布採用新架構的GPU、CPU產品及其超級電腦系統,另外針對3D設計協作與模擬平臺Omniverse,在今年也有重要發布,推出專用模擬運算伺服器,以及雲端服務。
採用新架構的GPU產品亮相,不只運算效能大提升,也正式支援機密運算
一開場沒多久,黃仁勳就介紹新一代GPU產品Nvidia H100出場,新GPU不論製程和架構都翻新,採用全新Hopper架構設計,搭配先進4奈米製程,其內含電晶體數量高達800億個。根據該公司數據,在浮點運算效能上,採用新架構的H100,較前一代Ampere架構A 100效能獲得顯著提升,在FP8精度浮點運算次數提高6倍,達到4 petaFLOPS ,另外在半精度(FP16)則有來到每秒2 petaFLOPS的提升。
Nvidia強調,新GPU適合用於加速Transformer模型訓練,因為在Hopper架構中,內建Transformer引擎,包括一個新的Tensor core和使用FP8和FP16精度格式的軟體,以及搭配動態處理層的Transformer網路,來優化Transformer模型訓練。
這款新GPU也是第一款支援機密運算的GPU產品,改以雲端實例來提供時,每個Hopper GPU內多個實例,都可以使用機密運算,來建立一個值得信賴的雲端運算環境 ,保護硬體內資料和應用。該款GPU也是第一款同時支援PCIe 5.0及HBM3高頻寬記憶體的GPU產品。單一顆H100處理器可以提供每秒40Tb的I/O頻寬。
Nvidia還推出採用新GPU的新一代AI超級電腦系統DGX H100,使用8個H100 GPU組成,效能可達到32 petaFLOPS以及擁有24 TB/s的記憶體頻寬和640GB 的HBM3高頻寬記憶體。
如果搭配新一代NVLink交換器系統,最多可以連接32臺DGX(合計256顆H100 GPU),建立H100 DGX POD叢集,效能可達到1 exaFLOPS。
Nvidia還推出使用18個DGX POD(一共576臺DGX, 合計4,608個H100 GPU)打造的Nvidia EOS 超級電腦系統,宣稱在AI應用上,可以提供18.4 exaFLOPS的處理效能,比當今速度最快的日本富岳超級電腦還快4倍。
整合自家新GPU與CPU的Grace Hopper超級晶片,和擁有144核的雙CPU晶片組
除了GPU產品,在CPU產品方面也有更多布局,除了首款Grace CPU產品將在明年正式出貨,該公司推出Grace Hopper超級晶片,整合了Hopper架構GPU與Grace CPU 並透過NVLink C2C互連 ,傳輸速度可達900 GB/s。除此之外,還有一款雙Grace CPU晶片組的超級晶片在這次大會中發布,可以提供最多144個核心,擁有396MB快取 ,支援LPDDR5X ECC記憶體,頻寬高達1TB/s。
Nvidia表示,Grace CPU也能使用各種Nvidia軟體平臺,包括Nvidia RTX、HPC、Nvidia AI以及Omnverse等。
除了更新GPU、CPU產品,Nvidia這次更新超過60個SDK,提供更多功能和應用加速。例如這次推出名為Sionna的新SDK,可提供6G通訊研究的AI框架,另外物理機器學習模型框架 Modulus以及開源醫療影像處理的AI框架 Monai,也都重新優化。
Omniverse現在也有專用模擬伺服器可選用和新雲端服務
這幾年,Nvidia力推的3D設計協作與模擬平臺Omniverse,在今年GTC大會中也有重要更新。從Omniverse發展來看,在去年元宇宙掀起的熱潮下,也讓Omniverse發展迅速,Omniverse生態系也逐漸壯大,從去年8家,到今年成長到82家,包括Adobe、Epic、Bentley等軟體都可以支援Omniverse,目前已有10.6萬名使用者,和累計超過15萬次下載。
Nvidia還介紹了一款Omniverse專用的OVX伺服器,可供企業打造自己的數位分身應用,這款伺服器是由8個A40 RTX GPU、 2個Intel Ice Lake CPU和3個CX6 NIC組成,內建1TB系統記憶體,和16TB NVMe儲存,另外同樣可以SuperPOD來擴充,最多可以使用32臺OVX設備建立運算叢集。目前OVX伺服器已推出。
除了提供就地部署的Omniverse硬體方案,Nvidia還推出Omniverse Cloud雲端服務,能讓創作者、設計師和開發人員使用雲端Omniverse平臺,跨區進行3D設計協作和模擬。Omniverse Cloud服務本身提供各種協作和共享工具,如一鍵協作的Nucleus Cloud功能,還有Omniverse Create功能,可以讓多人異地同時參與協作並彼此互動,另外,還推出一支View App,可以使用GeForce NOW串流平臺查看Omniverse場景模擬和畫面渲染的成果。
另外新釋出Omniverse kit套件,可以用來建立Omniverse擴充功能、App和微服務,還有提供26個製造格式轉換工具,來幫助企業將各種工業作業流程,與Omniverse相連,如Deepsearch、Omniverse Replicator、Omnigraph、Omniverse Avatar。
機器人平臺更新方面,Nvidia Drive 、Isaac、Metroplis以及Holoscan也都有一些更新。例如推出採用新一代Hyperion 9硬體的Nvidia Drive平臺,擁有14個攝影機、9個雷達、3個光達以及20個超音波感測器,可以處理比前一代硬體多2倍的資料量,並加強安全性以及全自駕的操作性,2026年開始出貨。
在其他AI服務應用上,對話式AI語音服務Riva正式推出, 在最新2.0釋出版本中可辨識7種語言,而提供推薦系統功能的Merlin也同樣已經推出,並釋出1.0版本。還有專用於大型自然語言模型訓練的NeMo Megatron深度學習框架,除了Azure公雲能用,之後將在AWS上來提供。
熱門新聞
2024-10-05
2024-10-07
2024-10-07
2024-10-07
2024-10-07
2024-10-07
2024-10-07