這個月企業級AI運算硬體產品熱鬧滾滾,月初AMD發表Instinct MI300系列,包含資料中心GPU 產品Instinct MI300X,以及融合伺服器CPU與GPU的APU產品Instinct MI300A,月中英特爾在紐約Nasdaq股票交易所發表Core Ultra個人電腦處理器、第五代Xeon Scalable伺服器處理器,預告下一代AI加速晶片Gaudi 3明年如期推出。

英特爾執行長回答媒體提問的一句話引發熱議,他說:「We think of the CUDA moat as shallow and small」,許多媒體紛紛引用,一時之間,網路充斥多篇以護城河為題的文章,有些寫為「CUDA護城河又淺又小」,有些則簡化為「Nvidia護城河又淺又小」,相當荒謬之餘,也突顯大家對GPU了解有限。

在社群網站Reddit有位網友對此不以為然,提出相當辛辣的評論。他說,「CUDA這條護城河是短淺,但Nvidia投入數千名工程師、耗費超過十年打造這條大護城河,而成為AI領域的要角帶來的潛在利益如此巨大,顯得所有的護城河很小」,接著他表示,「Nvidia的確有弱點,那是因為他們無法製造足夠的GPU滿足所有需求,所以企業被迫將他們的應用執行在其他競爭廠商的產品上,例如,英特爾或其他不是這個產業要角的廠商。」

iThome 1161期封面故事的主題「GPU直連I/O崛起」恰巧也與此有關,經過長期的發展,今年GPUDirect技術隨著Nvidia GPU的走紅,我們看到更多企業級儲存廠商積極支援這系列技術,希望搶搭這波AI應用商機。

我們長期關注GPU在商業領域的技術發展,一路看著Nvidia拓展多種企業應用場景。他們從專業繪圖處理,踏入桌面虛擬化支援,接著搭上大數據分析與深度學習AI浪潮——他們率先推出DGX系列應用設備,拉抬自家資料中心GPU,並持續擴衝GPU加速軟體開發堆疊,以及各領域專屬應用。

時至今日,單是AI的GPU加速程式庫,Nvidia所提供的開發軟體範圍,就已涵蓋高效能運算、機器學習、深度學習、推論,並以CUDA-X AI作為總代稱。在不同產業的應用當中,他們也發展醫療(Clara)、機器人(Isaac)、自動駕駛車輛(Drive)、物聯網/智慧城市(Metropolis)、影視內容協作與XR延展實境(Omniverse)、量子運算(CUDA Quantum)。

為了推廣高效能運算的應用,Nvidia也親自投入超級電腦的發展與營運,積極參加世界級的評比,以突顯GPU能耐。例如,在全球500大超級電腦排行榜當中,從2017年到現在為止,該公司總共有10臺超級電腦入列,今年11月他們的EOS系統首度進榜,就奪下全球第9名,2020年進榜的另一臺Selene超級電腦,曾拿下全球第5的佳績。

在雲端服務的應用上,Nvidia同樣不惜重本投入大量資源發展。對企業與關注GPU應用的開發人員而言,可能會接觸NGC,這裡提供已針對該公司GPU完成效能調校的軟體資源,大家可透過網站型錄免費下載取得程式庫、應用程式框架、軟體開發套件(SDK)、容器映像、預訓練的AI模型、AI基礎模型,涵蓋深度學習、機器學習、高效能運算、AI等領域。Nvidia也提供付費訂閱服務,企業可購買Nvidia AI Enterprise這類套餐或服務,獲得多人、多團隊的進階支援。

關於DGX系統與邊緣AI環境的大量部署需求,Nvidia也分別提供Base Command與Fleet Command這兩項雲端服務來幫忙。

而在系統平臺的布局上,Nvidia在2021年偕同伺服器虛擬化軟體大廠VMware,推出了Nvidia AI Enterprise軟體套餐,這幾年也陸續拉攏作業系統大廠Red Hat、Canonical,超融合基礎架構大廠Nutanix,以及伺服器系統大廠Dell、HPE一起推廣;公有雲方面,Nvidia今年上半發表DGX Cloud,找來Oracle Cloud Infrastructure、微軟Azure、Google Cloud共襄盛舉,到了11月底,AWS也答應策略合作。

除了上述這些,Nvidia與整個IT產業、不同產業之間,還有許多層面的發展正在密切進行當中,其他對手若要分食大餅或爭取市場青睞非易事,很難在短期內趕上、遑論超越,而對想有更多選擇的企業與廠商而言,改用其他方案的代價與風險很高,就算能自行發展晶片與軟體堆疊架構,雖然有機會獲得技術自主與成本降低等效益,但不能不考慮日後轉換或要同時橫跨其他平臺的需求。

 相關報導 

專欄作者

熱門新聞

Advertisement