長期投入GPU虛擬化應用支援的Nvidia,今年6月底宣布推出7月將發表新版的虛擬GPU軟體(vGPU 11.0),支援更多類型的工作負載,能為處於遠端辦公狀態的藝術家、設計師與資料科學家,提供更多協助工具,同時,還可以改善IT系統管理人員的維運效率。

提升IT大量部署與管理便利性

在簡化IT管理流程、提高工作效率的部份,vGPU 11.0包含了跨分支(cross-branch)的驅動程式支援。所謂的跨分支,是指主機端與虛擬機器端的vGPU軟體/驅動程式能夠採用不同版本,如此可簡化升級與大規模的部署作業。IT系統管理者能夠更快升級到最新版Hypervisor,獲得程式臭蟲的修正、安全性修補與新功能,並且可以運用這樣的特性,而將終端使用者系統映像部署的vGPU軟體版本與伺服器虛擬化平臺的vGPU軟體版本,可以相互錯開。

關於vGPU軟體新版另一個改善營運效率的特色,則是針對VMware vSphere環境的虛擬機器,提供管理vGPU的功能,企業可搭配VMware旗下的IT維運管理軟體vRealize Operations(vROps),來進行相關的操作。事實上,在2017年8月,Nvidia宣布推出這套軟體專用的整合管理套件,名為Virtual GPU Management Pack for VMware vRealize Operations,當中包含VMware vRealize Operations for Horizon(V4H),以及vRealize Operations for Published Apps(V4PA),而在今年5月,Nvidia發布這個vGPU管理套件的2.0版,針對單臺虛擬機器搭配多個vGPU的組態,可提供辨識與監控執行狀態的功能。

因應VMware伺服器虛擬化平臺vSphere今年上半發布7.0版,當中針對配置GPU的虛擬機器,提供了動態資源排程器(Distributed Resource Scheduler,DRS)的支援,以及可配置硬體(Assignable Hardware)的特色,能在虛擬機器自動遷移至不同主機時,在系統開機之前的初始階段,可以正確地設定GPU組態,而在Nvidia 7月推出的vGPU 11.0(以及5月推出的vGPU 10.2),也已經提供支援。

而有了這樣的自動置放機制,企業若要大量部署配置GPU的虛擬機器,可在幾分鐘之內完成,相反地,如果單靠手動方式來處理,則可能需要好幾個小時。這項功能也適用於vSphere高可用性(vSphere High Availability,vHA)的部署,一旦主機突然停擺,系統可讓配置GPU的虛擬機器自動在另一臺主機重新啟動,而且是套用正確的GPU資源配置。

針對未授權或無法連上授權伺服器的GPU使用,多提供一些通融時間,避免嚴重影響用戶正在執行的工作

另外,在vGPU授權註冊的方式上,Nvidia在第11版當中,提供了更通融的方式,能讓未完成註冊的虛擬GPU與實體GPU,以完整功能但效能等級較低的執行模式來運作。關於這部份的作法差異,在該公司的NVIDIAGPUTalk的YouTube頻道中,有比較詳細的說明。

在此之前,若是虛擬機器開機時,成功完成與vGPU授權伺服器之間的註冊,但後續連不上伺服器,等到超過24小時之後,Nvidia會將GPU顯示效能會調降到3 fps、對CUDA進行限用,而且只能支援單螢幕顯示,進入難以使用的完全限制狀態;若是虛擬機器開機時,並未完成註冊至授權伺服器的程序,就會立即降級到上述3種狀態。

到了第11版vGPU軟體,Nvidia提供漸進的限用模式。因此,若是虛擬機器開機時,成功完成vGPU授權伺服器之間的註冊,但後續連不上伺服器,前20分鐘仍會以全功能、全速方式執行,在這之後到24小時之間,會將顯示效能調降到 15 fps,CUDA處理也需要一段等待時間,Nvidia這麼做的目的,是希望用戶察覺不對勁,但不致於緊縮到工作難以進行的地步,直到24小時之後,就會進入完全限制狀態。而若是虛擬機器開機時,並未完成註冊至授權伺服器的程序,則是會等到24小時之後,才進入完全限制狀態,在此之前,仍是全功能、全速運作。

另外,在產品生命週期的支援上,vGPU 11提供長期服務分支版本(Long Time Service Branch,LTSB),可支援3年。

而在版本區分上,Nvidia在先前曾宣布vGPU的企業軟體生命週期。這當中主要是針對vGPU 7.0以後的版本,將發行版本區分為新功能分支(New Feature Branch,簡稱為NFB,例如10.1版、10.2版,也是主要功能發布版本)、次要版本發布(Minor Release,簡稱為MR,在NFB版本之後發布的更新版),以及長期服務分支版本,其中,NFB版的發布頻率是1年2次,支援期間是1年,而LTSB版的發布頻率是2年1次,支援期間是3年。

提升XR內容串流支援,拓展SUSE平臺的vGPU支援

Nvidia在6月底發表vGPU 11.0的消息時,有些當時提及的新功能,但到了7月正式推出之後仍未提供,可能會在後續版本推出時,才會加入。

例如,在Nvidia發展的CloudXR技術,也就是虛擬實境(VR)、擴增實境(AR)、混合實境(XR)內容串流技術當中,vGPU將支援120Hz的垂直同步顯示模式(Vsync),而且涵蓋到4K解析度的畫面,能讓使用5G或Wi-Fi連網的無線設備,也能讓享有更流暢的沉浸式實境體驗,在畫面呈現的精細度上,比起原生的有線設備組態帶來的體驗,可達到無分軒輊的程度。

而在遠端即時的專業繪圖內容協作上,Nvidia也提到將會提供更好的用體驗,以及管理隨選即用工作負載的能力。

舉例來說,他們近期發表的Omniverse AEC Experience,就是結合了Omniverse這套即時3D模擬與協同設計平臺,並且搭配建置於資料中心的RTX伺服器,以及Quardro Virtual Workstation(Quadro vWS)軟體而成。若基於參考設計架構而言,這樣的解決方案能讓同一套Quadro RTX GPU,支援兩臺虛擬工作站,再以此執行多個電腦輔助設計的工作負載,而且能提供如真實照片的模型即時渲染能力。

另一項即將實現的進展,是針對SUSE的企業級Linux作業系統與伺服器虛擬化平臺。因為Nvidia與SUSE宣布將擴增Hypervisor支援,讓Linux Enterprise Server與他們所維護的KVM,能夠具有vGPU支援。

Nvidia表示,初期會先從Nvidia vCS的應用開始著手,能在SUSE系統執行人工智慧與資料科學工作負載時,啟用GPU虛擬化的功能。

陸續支援Citrix、VMware、Red Hat的伺服器虛擬化平臺,並且支援多種GPU虛擬化應用

Nvidia發展的vGPU軟體應用,已經有好幾年了,而且,早在2013年就能提供多種模式,例如,多臺VM共享GPU(Shared GPU或GPU Sharing)、1臺VM獨佔1顆GPU(GPU pass-through),以及可多臺VM共享GPU,也可1臺VM獨佔GPU(Hardware virtualization of the GPU),但主要是針對桌面虛擬化的使用場景,而合作的廠商後來也日漸增多。

例如,最初是Citrix,2015年正式支援VMware桌面虛擬化軟體Horizon,同年9月Nvidia推出GRID vGPU 2.0軟體,統整Citrix XenServer與VMware vSphere這兩套伺服器虛擬化平臺的虛擬GPU應用,當時主要支援的虛擬機器作業系統是Windows,以及64位元Linux。

到了2016年推出的GRID vGPU 4.0,虛擬機器作業系統開始支援Red Hat Enterprise Linux 7、CentOS 7、Ubuntu 14.04 LTS。2017年Nvidia與Red Hat宣布合作,隨即在8月和9月推出的vGPU 5.0和GRID vGPU 4.4當中,開始支援Red Hat Enterprise Linux + KVM的Hypervisor,11月推出的vGPU 5.1,則支援Nutanix的AHV 5.5。

在2018年10月發行的vGPU 7.0,能在單臺需機器支援多個vGPU配置(這裡搭配的Hypervisor是Red Hat Enterprise Linux + KVM,vGPU 9.0版才開始支援VMware vSphere,10.0版開始支援Citrix Hypervior)。

2019年6月vGPU 9.0,開始提供Virtual Compute Server(vCompute Server或vCS),支援人工智慧、深度學習與資料科學的伺服器虛擬化應用,而Nvidia也在8月特別發布消息,介紹vCS的相關特色,並提到多家廠商都會支援vCS,像是Cisco、Dell EMC、聯想、Mellanox、NetApp、Red Hat、Supermicro、VMware。

同年12月,vGPU發布10.0版,用戶可運用Quadro RTX 6000和8000這兩款GPU加速卡,來支援GRID Virtual PC(GRID vPC),以及GRID Virtual Applications(GRID vApp)等應用形式,而在畫面解析度的部份,可提升到4096×2160,以及支援10位元的色彩深度(1024種顏色)。

軟硬體的部份,vGPU 10.0支援Tesla V100 PCIe 32GB、Citrix Hypervisor 8.1、Red Hat Enterprise Linux with KVM 8.1與7.7等。5月登場的vGPU 10.2則支援Red Hat Enterprise Linux with KVM 8.2與7.8、vSphere 7等。

產品資訊

Nvidia vGPU Software 11.0
●原廠:Nvidia
●建議售價:廠商未提供
●包含的軟體與版本:vGPU Manager 450.55、Linux 驅動程式450.51.05、Windows驅動程式451.48
●涵蓋的GPU虛擬化應用程式:Quadro vDWS、vCS、GRID Virtual PC、GRID Virtual Applications
●支援Hypervisor:VMware vSphere 7.0/6.7/6.5、Citrix Hypervisor/XenServer 8.2/8.1/7.1/7.0、Windows 10/Server 2012 R2至2019、RHEL KVM 8.2/8.1/7.8/7.7/7.6
●支援GPU加速器:Tesla M6、M10、M60、P4、P6、P40、P100、T4、V100,Quadro RTX 6000、8000

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】


Advertisement

更多 iThome相關內容