大數據、AI應用成當代IT顯學,長期以來,英特爾大多以發展性能更強大的處理器作為主要策略,在加速運算的應用上,近年透過併購FPGA、ASIC、AI新創晶片廠商來擴充戰力,而關於GPU的部分,過往都是內建在個人電腦、工作站的處理器,若需要效能更強大的GPU,需搭配Nvidia或AMD的產品,從去年下半起,英特爾推出獨立GPU產品的態勢越來越明朗,而且橫跨個人端與伺服器端平臺。

例如,在2021年8月初英特爾發表GPU品牌Arc,並且宣布代號為Alchemist的第一代產品,將採用Xe HPG微架構,預告2022年第一季上市,而在幾天後舉辦的年度架構日活動上,他們也公開展示Xe HPG的技術組成,以及Alchemist等4代產品的發展藍圖,

同時也在新聞稿當中透露Alchemist多項規格,例如,採用系統單晶片(SoC)設計,導入台積電N6製程節點;而Xe HPG所用的Xe-core核心具有16個向量引擎,以及16個矩陣引擎(Xe Matrix eXtensions,XMX),快取以及分享式區域記憶體;提供新的光線追蹤單元,支援兩種光線追蹤處理技術:DirectX Raytracing(DXR)、Vulkan Ray Tracing;最多可提供8個渲染切片(render slice),當中搭配為DirectX 12 Ultimate打造的固定功能單元。

到了今年,英特爾在2月舉行的投資者大會期間,宣布Intel Arc「Alchemist」將在第1、2、3季,依序推出筆電、桌上型電腦、工作站等系統的GPU,同時,他們也首度公開揭露代號為Arctic Sound-M的資料中心GPU,強調此產品是業界第一款內建硬體AV1編碼器的GPU,可節省30%的直播視訊串流使用頻寬,支援多種商用視覺運算處理應用,像是:虛擬桌面基礎架構(VDI)、視訊編碼轉換、多媒體AI分析、雲端遊戲串流服務,並且宣告此時開始提供樣品,將於2022年中開始出貨。

 

 

基於這類型解決方案的提供,英特爾加速運算系統與繪圖處理事業群(AXG)規畫的產品發展藍圖中,也在旗下超級運算的應用領域,正式新增了多媒體與分析產品線,並以Arctic Sound作為此系列解決方案的代稱。

5月登場的英特爾2022上半年全球用戶大會Vision期間,該公司執行副總裁暨加速運算系統與繪圖處理事業群總經理Raja Koduri公開展示了Arctic Sound-M實際產品,他在第一天的主題演講現場,拿出了一張標示「Intel Data Center GPU」的PCIe介面卡,而這就是Arctic Sound-M。隔天,加速運算系統繪圖處理副總裁暨超級電腦事業群總經理Jeff McVeigh公開Arctic Sound-M更多規格,例如,採用的GPU架構是Xe-HPG,提供兩款PCIe介面卡組態選擇——耗電為75瓦與150瓦,搭配的Xe核心為16個與32個,並且配備GDDR6記憶體、4個Xe Media Engine、光線追蹤單元,內建XMX引擎,關於產品上市時間,他預告會是在第三季。

 

英特爾第一款伺服器級GPU登場,鎖定視覺運算雲端服務市場

在今年8月上半,英特爾宣布推出Alchemist的工作站等級GPU,名為Intel Arc Pro A系列,可因應桌上型工作站與筆電工作站的專業繪圖處理需求;到了月底,他們正式發表資料中心GPU「Arctic Sound-M」,產品定名為Intel Data Center GPU Flex系列,先前所提到的兩種組態,實際對應的機型名稱為Data Center GPU Flex 140,以及Data Center GPU Flex 170。

  

而在這系列GPU支援的商業應用就緒程度上,英特爾先主打兩種類型。

首先,是多媒體處理與交付類型的負載,如視訊會議、影音串流、社交平臺多媒體。

在軟體堆疊架構上,Intel Data Center GPU Flex支援業界常用的多媒體框架,包括英特爾本身發展的OneVPL程式庫,以及FFmpeg、Gstreamer等開放原始碼軟體。

 

英特爾表示,Flex系列GPU可因應現代資料中心最高串流處理密度的需求,相較於熱設計功耗為150瓦Nvida A10,配備4個Xe Media Engine的Intel Data Center GPU Flex 140只需一半電力,

在HEVC、1080p60畫質的多媒體編碼轉換作業上,提供5倍的吞吐能力,而對於HEVC、AV1、AVC、VP9編碼轉換,若使用1080p30、8位元轉碼處理密度,吞吐能力可達到2倍,相關的支援與效能改善源於Flex系列GPU內建的多媒體引擎Xe Media Engine。

  

若用於HEVC-HEVC的4Kp60畫質的轉碼,Flex 140可節省3成以上的串流頻寬,主要是因為此款GPU內建開放原始碼的AV1編碼器所致。

而對於1080p60與4K60畫質的轉碼吞吐量,每張Flex 140最高可分別達到36個與8個串流。若在單臺4U伺服器配備10張Intel Data Center GPU Flex 140,可支援到360個HEVC-HEVC編碼、 1080p60畫質串流的轉碼。

若需處理8K60畫質的即時視訊轉碼,Flex 140也能如同Intel Arc繪圖處理器,透過裝置本身搭配的2顆GPU,而得以運用英特爾Deep Link系列技術的Hyper Encode機制,實現1秒延遲的表現,而且此功能也適用於AV1、HEVC HDR等兩種編碼格式處理。

另一個應用則是雲端遊戲影音串流處理,他們表示,Intel Data Center GPU Flex經過驗證,可搭配Google Play市集上近90款Android遊戲。而在負載能力上,英特爾也提出一些參考數據。例如,若採用720p30畫質,單張Flex 170可支援68個網路串流傳輸(手機遊戲:王者榮耀Honor of Kings),單張Flex 140可支援46個串流(手機遊戲:荒野行動Knives Out);若擴充到6張Flex 140,可支援216個串流。

 

 

到了9月舉行的Innovation大會,英特爾執行長Pat Gelsinger也特別在主題演講公開展示Intel Data Center GPU Flex,

而在這場活動期間,他們更深入地介紹與展示兩種已公開的應用模式、架構、效能,並揭露AI推論與多媒體分析的運用方式,

  

  

英特爾也預告 Data Center GPU Flex對於VDI桌面虛擬化的應用將於2023年上半開始提供——英特爾展現基於I/O虛擬化技術SR-IOV的GPU分割方式,可支援多種vGPU組態,這裡也提到每顆GPU系統單晶片最多可支援31個虛擬功能,因此解釋先前英特爾強調每張資料中心GPU加速卡最多支援62個虛擬桌面(Flex 140內建2顆GPU)

而在軟體解決方案的技術堆疊架構組成上,他們也針對主機作業系統與虛擬化管理、虛擬機器、遠端代理程式等層級,介紹當中的VMware、微軟、Citrix等公司的相關產品搭配。

產品資訊

Intel Data Center GPU Flex系列
●原廠:英特爾
●建議售價:廠商未提供
●外形:140為單寬半高半長介面卡(PCIe 4.0 x8),170為單寬全高3/4長介面卡(PCIe 4.0 x16)
●GPU架構:Xe-HPG
●GPU核心:140配備2顆GPU(每顆GPU為8顆Xe核心),170配備1顆GPU(每顆GPU為32顆Xe核心)
●GPU記憶體:GDDR6,140單顆GPU為6 GB,整張為12 GB,170整張為16 GB
●記憶體頻寬:140為336 GB/s,170為576 GB/s
●運算效能:140的FP32運算為8 TFLOPS,170的FP32運算為16 TFLOPS
●耗電量:140為75瓦,170為150瓦

【註:規格與價格由廠商提供,因時有異動,正確資訊請洽廠商】

熱門新聞

Advertisement