Los Alamos National Lab

資料處理器(DPU)的應用,本身就屬於一種混合運算架構,用於搭配伺服器與儲存陣列控制器的CPU,卸載特定服務的運算負載。從而能將更多的CPU資源保留給主要的應用。

不過,除了標準的CPU+DPU的混合應用型態,過去一年來又出現了一些新的架構。其中之一,是兩種不同類型DPU的混搭架構。

美國洛阿摩斯國家實驗室(Los Alamos National Lab)所屬的高效能運算部門,在2022年3月宣布已委由Aeon Computing公司打造新型儲存加速裝置,稱作「Flash裝置加速盒」(Accelerated Box of Flash Drives,ABFD)。雖然ABFD是專門訂製的設備,而非商售的企業儲存產品,不過當中採用了特別的混搭式DPU加速架構,值得大家進一步關注。

圖片來源/Los Alamos National Lab
【結合2種DPU裝置的混合式加速設備】美國洛阿摩斯國家實驗室日前引進一款設備「Flash裝置加速盒」(ABFD),採用2種DPU裝置混搭的特殊架構。
上為ABFD機箱的外型,採用常見的2U/24Bay機箱,安裝了24臺SK Hynix的U.2規格NVMe SSD。右為ABFD機箱的內部,沒有一般儲存設備的主機板,而是安裝了數張BlueField DPU卡,右上角的空位則是用於安裝Eideticom的NoLoad FPGA加速器。

ABFD是我們首次見到同時結合兩種DPU加速裝置的儲存設備,採用常見的2U機箱,可容納24臺NVMe SSD,特別之處,是同時安裝運算型儲存裝置與智慧型網路卡,分別是1臺U.2規格、屬於運算型儲存裝置類型的產品Eideticom的NoLoad FPGA加速器,以及數張BlueField-2智慧型網路卡。

其中BlueField-2扮演的應該是控制器角色,雖然官方沒有公布ABFD安裝的BlueField-2數量,不過以BlueField-2的規格來看,至少要安裝3張,才能連結24臺NVMe SSD——每張BlueField-2卡含有8個下行(downstream)PCIe埠,如果以3張BlueField-2卡計算,可匯聚出24個Armv8 A72處理器核心,加上NoLoad FPGA加速器本身,也提供Xilinx Kintex Ultrascale+ KU15P FPGA晶片,算是提供頗為可觀的運算能力。

ABFD在軟體方面是以ZFS on Linux檔案系統為基礎,可透過專門的ZFS FPGA加速器介面與DPU介面,將關鍵運算負載卸載到FPGA與DPU執行──Eideticom的NoLoad FPGA負責提供Erasure Coding、壓縮與checksum等儲存端運算卸載,BlueField-2則分攤網路傳輸方面的卸載處理工作。整個ABFD則可透過BlueField-2的200Gb InfiniBand埠來連接前端主機。

理論上,ABFD這類混合式的DPU應用架構,可以藉由結合不同類型的加速裝置,彼此分工合作,發揮截長補短的效果,為系統整體帶來更完整、更多樣化的運算卸載功能,但代價是提高了成本與複雜性。

然而,換個角度來看,ABFD這種結合多種DPU的混搭架構,雖然是很有意思的嘗試,卻也與DPU目前的另一個發展方向背道而馳。

許多DPU產品提供的運算卸載功能,正朝向更多類型、更多樣化的方向發展,未來只需要1種DPU裝置,便能兼用於多種不同形式的運算卸載功能。

因而這也形成了兩個相反的發展方向,一為「結合不同加速裝置的混搭架構」,另一為「單體DPU運算功能的多樣化」。我們認為,若從簡化架構、節約成本的觀點來看,後者應會成為日後的主流方向。

 相關報導  


熱門新聞

Advertisement