由多個節點組成叢集共同提供服務,並在需要時,以增加節點方式擴充系統能力的Scale-Out擴展概念,不僅由來已久,也普遍被應用在許多領域,從高效能運算用伺服器、儲存設備、網路設備,到資安設備等,都可見到這種做法。

近年來,為了更靈活的因應資料量持續暴漲所帶來的資料處理與存放需求,Scale-Out架構更成了當前儲存領域的「顯學」,只需增加更多節點,就能同步擴展系統效能與容量,而無須替換掉既有的節點設備。

我們曾在第565期的NAS採購大特輯與第570期封面故事中,介紹過採用Scale-Out架構的NAS產品,這次我們則將把目光轉到儲存設備的另外一大類型--SAN儲存設備上,介紹同樣採用Scale-Out架構,但以提供區塊(Block)存取服務為目的的SAN儲存產品。

兩種Scale-Out區塊儲存設備類型

對於提供檔案存取服務的NAS設備來說,主要是透過在個別NAS作業系統上安裝叢集檔案系統,來達到提供Scale-Out擴展能力的目的,除了商售產品外,目前還有許多開源的叢集檔案系統,可讓用戶自行建置具備Scale-Out特性的NAS。

不過在SAN儲存設備領域,就沒有這類方便的開源管道可用。目前的Scale-Out架構SAN儲存設備,基本上都是由個別廠商自行開發、專以提供區塊存取服務為目的、支援多節點平行處理的專屬分散式作業系統,搭配專屬硬體所構成,大致可分為兩種典型架構:

一是採用分散式快取記憶體統一編址架構,運作方式類似多處理器平行處理領域的NUMA(非一致性記憶體存取,Non-Uniform Memory Access)架構,也就是將分散在各節點上的快取記憶體統一編址,讓各節點的記憶體透過映射被結合為一個大型、連續的全域記憶體,各節點的控制器可利用專屬的內部交換網路,互相存取彼此的快取記憶體與後端磁碟空間。

由於必須採用基於專門設計、成本也十分高昂的控制器-記憶體互連匯流排硬體,這種NUMA Scale-Out架構的SAN儲存設備大都是高階產品,如EMC的Symmetrix VMAX、HDS VSP、HP 3PAR的T系列等。

另一種Scale-Out架構是MPP(大型平行處理器,Massive Parallel Processors)平行處理架構,各節點有各自獨立的CPU與區域快取記憶體,再透過外部網路彼此互連,系統底層則藉由儲存虛擬化技術,把邏輯磁碟區的區塊打散到每個節點的磁碟空間上,因而前端主機存取磁碟區時,便能利用到所有節點的I/O效能。

MPP架構可使用標準化的硬體與網路設備組成節點,成本相對較低,採用這種Scale-Out架構的SAN儲存設備大都為中階型產品,如HP的LeftHand P4000系列、IBM XIV系列、Dell Equallogc的PS系列,以及國內普安公司推出的ESVA系列等。

無論是NUMA或MPP式架構的Scale-Out磁碟陣列產品,都具備了整體效能隨著節點數增加而線性增長的特性。用戶可從少數節點起步,日後隨著應用規模的擴大,再藉由增加更多節點,同步的擴展效能與儲存空間。

相較下,傳統的雙控制器模組化磁碟陣列,控制器本身的處理器、匯流排與傳輸介面規格,就決定了系統的最大處理效能與傳輸頻寬上限,雖然可藉由串接更多JBOD磁碟櫃來擴充儲存容量,但除非換掉整臺控制器,否則效能無法提升。這種只能串接磁碟櫃擴充容量、必須藉由更換更高階控制器才能升級效能的架構,也就被稱作「Scale-Up」綜向式擴展。

Scale-Out結合Scale-Up——提供更高擴展靈活性

對純粹的Scale-Out架構來說,每個節點都含有控制器與磁碟空間,每增加一個節點,系統的處理效能與容量都將同步的增加。不過問題在於,多數情況下,用戶對於儲存空間的需求,較存取效能的需求更為迫切,許多時候用戶只是單純的需要增加儲存容量,而沒有同步提高存取效能的需求。

對這些只需要更多容量的用戶來說,Scale-Out式擴充便顯得有些「奢侈」,儘管只有單純的容量擴充需求,但Scale-Out所增加的新節點雖然能提供更多儲存空間,卻同時也連帶包含了用戶暫時還不需要的額外控制器效能,以這種方式來取得額外容量,顯得成本過高。

相較下,傳統的Scale-Up式雙控制器磁碟陣列,反而更能因應這種只需要擴充容量、而不需要「同步擴展容量與效能」的情況,只要在後端外接JBOD磁碟櫃就能提供更多容量,而典型的JBOD磁碟櫃是一種僅含磁碟機、背版、SAS或FC連接介面與電源的單純裝置,必須藉由前端的控制器才能提供存取服務,但成本也遠低於同時含有控制器與磁碟機的完整儲存節點。

於是為了兼顧更多樣化的用戶需求,便有一些Scale-Out儲存設備也同時提供了Scale-Up升級能力,允許個別節點透過SAS或FC埠,在後端串接JBOD磁碟櫃,單獨擴充容量而無需同步擴充效能。

換言之,對這種兼具Scale-Up擴充特性的Scale-Out儲存設備來說,控制器節點與磁碟櫃單元是彼此獨立的,可各自獨立擴充,用戶可選擇只增添控制器或是只增添磁碟櫃。當用戶有擴充效能的需求、或同時需要擴充效能與容量時,可以選擇新增控制器節點。若用戶只有單純的擴充儲存空間的需求,可以選擇在某個節點上串接JBOD磁碟櫃。

因此兼具縱向與橫向、雙向擴充能力的Scale-Out+Scale-Up機型,顯然比純粹的Scale-Out,或是純粹的Scale-Up架構,能更精準、且更具彈性的滿足用戶需求。

既有主要Scale-Out SAN儲存設備概覽

目前包括EMC、HDS、IBM、HP與Dell在內的跨國大廠,都已陸續為旗下的中階與高階SAN磁碟陣列產品線,納入了Scale-Out架構產品,另外臺灣本土的普安,與中國的華為、龍存等廠商,也能提供Scale-Out架構產品線,用戶的選擇已相當多。

而這眾多Scale-Out產品中,多數也提供了Scale-Up縱向擴展能力,可向用戶提供更靈活、更多樣化的擴充選擇。以下我們便簡單介紹幾款在臺灣能找到的產品。

EMC Symmetrix VMAX

VMAX是EMC用於接替老牌的Symmetrix DMX系列高階磁碟陣列的新一代旗艦產品,如同產品名稱所示,新的VMAX系列捨棄了先前DMX的直連矩陣(Direct Matrix)架構,改用新的虛擬矩陣(Virtual Matrix)架構。

VMX的控制器基本單元稱為VMAX引擎,每個VMAX引擎都含有Intel Xeon處理器、快取記憶體與前、後端I/O介面。多個VMAX引擎之間可透過稱為RapidIO的內部網路彼此互連,共享快取記憶體與後端儲存資源。用戶只要增加VMAX引擎數量,就能擴展整個VMAX的處理效能與傳輸頻寬,這也就是Scale-Out橫向擴展。

除此之外,VMAX也能提供Scale-Up縱向擴展能力。由於VMAX的磁碟空間是由獨立的DAE磁碟櫃提供,用戶可從連接1組DAE磁碟櫃起步,視需求單獨加入更多磁碟櫃來提供更多空間,藉由靈活的組合不同數量的VMAX引擎與DAE磁碟櫃,來滿足不同的效能與空間需求。

不同等級的VMAX機型,允許的Scale-Out與Scale-Up擴展能力各有不同,如最低階的VMAX 10K允許最多4組VMAX引擎與1,560臺硬碟,最高階的VMAX 40K則允許最多8組VMAX引擎與3,200臺硬碟。

HDS VSP

VSP是HDS繼USP系列後推出的新一代旗艦產品,相較於採用傳統Scale-Up架構的USP系列,新的VSP引進了新的Scale-Out架構。

VSP的控制器把所有主要單元,都作成互相分離、且可抽換的板卡模組型式,包括提供處理器的虛擬儲存導向器(VSD)、提供快取記憶體的快取記憶體卡(DCA)、提供前端主機介面的前端導向器(FED)、提供後端磁碟機介面的後端導向器(BED),以及讓各控制器單元互連的網格交換器(GSW)等單元,每種單元都可各自獨立的擴充。

這也就是說,VSP控制器內的各個單元,各自都可以Scale-Out方式橫向擴充,用戶可藉由在VSP機櫃的控制器機箱中,安插不同數量的VSD、DCA、FED與BED模組板卡,組合成擁有不同等級I/O處理與傳輸能力的控制器。

每個VSP控制器機箱最多可安裝4個VSD模組、8個DCA模組、8個FED模組、4個BED模組與4個GSW模組,且每套系統最大可擴充到2套控制器機箱,所以前述單元的擴充數量上限還會加倍。

除了控制器內的各個單元可視需要以Scale-Out型式組合與擴充,VSP控制器後端也可視用戶需要,連接不同類型與數量的磁碟櫃,也就是以類似傳統Scale-Up擴展方式,藉由單獨增添新磁碟櫃來擴充容量。

IBM XIV

XIV是IBM新一代的中高階SAN磁碟陣列,基本單元稱為資料模組(Data Module),每個資料模組其實就是一臺以Linux為基礎的x86架構儲存伺服器,含有Intel 四核心處理器、24GB記憶體與12臺SATA硬碟。用戶可藉由連接多組資料模組,以Scale-Out的型式同步擴展系統的整體I/O處理能力、傳輸頻寬與儲存容量。

與其他同屬MPP架構的Scale-Out產品相較,IBM XIV一大不同之處在於採用非對稱式節點架構,所有資料模組(節點)中,有一部分兼有負責連接前端主機的介面模組角色,含有連接前端主機用的FC埠,以及與其他資料模組互連用的傳輸埠。剩餘的節點則是單純的資料模組,只含有與其他資料模組互連用的傳輸埠。相較下,其他MPP式Scale-Out產品如Equallogic PS系列、LeftHand P4000及普安ESVA都採用對稱式架構,所有模組都是對等、相同的。

前幾代的XIV,資料模組與資料模組之間,是以一般的GbE網路互連,最新的第三代XIV改用高頻寬的InfiniBand作為節點間的互連網路,單一系統最多可擴展到15臺資料模組。不過由於XIV不提供獨立、不含控制器的JBOD磁碟櫃選項,擴充時是以一臺同時含有控制器與12臺硬碟的資料模組節點為單位,不具備單獨擴充磁碟的Scale-Up擴充能力。

Dell Equallogic PS系列

Equallogic的PS系列,是最早導入Scale-Out架構的中階SAN磁碟陣列產品之一。每個PS系列節點都是一臺含有雙控制器,且內含12、24或48臺硬碟的iSCSI磁碟陣列,利用Scale-Out方式可支援最多16個節點。每臺PS系列的節點雖然都有雙控制器,不過Equallogic只提供Active-Standby模式,所以實際上每組節點只有一臺控制器可用。

與IBM XIV相似,Equallogic PS系列的擴充也是以一臺含有雙控制器與12/24/48臺硬碟的完整磁碟陣列為單位,沒有不含控制器的單純JBOD磁碟櫃選項,用戶無法以Scale-Up的方式單獨擴充磁碟空間。

HP 3PAR

3PAR是Scale-Out磁碟陣列產品的先驅者之一,當3PAR被併入HP旗下後,目前HP這條產品線一共有3PAR原有的F-Class、T-Class,與新推出的P10000 V系列等三個產品系列,用戶可透過增加控制器節點的Scale-Out擴充方式,增加整個系統的處理能力與傳輸頻寬,入門級的F-Calss可選擇擴充到2~4組控制器節點,T-Class與P10000 V系列則可擴充到2~8組控制器節點。

較早期的T-Class在控制器與控制器之間,是利用背板上的PCI-X介面以網狀方式彼此互連,最新的P10000 V系列背板則改用頻寬更大的PCIe介面。每組控制器的機箱內都提供了擴充插槽,可視需要安裝不同型式、數量的主機端連接介面卡(FC或iSCSI)或後端磁碟連接介面卡(FC)。

由於HP 3PAR的儲存空間是由獨立的FC介面磁碟櫃來提供,所以允許以Scale-Up方式,為個別控制器節點增添串接的磁碟櫃,以便單獨的擴展容量。

HP LeftHand P4000

P4000是HP透過併購LeftHand取得的iSCSI磁碟陣列產品線,這系列產品的核心是稱為SAN/iQ的虛擬化軟體,每組P4000控制器節點,實際上就是安裝了SAN/iQ軟體的HP Proliant伺服器,P4000系列目前已經發展到第二代的G2,有2U機箱的P4300 G2與P4900 G2、4U機箱的P4500 G2與刀鋒式機箱的P4800 G2等多種款式,一組機箱或一個刀鋒模組就是一臺控制器節點。每種款式都可由最小2個控制器節點起步,以Scale-Out方式擴展到最大32個控制器節點。

除了刀鋒型式的P4800 G2外,所有機架式機箱的P4000系列節點都採用控制器結合磁碟機箱的型式,控制器節點兼具提供儲存空間的功能,每組控制器機箱都內含一定數量的硬碟(8或12臺),擴充時也必須以一整臺控制器機箱為單位,沒有單獨擴充磁碟空間的獨立JBOD磁碟櫃選項,所以也就沒有Scale-Up擴充能力。

普安ESVA

ESVA是普安公司推出的中階SAN磁碟陣列產品家族,也是臺灣本土廠商研發的第一款Scale-Out式SAN儲存設備。目前ESVA家族已經發展到第3代,除了可藉由Scale-Out方式同步擴充效能與容量外,也提供以Scale-Up方式單獨擴充容量的功能。

ESVA的控制器節點是內含雙控制器與16個硬碟槽的3U機箱設備,藉由Scale-Out擴展可讓最多12臺ESVA控制器節點(一共有24組控制器)組成單一系統。另外每組ESVA控制器都含有用於外接JBOD磁碟櫃的SAS擴充埠,因此用戶也可以為個別控制器串接JBOD磁碟櫃,單獨地擴展磁碟容量。

Oracle Pillar Axiom 1600

這是Oracle併購Pillar Axiom後取得的中階儲存產品線。

Pillar Axiom 600基本單元是採用FC、SSD或SATA硬碟的Brick磁碟模組,搭配Slammer控制器模組組成。

每個Brick磁碟模組本身擁有2組RAID控制器,但並不直接向終端用戶提供儲存空間,而是透過Slammer控制器的中介,由將空間提供給前端用戶使用。每組Slammer控制器也內含兩組控制器,一共有有FC SAN、iSCSI SAN、FC+iSCSI SAN與NAS等4種Slammer控制器型式可供選擇。

以Brick磁碟模組搭配不同型式的Slammer控制器模組,便能提供不同類型的儲存服務。前端的多組Slammer控制器與後端的多臺Brick磁碟模組之間,透過FC網路形成的網狀連接,任一Slammer控制器都能存取後端任一Brick模組的空間。

Pillar Axiom 600的架構相當特別,典型的磁碟陣列通常是由控制器與JBOD磁碟櫃組成,控制器負責提供I/O處理、RAID運算、快取記憶體以及與前端主機連接的介面,後端的JBOD磁碟櫃則只單純提供磁碟空間。

Pillar Axiom 600則把傳統控制器的工作拆成兩部分,RAID運算功能由底層Brick磁碟模組內含的RAID控制器負責,至於I/O處理、快取記憶體以及與前端主機的連接等功能,則由Slammer控制器負責。

所以Brick磁碟模組不是簡單的JBOD磁碟櫃, Slammer控制器也不是傳統意義上的磁碟陣列控制器,而是由Slammer控制器結合Brick磁碟模組內的控制器,分工完成完整的I/O處理作業。

Slammer控制器與Brick磁碟模組都可以Scale-Out方式橫向擴充,一套Axiom最多可有4組Slammer控制器與64組Brick磁碟模組。兩種單元的擴充是互相獨立的,可以只單獨的增添Slammer或Brick模組。每組Slammer控制器都有26個用於連接後端Brick磁碟模組的FC埠,因此用戶能為個別Slammer控制器,連接更多的Brick磁碟模組,來增加儲存容量,以Scale-Up的方式擴展容量。

 

(看大圖)

主要Scale-Out SAN儲存設備的擴充能力


相關報導請參考「Scale-Out+Scale-Up 磁碟陣列擴充彈性大解放」

熱門新聞

Advertisement