既有的自動分層儲存產品

繼3PAR、Compellent、BlueArc等先驅廠商後,EMC、IBM與HDS等儲存大廠,亦在這兩年亦紛紛跟進推出了自身的自動分層儲存技術,再加上過去半年多來的廠商併購行動,目前這領域的廠商已有相當大的變化。

Dell Compellent

自動分層儲存技術先驅廠商Compellent已在2010年底為Dell併購,Compellent的Storage Center系列儲存設備與Data Progression自動分層儲存技術,也都被納入Dell旗下。

儘管Compellent的Data Progression技術推出至今已超過5年,不過在同類技術中仍居領先地位,擁有最精細的分層精細度與獨特功能,也相對較為成熟。

Data Progression是Compellent儲存設備核心Storage Center軟體中的一個功能,Storage Center軟體會將磁碟陣列控制器所管理的硬碟,自動依效能區分為三個層級。磁碟底層則會透過動態區塊(Dynamic Block)技術,以4,096個512K區塊組成的2MB Page Pool為基本儲存單位,來組成不同層級的RAID與Volume。

Data Progression可利用底層的動態區塊技術,透過metadata來記錄每個動態區塊的建立/存取/修改時間、存取頻率,以及所處的RAID與硬碟層級等資訊。使用者建立Volume時,可選擇該Volume所欲使用的RAID與磁碟層級。若選擇讓Volume同時使用跨不同效能層級的實體硬碟容量,接下來系統將會定期檢視每個區塊的存取頻率,並視存取頻率自動將區塊搬移到適當的硬碟層級,藉此改善磁碟硬體的使用效率。

使用者可按自身環境,選擇以最小的512KB區塊為追蹤統計與分層遷移單位,也可調整為以較大的2MB或4MB區塊為單位(預設值為2MB)。系統執行資料分層遷移作業的週期為24小時,預設的執行時間為晚上7點,作業起始時間與執行窗口(允許遷移作業執行多久時間)可按用戶需求調整,但週期不可調整(固定為每24小時1次)。

特別的是,Data Progression不僅能在不同層級磁碟間進行「縱向」資料自動分層,還能在同一層級磁碟間進行「橫向」的資料自動分層,如在同樣的1.5萬轉FC硬碟層中,可將存取頻率較低的資料從寫入速度較快、但單位成本較高的RAID 10組態磁碟區,遷移到寫入速度較慢、但單位成本較低的RAID 5上。

更特別的是Data Progression還能利用所謂Fast Track功能,對單一硬碟執行存取最佳化——可將較常存取的資料自動遷移到硬碟最外軌上,藉以減少搜尋時間。

換言之,Compellent的Data Progression自動分層儲存技術,同時涵蓋了不同儲存設備層、單一儲存設備層與單一硬碟等三個層次。

EMC

自2009年以來,EMC已先後推出兩代全自動儲存分層(Fully Automated Storage Tiering,FAST)技術。

第1代的FAST適用於EMC的CLARiiON、Symmetrix等儲存產品系列,不同產品線的FAST功能在設定與執行的細節上略有差異,但基本運作方式是一致的。

以Symmetrix FAST為例,先將不同層級的磁碟裝置(SSD、1.5萬轉硬碟、7,200轉硬碟等)共同組成磁碟群組,然後分別設定各層級磁碟裝置在每個儲存群組中所占的比例上限,以及讓FAST執行初始化採樣(統計系統存取行為)的時間排程、允許執行資料遷移的時間排程等參數後,接下來當到達管理者設定的時間時,FAST即會自動啟動、進行存取行為採樣分析與資料遷移作業。

不過FAST 以整個LUN為自動遷移的單位,精細度顯然過於粗略,能達到的分層最佳化效果有限,執行遷移所耗費的資源也相當大,技術落後其他廠商有相當距離,目前已被第2代FAST取代。

第2代FAST稱為FAST VP(VP為Virtual Pool的縮寫),EMC宣稱FAST VP採用「Sub-LUN」層級的自動遷移技術,即資料的精細度優於LUN,可搭配Symmetrix VMAX與新推出的VNX整合儲存產品。

Symmetrix VMAX與VNX的FAST VP採用的精細度有所不同。Symmetrix FAST VP運作的基本單位是768KB的虛擬池擴展區塊(VP extent),一個FAST VP區塊包含480個VP區塊,約360MB大小。每個FAST VP區塊還可進一步分解成48個FAST VP子區塊,約7.6MB大小。Symmetrix FAST VP可視情況使用360MB的FAST VP區塊或7.6MB的子區塊。相較下,VNX的FAST VP則固定使用1GB大小的區塊來管理資料遷移。

FAST VP可提供不同的分層政策,以VNX的FAST VP為例便分為4種:

(1) 自動分層(Auto Tier):預設政策,將資料分散存放到橫跨所有層級磁碟的儲存池上,後續再依追蹤到的資料活躍程度,在不同層級磁碟間自動遷移。

(2) 優先最高分層(Highest available tier):盡可能將資料放到高速層磁碟,以提高效能。

(3) 優先最低分層(Lowest available tier):盡可能將資料放到低速層磁碟,以減少成本。

(4) 無資料遷移(No Data Movement):執行了最初分層設定後,便不再進行資料遷移。

Symmetrix VMAX與VNX的FAST VP運作程序稍有不同。

VNX的FAST VP分為3個階段:(1)統計收集:在背景持續紀錄收集每個區塊的存取頻率等metadata;(2)分析:每隔1小時便自動為LUN內的資料區塊進行存取活躍程度的排序;(3)重新配置:依照分析結果重新配置每個區塊的存放位置,可透過排程介面設定自動執行重新配置作業的時間窗口,最密集可設定每天重新配置一次。為避免重新配置的資料遷移動作耗用太多I/O資源,還可設定每次作業允許搬移的資料量。除自動排程外,使用者也能以手動方式隨時啟動重新配置作業。

Symmetrix VMAX的FAST VP則只分為2個階段:(1)統計收集與工作負載分析:利用排程自動啟動,可透過排程介面設定允許執行統計與分析作業的時間窗口,允許最密集的排程是以日為單位,可選擇允許系統24小時全天都在背景執行統計分析,或只在特定時間區段執行統計分析;(2)資料搬移:利用排程自動啟動,可選擇允許系統24小時都能執行分層搬移作業,以儘快反映儲存熱點的變化,或只允許在特定時間區段執行排程,以降低對I/O的衝擊。Symmetrix VMAX的FAST VP不提供手動執行模式,只能透過排程啟動。

EMC的白皮書資料並未明示VMAX的FAST VP允許的最短資料搬移週期為何,按某些Blog的說法,VMAX的FAST VP最短可每10分鐘更新一次各區塊的存取負載狀態,資料搬移作業則會等待2次存取負載狀態更新循環,所以最快可在2次存取負載狀態更新後便執行資料搬移,換言之,理論上可允許每30分鐘就重新分派一次各區塊存放位置。

相對的,其他技術大多只允許每24小時執行一次重新分層遷移作業,藉由這種特性,VMAX的FAST VP可更快的反映存取狀態變化。

先前EMC還曾有一款針對檔案層級存取環境提供自動分層儲存的產品Celerra FAST,實際上就是EMC File Management Appliance——1種獨立安裝部署的自動化歸檔/遷移應用軟體—的另一種包裝,不過隨著新一代VNX整合儲存產品系列的推出,Celerra FAST也被VNX上的FAST VP取代,只剩下作為獨立產品的EMC File Management Appliance,不再冠以Celerra FAST這種容易造成混淆的稱呼。

HDS

緊接在EMC發表第2代FAST技術之後,HDS在2010年10月宣布了搭配該公司新一代VSP系列儲存設備的Hitachi動態分層(Hitachi Dynamic Tiering,HDT)軟體。

與其他同類產品相似,HDT可按磁碟類型、轉速與RAID層級將儲存池分為3層,HDS宣稱HDT是ㄧ種基於Page層級的分層技術,可將動態儲存池切割為Page層級來進行分層管理,採用的粒度是42MB大小的Page,可支援最大1.1PB的儲存池(未來可擴充到3.3PB)與最大60TB的單一Volume,並且結合了Hitachi Dynamic Provisioning功能,還能與快照、複製等功能整合使用。

HDT執行資料重新分層/遷移作業的週期預設為24小時,也可按需要調整為1、2、4或8小時。週期越短,越能讓分層組態更即時的反映實際的I/O負載變化情況,不過過於密集的資料遷移作業對系統效能造成的衝擊也越大。

HDS在2011年5月初發表的HDT更新版中,又為分層遷移作業的排程週期新增了30分鐘的模式,可提供更密集的分層遷移執行週期;另外還新增「連續模式(Continuous mode)」,可代替週期執行的模式,只要一個I/O循環,就能即時反映存取狀態的變化。

HP 3PAR

3PAR是與Compellent並肩的自動分層儲存技術先驅廠商,被HP併購後,3PAR原有的軟硬體產品大致都保留在HP旗下新的HP 3PAR產品線中,包括自動分層儲存軟體在內。

3PAR先後推出過兩種自動分層儲存產品,第一種是2005年推出的「動態最佳化(Dynamic Optimization)」,屬於以Volume為基礎的自動分層功能,適用於3PAR InServ系列儲存伺服器,可依存取負載在不同層級的儲存裝置間,搬移整個Volume,藉以平衡實體磁碟機的負載,確保存取效能。

不過Dynamic Optimization還未完全的自動化,本身也沒有追蹤存取行為的功能,而只是一個遷移Volume的工具,必須另外搭配3PAR的Policy Advisor軟體,才能提供按政策驅動的自動化功能。

第二種是2010年3月推出的「自適應最佳化(Adaptive Optimization)」,適用於3PAR的Inserv F系列與T系列儲存伺服器。Adaptive Optimizatione改用比Volume更小的單位Sub-Volume作為分層搬移單位。HP與3PAR均未清楚說明他們所謂Sub-Volume的涵義,或許與3PAR儲存設備所採用的標準儲存單位Chunklet有關——3PAR的儲存設備會將實體磁碟分割為多個265MB大小的Chunklet,然後再由多個Chunklets組成需要的邏輯磁碟RAIDlet。(依此推測,Adaptive Optimization的最小單位應該至少是1個256MB的Chunklet)

在Adaptive Optimization技術下,一個Volume的區塊可散布在不同層級的實體儲存設備上(SSD、光纖通道硬碟或SATA硬碟),系統會依存取行為,自動將高存取頻率的Sub-Volume搬移到高速裝置上,低存取頻率的Sub-Volume則搬移到低速裝置上。

另外Adaptive Optimization自身也提供了自動分析與按政策自動驅動等功能,不像上一代的Dynamic Optimization還需要透過Policy Advisor軟體的輔助。

IBM

在主要儲存大廠中,IBM推出自動化分層儲存產品的時間相對較晚。在2009年底推出DS8700磁碟陣列時,IBM就宣稱日後要推出與之搭配的自動化分層儲存功能,但直到2011年4月推出的DS8700新版系統軟體中,才正式增加了稱為Easy Tier的自動分層功能。除了高階的DS8700外,IBM中階的Storwize V7000也沿用了Easy Tier技術,兩款產品上的Easy Tier細節雖然有所差異,但基本運作方式是相同的。

同類技術大多把磁碟分成三級—SSD、高速硬碟與低速硬碟,IBM的Easy Tier則只分為SSD與傳統硬碟兩級。

在執行分層遷移作業的精細度方面,Easy Tier屬於Sub-Volume等級,以Storwize V7000來說,採用的基本單位是源自IBM SVC的擴展資料區塊(extent),每個Volume由131,072個區塊組成,而這個區塊就是自動遷移的最小單位。按Volume容量大小不同,底層Extent的大小為16MB到8GB之間,管理者在建立儲存池時可設定Extent大小,但設定後便不可再改變。IBM建議與系統預設的Extent大小為256MB(對應的Volume最大容量為32TB)。

執行時,Easy Tier的IOM(I/O監視器)模組會捕捉整個儲存區域的資料存取特性,將相關資訊送到DPA(Data Placement Advisor,資料放置指導)模組,由DPA判別存取熱點所在,並將這些熱點區域的資訊送交DMP(Data Migration Planner,資料遷移計畫)模組,由DMP按不同儲存層的特性,向DM(Data Migrator,資料遷移模組)提出建議的資料遷移計畫,最後由DM執行並確認資料遷移作業。

Easy Tier預設的資料遷移作業週期是24小時,不提供更改週期的選項。

至於DS8700由於底層儲存池與Volume的組態,與源自SVC的Storwize V7000不同,因此用在DS8700上的Easy Tier雖然也是Sub-Volume等級,但採用的精細度為1GB的Extent,比起Storwize V7000大了許多,執行資料遷移作業週期則同樣是24小時。

BlueArc

多數自動分層儲存技術都是針對區塊與LUN層級,而專注於NAS領域的BlueArc則推出了在檔案層級上運作的自動分層技術,可利用整合在Titan系列NAS中的資料遷移(Data Migration)功能,達到自動分層儲存的目的。

管理者可以手動方式執行資料遷移,也可利用Data Migration的事件觸發功能設定自動遷移排程。

Data Migration提供多種政策設定選項,可以多種預設條件來自動啟動檔案遷移工作,如檔案所處目錄位置、有多長時間未經存取、檔案名稱、類型、大小、最後一次存取時間等,同時也能混用多種啟動條件。管理者可為不同目錄下的檔案分別設定資料遷移政策,當其中的檔案到達啟動條件時,系統就會自動執行遷移作業。

 

既有自動分層儲存技術概覽

(看大圖)

 


相關報導請參考「SSD企業儲存應用新趨勢:自動分層儲存與快取


Advertisement

更多 iThome相關內容