透過內嵌於控制器核心內的專屬晶片,執行資料縮減運算,採用這種架構的代表性產品,是HPE 3PAR的StoreServ。

面對資料量近乎永無止盡的持續攀升,現在有越來越多IT應用領域,都需要資料縮減技術的協助,來減緩儲存容量的消耗,以及儲存硬體成本的暴漲。

然而問題在於,壓縮與重複資料刪除等資料縮減技術,都會耗用相當程度的處理器運算效能與記憶體空間。當壓縮與重複資料刪除處理的資料量越大,需要耗用的硬體資源也直線增加,對系統帶來龐大的效能衝擊。這也制約了資料縮減技術的應用情境,不僅難以應用在承擔了龐大運算負擔,或是必須即時回應存取需求的應用伺服器,以及第一線儲存設備上,對於硬體等級不足的中、低階環境而言,也缺乏啟用資料縮減功能的條件。

因此以往只能透過一些變通的方式,設法讓高負荷環境也能使用資料縮減功能,如調節資料縮減的運算負荷、或是處理器資源的過量配置,但都不是根本的解決辦法。

而近年來出現的一種新架構——透過專屬加速硬體,來卸載資料縮減相關運算,而這種方法的應用,為這個問題的解決,帶來了一個新方向。

可以協助資料縮減運算的專屬加速硬體,最初是少數廠商的獨門架構,後來也被應用在一些老牌的高階儲存陣列上,這一、二年來的應用案例迅速增加,甚至連中階儲存陣列也開始導入。

資料縮減技術的運算負擔難題

隨著資料縮減技術的應用,從早期的備份等第二線儲存應用,擴展到全快閃儲存陣列這類第一線儲存設備,以及一般的通用環境時,資料縮減技術帶來的運算負擔問題,也益行突顯。

無論壓縮還是重複資料刪除,都會耗用相當多的主機或儲存控制器資源,包括處理器使用率、記憶體空間與I/O頻寬,如重複資料刪除的特徵值比對作業,便會耗用許多CPU週期,而作為比對基準的Hash Table,也會占用相當大的記憶體空間。

根據Pure Storage的資料,要處理一個1TB檔案的壓縮作業,大約需要16MB的記憶體空間。相較下,要跨整個儲存區處理1TB資料的重複資料刪除,則需要16GB記憶體空間,若是10TB資料量的重複資料刪除,便需要多達160GB記憶體空間。

就一般的經驗來說,如果系統原本的負載在50%以下,則資料縮減運算造成的影響幾乎可以忽略。但如果系統原本的負載已超過50%,則資料縮減運算便會嚴重影響系統效能。

一般的中、低階伺服器主機或儲存陣列,都難以有足夠的硬體資源,來因應重複資料刪除的運算負擔,一旦強行啟用,將大幅增加主機與儲存控制器的負荷,導致衝擊到原本的運算作業或存取服務。即使是高階主機或儲存陣列,重複資料刪除運算帶來的效能衝擊也不容小覷。

對於不同的應用環境,資料縮減運算負擔帶來的效能衝擊,也有所差異。

對於備份應用來說,雖然資料縮減技術會耗費相當大的運算資源,但對於多數的備份應用來說,對於儲存空間的成本,比備份作業的效能更敏感,所以較能忍受資料縮減技術的效能衝擊,來換取大幅減少儲存空間耗用的效益。

另一方面,由於備份屬於離線應用,資料縮減相關的運算,是由備份伺服器或備份軟體代理程式在離峰時間於背景執行,也不會影響到用戶日常的線上儲存應用。

但對於第一線儲存設備或通用應用環境時時,資料縮減技術所耗用的儲存控制器運算資源,勢必會影響原本的運算任務與儲存服務。

顯然的,若本來只是輔助性應用的資料縮減功能,占用的處理器資源過多,導致嚴重衝擊到用戶端可用的儲存I/O效能,這麼一來就是本末倒置。所以,真正「實用化」的資料縮減技術,必須是以不影響儲存設備正常服務為前提。

克服資料縮減運算負擔的新路線

面對資料縮減運算衝擊系統效能的問題,一般的解決辦法有這幾種:

方法1:設法調節資料縮減運算的負擔

例如放棄使用Inline型式的壓縮與重複資料刪除,只使用後處理型式的壓縮與重複資料刪除,以便控制啟動資料縮減作業的時間,避開尖峰時段,藉此降低衝擊。

或是放棄「Always On」的資料縮減作業模式,為資料縮減功能提供開關的選項,或是限定資料縮減運算占用的資源上限,由用戶視個別儲存區的I/O負荷,自行決定是否啟用資料縮減功能。

方法2:硬體資源過量配置(Over-provisioning)

為伺服器或儲存控制器採用更高規格的處理器,與更大容量的記憶體,來抵消資料縮減技術耗用的運算資源影響。

顯然的,這兩個解決辦法都沒有真正解決問題。

事實上,第1個辦法,也就是透過改用後處理架構的資料縮減功能,或是選擇只部分啟用資料縮減功能,只適合不那麼需要資料縮減功能的情境。

不過,對於無時無刻都要啟用資料縮減功能的環境,便只能採用第2個辦法——預先配置更高規格的處理器與記憶體,抵消資料縮減運算負擔的影響,然而這又會帶來硬體成本大幅攀升的副作用。於是,近來出現了第3種作法。

方法3:引進專用加速硬體

將資料縮減運算工作,卸載給專用硬體來執行,如此一來,伺服器主機或儲存控制器的處理器,就不會受資料縮減運算的拖累,而影響到原本的運算工作,另一方面,伺服器與儲存控制器也無需使用太高規格的處理器。

這種搭配專用硬體的方式,既可滿足資料縮減功能的重度使用,又不會有資料縮減運算影響整體效能的問題,同時也不致增加太多成本,可以說是目前因應資料縮減運算負擔的最佳解決方案,因而在這2年來有了迅速的發展。

事實上,在儲存設備上整合壓縮晶片等資料縮減用途硬體,是行之有年的作法,多年來,許多磁帶設備與虛擬磁帶櫃(VTL)產品,都有搭配硬體壓縮功能的選項,藉此在壓縮備份資料的同時,兼顧備份作業的速度。

不過,近期興起的這一波資料縮減硬體潮流,是要為第一線的「通用型」儲存陣列等設備,包括高效能的全快閃儲存陣列,整合資料縮減用硬體,對於效能、延遲與存取回應即時性的要求,完全是另一個層次,遠不是用於備份儲存設備的壓縮晶片可比。

儘管目前市場上已實際導入專用加速硬體,來因應資料縮減運算的通用儲存陣列產品還不多,只有8、9個儲存陣列產品線,但全都是Dell EMC、HPE、Hitachi、NetApp等一線大廠的新一代主力產品,也代表了一個顯著的趨勢,因此,我們可以預期,未來會有更多跟進採用這種硬體加速架構的產品問世。

代表性的資料縮減加速硬體:控制器核心內嵌加速晶片

透過內嵌於控制器核心內的專屬晶片,執行資料縮減運算,採用這種架構的產品中,最著名的是HPE 3PAR的StoreServ。

多年來,3PAR一直堅持在控制器採用通用處理器+ASIC架構,由通用處理器負責系統控制,專屬ASIC晶片負責執行RAID 5、RAID 6運算,控制器互連與快取I/O處理,以及Thin Provisioning、Zero區塊檢測等功能,ASIC的專用硬體線路處理這些固定運算功能,比起通用處理器有先天的性能優勢。

後來,隨著HPE 3PAR引進重複資料刪除功能,此時的ASIC晶片,也有了更多的用途。例如,於2015年中,HPE在發布3PAR OS 3.2.1 MU2時,新增了搭配第4代ASIC晶片的重複資料刪除功能,也就是Thin Deduplication,可由ASIC卸載這項功能的運算負擔。

後續改款的HPE 3PAR StoreServ產品線,以及2019年新發表的最新的Primera系列,HPE依然堅持通用處理器+ASIC架構,以及由ASIC卸載處理資料縮減功能的機制,並將ASIC晶片先後升級到第5代與第6代。

 相關報導  企業儲存瘦身術邁向新境界


Advertisement

更多 iThome相關內容