提高效率、降低成本與營運風險是當前企業儲存應用的首要課題。隨著企業業務的擴展,資訊系統產生的資料量也不斷膨脹,除了資料損毀所造成營運風險升高外,無論是在儲存或是傳輸方面也給企業的儲存基礎設施帶來極大的負荷。加上Sarbanes-Oxley等資訊法案的陸續出籠,強制規定企業某些電子記錄必須保存一定的年限,部分條例甚至明定企業須在限定時間內回應有關機關的資料核查要求,在法令要求時間內找出並提交資料給指定的機關。這除了迫使企業無法依個別需要刪除資料,造成必須保留的存檔資料量激增外,還原時間的限制也使得企業用戶紛紛開始使用速度快磁碟作為儲存備媒介,而不是傳統的磁帶。
儲存容量的增加以及大量的使用磁碟,直接導致了企業的儲存成本迅速攀升。企業終於察覺到,傳統無限制地添置硬體設備的管理辦法,已無法滿足目前的儲存需求。而隨著企業營運關鍵資料的不斷累積,資料損毀帶來的影響已不是過去以天為計算單位的還原點所能因應,除還原速度外,企業還需要更緻密的還原點選擇彈性。
趨勢1:儲存網路架構之爭—iSCSI v.s. FC
以光纖通道(Fibre Channel,FC)為基礎的儲存系統一直是企業追求高傳輸速率與高存儲品質的首選,但FC設備高昂的成本,也使得企業望之卻步;而後來出現的iSCSI架構,能透過TCP/IP網路來傳輸SCSI指令與區塊(Block)級資料,可讓用戶以類似存取本地端SCSI設備的方式,連結遠端的儲存設備,並具有易於安裝、成本低廉、不受地理限制與管理方便等優勢。但客觀地說,iSCSI與FC針對的並非是相同層面的應用領域。
趨勢2:分層儲存—降低整體成本
早期分層儲存的概念起於加速備份時間的考量,也就是在前端線上應用的硬碟與後端備份的磁帶設備間,插入一組作為緩衝的硬碟,構成一種3層式的儲存架構。但後來分層儲存逐漸脫離了原先的備份緩衝媒體(Backup Buffer)概念,而結合了資訊生命周期管理(ILM)的做法,由於分層式儲存架構中每一層的儲存成本都不同,因此企業可依資料的價值分別儲存到不同的媒體上,其關鍵與D2D2T同樣是透過在第1層線上硬碟與最後一層的磁帶間,插入中介的低成本磁碟儲存裝置,從而降低整體儲存成本。
趨勢3:重複資料刪除技術降低容量需求
面對日趨膨脹的資料量,無限制的添購硬碟顯然不是最佳的因應方式,因此「重複資料刪除(Data Deduplication)」或稱「資料簡化」的技術也就隨之而生。重複資料刪除技術的關鍵在於如何掃描磁碟資料,判斷資料是否為「重複」,各家廠商在實作細節上雖有不同,但原理大致上都是透過追蹤硬碟上存放的資料區塊,新的資料區塊在存入硬碟前會先經由系統的掃描與檢核,如果系統判定硬碟上已有一個相同的副本,那麽新資料將只會存入一個指向該副本位址的指標,而不會重複儲存,從而達到節省磁碟空間的目的。
趨勢4:協助法規遵循的固定內容儲存
固定內容(Fixed Content)指的是數位X光片、票據、郵件等依法律規定不可刪改、非經常使用,但又必須被儲存的資訊。傳統上這類資料多半儲存在成本相對較低的光碟櫃或磁帶櫃,但在性能與管理上均有不盡如人意之處。隨著SATA硬碟的降價,近年也出現了以硬碟為基礎,專門針對固定內容儲存做最佳化處理的磁碟產品。
趨勢5:無限制的還原—CDP
連續資料保護技術(CDP)則是以系統的I/O活動來作為啟動機制,透過持續的捕獲、追蹤系統I/O資料流狀態,CDP可以即時的複製每個I/O寫入動作,並記錄每個動作的時間,從而完整的保存了系統的存取變動歷程。因此使用者可將資料回復到指定的任一時間點狀態,從而完全取消了\傳統備份周期的限制。
趨勢6:SATA硬碟進入企業主流,但磁帶仍未脫離主流應用
在全球化的趨勢下,企業經營環境日趨嚴苛,企業對於資訊系統的投資成本也越來越敏感,因此對SATA硬碟的接受度也日益提高,應用範圍也逐漸延伸,分層儲存概念的普及就是拜廉價SATA硬碟的出現所賜。趨勢1:儲存網路架構之爭—iSCSI v.s. FC
長久以來,以光纖通道(Fibre Channel,FC)為基礎的儲存系統一直是企業追求高傳輸速率與高存儲品質的首選,但FC設備高昂的成本,也使得企業望之卻步。為在成本與性能間取得平衡,後來又出現了iSCSI的架構。
iSCSI能透過TCP/IP網路來傳輸SCSI指令與區塊(Block)級資料,可讓用戶以類似存取本地端SCSI設備的方式,連結遠端的儲存設備。由於iSCSI的伺服器和存儲設備能夠直接使用現有的IP交換機、路由器與銅纜或光纖線路,基礎架構的投資相對節省,因此iSCSI具有易於安裝、成本低廉、不受地理限制與管理方便等優勢。就連微軟也跨入了iSCSI領域,於2003年推出了一款免費的iSCSI initiator軟體,前些時候又收購了WinTarget iSCSI target軟體發展商String Bean的知識産權。預定將WinTarget整合到Windows Storage Server 2003 R2內,允許用戶將WSS儲存伺服器當作iSCSI目標來使用。
但客觀地說,iSCSI與FC針對的並非是相同層面的應用領域。以乙太網路作為傳輸媒介的iSCSI目前只能達到1Gb/s的頻寬,而目前的FC至少有2Gb/s,4Gb/s FC也開始普及,如果考慮到iSCSI的處理器負荷較大,且受制於乙太網路的QoS問題,實際傳輸速率遠低於FC,則iSCSI與FC間的性能差距還會更大。
過去,iSCSI一直侷限於入門級的SAN應用,大型企業與資料中心仍是由FC壟斷,但這個局面在10GigE iSCSI出現後將有所改觀。隨著10GbE協定的陸續制定完成,相關網路元件也紛紛上市,因此也出現了利用10GbE網路為基礎的10GigE iSCSI,透過比現有GbE網路高出10倍的頻寬,使iSCSI具備了挑戰FC在高階SAN領域壟斷地位的資格。
Intransa、Nimbus Data與Xiranet等新創公司均已推出了10GigE iSCSI系統,但EMC與NetApp等大廠均尚未跟進。目前推廣10GigE iSCSI的最大阻礙是10GbE網路高昂的價格,過去iSCSI相較於FC的最大優勢原是在於價格,但用戶從GbE網路升級到10GbE時由於所有的交換器與線路等均須更換,目前10GbE相關元件仍相當昂貴,部署成本至少超過GbE網路5倍以上,離普遍被用戶接受的範圍還有相當的距離,連帶也減損了iSCSI原來在價格方面的優勢,因此10GigE iSCSI可能要到10GbE網路的成本降低後才能被市場接受。
|
iSCSI與FC比較表 |
||
| 類型 | iSCSI | FC |
| 傳輸介面 | IP網路 | FC |
| 頻寬 | 1、10Gb/s | 1、2、4Gb/s |
| 資料存取方式 | 區塊 | 區塊 |
| 傳輸介質 | 雙絞線或光纖 | 銅纜線或光纖 |
| 傳輸距離限制 | 理論上無限制 | 100公里(4Gb理論值) |
| 優點 | 建置與管理成本較低 | 效能高,支援設備多 |
| 缺點 | 碰撞問題限制實際頻寬、需依賴高價的硬體iSCSI卡提高性能 | 建置與管理成本高 |
趨勢2:分層儲存—降低整體成本
早期分層儲存的概念是起於加速備份時間的考量,也就是在前端線上應用的硬碟與後端備份的磁帶設備間,插入一組作為緩衝的硬碟,構成一種3層式的儲存架構。資料先從前端第1層的線上硬碟寫到第2層緩衝的硬碟,然後再寫到第3層的磁帶,即所謂的D2D2T(Disk-to-Disk-to-Tape)—磁碟到磁碟再到磁帶。由於用於備份緩衝的硬碟存取頻率與工作負荷比前端的線上硬碟低了許多,因此可以使用價格較低的SATA硬碟,但存取速度仍比直接從前端硬碟連接到磁帶設備的2層式快了許多。某些企業甚至直接以第2層的SATA磁碟陣列作為資料的最終儲存媒體,捨棄了磁帶的使用。
但後來分層儲存逐漸脫離了原先的備份緩衝媒體(Backup Buffer)概念,而結合了資訊生命周期管理(ILM)的做法,由於分層式儲存架構中每一層的儲存成本都不同,因此企業可依資料的價值分別儲存到不同的媒體上,其關鍵與D2D2T同樣是透過在第1層線上硬碟與最後一層的磁帶間,插入中介的低成本磁碟儲存裝置,從而降低整體儲存成本。
至於分層儲存中第2層硬碟的具體作業方式,可以是直接以磁碟陣列作為儲存池,或者是將硬碟模擬成磁帶設備,後面這種做法就是所謂的虛擬磁帶櫃(Virtual Tape Library,VTL)。VTL可以在主機作業系統底層,以磁碟空間模擬出可被視為實體的虛擬設備,從主機看來,這些磁碟設備等同於一臺實體磁帶裝置,因此採用VTL解決方案的企業無須更動原來的備份架構與備份策略,而能享受到高速的利益。
目前絕大多數的儲存設備廠商都能提供這種作為第2層儲存設備的SATA磁碟陣列解決方案,包括磁碟陣列產品本身,或者是整合成VTL產品出售,而所有主流備份軟體也都支援D2D2T的3層式儲存應用。但對企業來說,實施分層儲存的最大挑戰是在於如何對資料實施分類處理。典型的做法有依據業務內容、資料產生時間,以及特定應用對傳輸速率的要求等3種分類方式。
依據業務內容分層是最常見的做法,將最重要的關鍵業務資料存放在性能最穩定、價格也是最貴的存儲介質上,將次重要的業務資料存放在價格較便宜的存儲介質上。如涉及客戶服務的關鍵業務資料必須做到即時備份,因此使用線上硬碟;而企業內部資料如公司內部的財務、人力資源之類的資訊對存取效能要求不高,使用近線級硬碟即可;最後對於主要作為存檔的輔助資料,可使用低價硬碟或是磁帶。
除了業務內容外,經驗也顯示企業業務資料的利用率與商業價值會隨著時間的推移而逐漸降低,以至完全消失。在這種情況下,也可以依時間為區分,將老舊資料遷移到低價磁碟或磁帶構成的存儲層上,如線上級的高價硬碟只存放那些比較新,近期內可能會再次讀取的資料,而第2層或第3層的低階硬碟與磁帶就可存放那些已有數年歷史、很少會被讀取的資料。
另外,也可依據應用程式對存取性能的要求來作區分,如負責資料登錄/輸出的應用程式應存放在第1層存儲系統上;而那些佔用磁碟空間較大、但對資料傳輸速率沒有太高要求的應用程式,則可存放在2級存儲系統上。
對資料實行分類處理是部署分層存儲系統過程中最艱難的一個環節,由於資料不斷變化,用戶很難準確地評估出資料在各個生命周期階段的價值,系統分層越多,就意味著管理也越麻煩。趨勢3:重複資料刪除技術降低容量需求
如前所述,由於分層儲存概念的風行,許多企業越來越依賴磁碟作為儲存媒體,甚至直接將硬碟作為備份資料的最終媒體,而不寫入磁帶內,因而導致了存儲成本迅速攀升。面對日趨膨脹的資料量,無限制的添購硬碟顯然不是最佳的因應方式,因此「重複資料刪除(Data Deduplication)」或稱「資料簡化」的技術也就隨之而生。
重複資料刪除技術的關鍵在於如何掃描磁碟資料,判斷資料是否為「重複」,各家廠商在實作細節上雖有不同,但原理大致上都是透過追蹤硬碟上存放的資料區塊,新的資料區塊在存入硬碟前會先經由系統的掃描與檢核,如果系統判定硬碟上已有一個相同的副本,那麽新資料將只會存入一個指向該副本位址的指標,而不會重複儲存,從而達到節省磁碟空間的目的。如果用戶對重復副本的內容做了修改,那系統將會自動爲該副本再創建一個可寫入的新副本。依照廠商的宣稱,這類重複資料刪除技術可提供高達20:1或更高的資料壓縮率。不過副作用是每次寫入資料時,系統都要校驗所有的資料區塊,以致於拖慢了效能,因此只適用於較不要求效能的近線儲存,如VTL、固定內容儲存等應用,而不適用於即時儲存環境。
目前這個領域的領導廠商多半是些小型的新創企業,如Asigra、Avamar、Data Domain、與Rocksoft等。其中Asigra與Avamar都是將重復刪除技術整合在其備份軟體中,而Data Domain的技術則將其稱為儲存容量最佳化(COS)整合成Appliance出售,包括磁碟陣列與閘道器等。另外Diligent去年推出的ProtectTier VTL系統也採用了重覆資料刪除技術。
在大廠方面,ADIC剛於今年3月收購了澳洲的Rocksoft,從而掌握了Rocksoft的重復資料刪除技術,預定將其整合到PathLight VX VTL和StorNext儲存軟體中。Symantec在剛推出的Veritas NetBackup 6.0 PureDisk中,也整合了透過去年併購DTC而取得的重復資料刪除技術。但最令人矚目的還是微軟在Windows Storage Server 2003 R2中也加入了功能類似的單實例存儲(single-instance storage)功能。
不過,業界並非一致看好重複資料刪除技術,考慮到微軟的WSS 2003R2已有了類似功能,未來若微軟將這類技術整合到作業系統的檔案系統內,則用戶對於另外購置重複刪除軟體的需求也會降低。而隨著垂直寫錄技術的採用,新一代的硬碟在單位儲存密度與成本方面也有持續的突破,連帶也會影響到企業採用重複資料刪除技術的意願。趨勢4:協助法規遵循的固定內容儲存
固定內容(Fixed Content)指的是數位X光片、票據、郵件等依法律規定不可刪改、非經常使用,但又必須被儲存的資訊。傳統上這類資料多半儲存在成本相對較低的光碟櫃或磁帶櫃,但在性能與管理上均有不盡如人意之處。隨著SATA硬碟的降價,近年也出現了以硬碟為基礎,專門針對固定內容儲存做最佳化處理的磁碟產品。
固定內容儲存技術屬於一種基於物件儲存架構(OSA)的應用,藉由獨特的哈希演算法(hashing algorithm),對資料內容進行計算以得到固定的位址(ID),若應用程式產生相同的物件,由於求出來的ID均相同,因此系統只會保存一份(類似重複資料刪除技術中的單實例存儲),從而提高储存利用率。又由於系統是透過每個物件來檢索資料,免除傳統檔案系統須在邏輯位址與實際區塊的物理儲存位址間轉換的麻煩,提高了資料定位與檢索的效率。另外還能透過函數計算驗證資料是否遭到竄改,從而符合法規要求。
目前最早推出也最著名的固定內容儲存產品就是EMC於2002年推出的Centra,EMC將其固定內容儲存技術稱為固定內容尋址(Content Addressed Storage,CAS),可應用在包括電子郵件歸檔、階層儲存管理、資料庫擴充、數位典藏文件管理、檔案分享、備份及醫療儲存等方面。繼EMC之後,一些新創公司也紛紛推出自己的固定內容儲存解決方案,如Permabit的 Permeon Reference Vault與 Permeon Compliance Vault,Archivas的Archivas Cluster系统,而Avamar也有一款與EMC Centra結構十分類似的Axion。在大廠方面,HDS預定在2006年第1季推出一種據稱使用Archivas技術的固定內容儲存產品,主要定位在郵件歸檔應用。
目前SNIA(儲存網路工業協會)正在審查固定內容儲存的共通介面標準草案,稱為擴展訪問方法(Extensible Access Method,XAM),定義了如何在存儲設備之間移動固定內容的參考資料。目前EMC支持XAM-API,而HDS與其他廠商支持XAM-I,最終標準應會在今年定案。
|
智慧化的儲存—基於物件儲存架構(OSA) |
|
基於物件儲存架構(Object-Based Storage Architecture,OSA)是1種同時提供直接存取的高性能、但又分離了儲存控制的元資料(meta-data)與實際的數據資料,從而使共享資料的存取不會造成I/O性能瓶頸。OSA定義了一種稱為物件導向儲存裝置(Object-Based Storage Devices,OSD)的智慧型磁碟介面,OSD是一種網路附加設備,包含各類儲存介質以及管理存取功能的元件。 與現今基於區塊的儲存設備管理方式相較,基於區塊的儲存設備與前端的應用程式間是不透明的,儲存設備只負責將資料以 區塊為單位放到磁區上而已,不管前端實際執行存取的用戶或應用程式。而基於物件的儲存設備則是以含有大量資料本身及相關屬性的物件(Object)為基礎,這些屬性包括屬性描述、資料特徵和安全策略等,OSD能理解存儲設備上區塊與區塊間的關係,從而能利用這些屬性更好的組織資料的儲存。 在OSA下,存儲空間不再需要主機上的檔案系統進行管理,而由存儲系統即OSD自己管理和分配:主機中原先由應用程式執行的定位邏輯和由檔案系統執行的存儲空間管理功能都被移到存儲系統上,因此應用程式只需要向OSD指出需要存取的物件既可。 目前已有的OSA應用多半集中在Linux叢集環境的高性能檔案系统,如Cluster File Systems的Lustre、Panasas的ActiveScale等,主要應用在國防與能源研究的大型高性能運算環境,如美國三大國防實驗室都採用了Lustre,IBM正在開發的Blue Gene超級電腦也採用Lustre。比較商用化的OSA應用是在固定內容儲存(CAS)這方面。 |
趨勢5:無限制的還原—CDP
傳統的備份作業都是藉由時間點來作為啟動複製或快照動作的機制,因此在需要還原時,資料所能回復的狀態也會受到備份周期設定的限制,只能還原到啟動備份作業的那幾個時間點。
而連續資料保護技術則是以系統的I/O活動來作為啟動機制,透過持續的捕獲、追蹤系統I/O資料流狀態,CDP可以即時的複製每個I/O寫入動作,並記錄每個動作的時間,從而完整的保存了系統的存取變動歷程。因此使用者可將資料回復到指定的任一時間點狀態,從而完全取消了備份周期的限制。
目前CDP領域是以10多家掌握了關鍵技術的新創企業為主,包括FilesX、InMage、Mendocino、Mimosa、Lasso Logic、Revivio、Storactive、TimeSpring、Xosoft、Zetta等,大廠方面只有IBM的Tivoli Continuous Data Protection,以及EMC的RecoverPoint兩款。
由於CDP的技術難度與部署的門檻較高,某些廠商比較傾向於頻繁快照技術,如微軟DPM、Symantec CPS以及Atempo的Time Navigator、Zetta的Zetta Server IR、FalconStor的IPStor等,這類產品基本上是整合了複製+快照的軟體,先將前端被保護伺服器的檔案,以同步或非同步的方式複製到後端伺服器,後端伺服器再對前端送來的檔案副本,以定期或手動的方式進行多次快照,以達到多還原時間點的功能。趨勢6:SATA硬碟進入企業主流,但磁帶仍未脫離主流應用
在全球化的趨勢下,企業經營環境日趨嚴苛,企業對於資訊系統的投資成本也越來越敏感,因此對SATA硬碟的接受度也日益提高,應用範圍也逐漸延伸,分層儲存概念的普及就是拜廉價SATA硬碟的出現所賜。
但磁帶並未因此而退出企業儲存應用的舞臺,尤其是近來磁帶的儲存容量屢有突破,繼Sony的S-AIT首先在2003年底達到單卷500GB容量的門檻後,Sun Storagetek於去年年底發表的T10000也達到了單卷500GB,而Quantum剛在今年3月發表的DLT-S4更是一舉達到800GB的單卷容量,使磁帶的單位成本又降到一個新低點,從而保持了磁帶的競爭力,在作為分層儲存末端的資料最終儲存媒體方面,磁帶的地位依舊無可取代。文⊙張明德
熱門新聞
2026-01-12
2026-01-12
2026-01-12
2026-01-12
2026-01-12