iThome

許久以來,一直作為長期儲存應用標準解決方案的磁帶,正受到公有雲歸檔儲存服務的挑戰。

磁帶在電腦應用的歷史已超過半世紀,可說是當前IT技術中的活化石,是從1950年代沿用至今的儲存技術,在各式新興儲存媒體技術衝擊下,磁帶不斷退守應用範圍,至今仍能留在IT應用中的理由只剩一個——作為長期歸檔保存資料的冷儲存媒體。

對於不需經常存取、但必須長期保存的冷資料(Cold Data)儲存應用,也就是資料歸檔或封存(Archive)來說,是磁帶最能夠避短揚長的應用場域。

歸檔儲存是最基本的儲存應用之一,隨著各式資料保護法律的完善,歸檔儲存的重要性持續提高,涉及面向也越來越廣。過去,歸檔應用集中在政府機構或是金融、醫療等特定行業,而到了今日,幾乎所有行業都有長期保存資料的歸檔應用需求,對於任何企業來說,許多營業相關資料都不能過期後刪除,而需依照法規長期保存,以備日後調閱。

然而歸檔這項儲存應用的型態,卻是數十年如一日。20、30年前,企業普遍使用磁帶作為歸檔儲存媒體,這樣的型態一直延續至今,所以,現在歸檔儲存應用,依舊還是以使用磁帶為主流。。

一方面,歸檔儲存的存取頻率很低,往往數個月甚至數年才有機會存取一次資料,因而磁帶只能線性存取帶來的效能限制,不會成為太大的問題;另一方面,磁帶又具備了相對較低的儲存成本,以及較長的保存期限,因而特別適用於歸檔儲存涉及的長期資料保存需求,並因應長時間資料累積所需的龐大儲存容量。

於是歸檔儲存也就成為磁帶設備的最後堡壘,難以為其他型式的儲存技術所取代,直到最近2、3年,隨著各大公有雲服務商陸續推出專門的歸檔儲存服務,才終於讓磁帶的地位出現鬆動。

歸檔儲存應用解決方案的必備條件

過去十多年以來,陸續曾有多項儲存技術出現,試圖挑戰磁帶的歸檔儲存應用角色,例如,大容量的光學儲存媒體,基於低成本磁碟機、結合重複資料刪除技術的低成本磁碟儲存系統,但都沒有動搖磁帶的地位。

一般來說,針對歸檔儲存應用的儲存系統,必須具備這3項基本條件:

● 儲存媒體成本低:長期儲存必然會累積可觀的資料量,因而歸檔儲存用的儲存媒體,必須具備較低的單位容量成本,以免長期使用下來,帶來過高的成本負擔。

● 儲存媒體的高耐久性與高可靠性:歸檔儲存涉及的是至少5年以上的資料保存期限需求,必須確保歷經長時間保存後,仍須能正確地從儲存媒體中讀取資料。因而,儲存媒體必須擁有歷經長時間仍不致變質、損毀的耐久性,以及可正確讀取資料的可靠性。

● 安全性:儲存系統或儲存媒體必須提供防止惡意竄改資料的安全性,例如WORM(Write-Once-Read-Many,一寫多讀)功能,或是隔離資料與網路的離線(Off-line)或Air-Gap功能。

除了前述3個基本條件外,歸檔儲存系統本身也是一種企業儲存系統,因而也需具備企業儲存系統必備的擴展性,以及管理便利性。

從這幾點出發,可以發現磁帶之所以能長期占據歸檔儲存應用主流產品的地位,確實有其優勢,而非僅僅是長期使用慣性而已。

磁帶在歸檔儲存應用中的優勢

首先,磁帶分離了儲存媒體(磁帶匣)與讀寫機構(磁帶機),作為儲存媒體的磁帶匣,沒有複雜的機電高速旋轉部件,因而可以大幅降低成本。其次,磁帶匣也因沒有高速旋轉部件帶來的磨損,因而擁有極高的耐久性,加上磁錄密度相對較低,讀取錯誤率也低於硬碟。

磁帶分離儲存媒體與讀寫機構的設計,也帶來了擴展便利性。透過持續添購磁帶匣,理論上磁帶設備擁有無限的容量擴展能力,並能透過引進更多磁帶機與讀寫頭,來提高存取速度。

而磁帶機與磁帶分離的設計,還帶來先天上的資料離線隔離安全性,庫存保管的磁帶與讀寫機構平時是實體隔離的,只有經授權的管理者,才能將庫存保管的磁帶掛載到磁帶機中存取,是一種實體的Air-Gap機制與存取權限管制。磁帶設備與磁帶還能提供加密與WORM功能,進一步提高安全性。

但另一方面,磁帶本身也存在許多先天缺陷,例如磁帶匣中的磁帶卷採用捲繞設計,雖能提高容量與儲存密度,但也導致其只適合線性的循序存取,而且磁帶卷的纏繞也可能出現問題;磁帶設備分離磁帶與磁帶機、透過磁帶匣抽換存取方式,雖然風險分散,也帶來一系列副作用。

對於擁有數百、上千卷磁帶的磁帶應用環境來說,人工作業是不便利的,磁帶的載入、卸載與識別都將成為大麻煩,必須透過自動上帶機(Autoloader)、磁帶櫃(Tape Library)這些自動化機械裝置,利用機械臂來執行磁帶載入與卸載作業,並搭配條碼掃描來識別個別磁帶。但這些內含大量機械可動機構的設備,不僅增加了複雜性,也增加了故障風險,不利於對整體系統的可靠性。

然而,對於不需要經常存取的歸檔應用來說,磁帶的前述缺陷都不至於成為太大問題,多數磁帶匣在寫入資料後,可能就不會再有讀取的機會,只需持續保存而已。比較需要費心的部分,主要是如何妥善保管磁帶匣,必須避免日光照射、高溫與受潮、遠離強力磁場,還需定期清潔磁帶機的讀寫頭(就像以前的錄音機或錄影機)。

歸檔儲存設備的競爭者

過去,磁帶在歸檔儲存應用方面的主要競爭對手,是光學儲存媒體,也就是光碟。

事實上,光碟與磁帶有許多相似之處,同樣都採取分離儲存媒體(光碟)與讀寫機構(光碟機)的設計,以及相似的卡匣抽換存取方式,具備抽換式媒體所帶來的擴展能力,與離線隔離運作特性,光碟也能提供WORM防竄改功能,亦可利用內含機械臂的光碟櫃,來處理大量光碟的載入與管理。

比起磁帶,光學儲存媒體的優勢在於更高的耐久性、可靠性與環境忍受能力,保存期限更勝磁帶,也沒有磁帶的捲繞故障問題。而在效能方面,兩者傳輸率旗鼓相當,但光學儲存的隨機存取能力高於磁帶。

光學媒體在歸檔應用中的劣勢則是儲存媒體的成本較高,且儲存媒體的容量遠不如磁帶。

舉例來說,即使是專門針對歸檔應用發展的新一代光碟儲存系統,如Panasonic與Sony推出的歸檔光碟(Archival Disc),或是Sony的光碟歸檔系統(Optical Disc Archive),單位容量成本雖較一般光碟低了許多,但比起LTO-8磁帶,仍高了10倍以上。歸檔光碟的單碟容量目前只達到300GB與500GB,內含10到12片光碟的光碟匣只能提供3.6到5.5TB的容量,遠遠不及LTO磁帶。

目前主流的LTO-8磁帶擁有單卷12TB的容量,新一代的LTO-9更達到單卷18TB,這也就是說,1卷LTO磁帶可以容納的資料量,若改用歸檔光碟,將須要耗用4、5片光碟匣(內含40到50片光碟)才能保存,這也會大幅增加管理的複雜性。

基於上述理由,使得光學媒體只有在較小規模的應用環境中,才有辦法與磁帶競爭。(歸檔光碟與LTO磁帶的規格對比,詳見上一頁附表)。

另一個歸檔儲存系統的「顯著」競爭者,是基於大容量、低轉速的低成本近線(Nearline)磁碟,結合分散式儲存軟體平臺,以及重複資料刪除技術的低成本磁碟儲存系統。

透過使用硬碟作為儲存媒體,這類儲存伺服器擁有遠高於磁帶的存取速度,管理也比依賴自動上帶機、磁帶櫃這些機械裝置的磁帶更為簡便與可靠,再搭配資料縮減率達到30:1到50:1以上的重複資料刪除技術,還能將單位儲存成本壓低,達到足以應用於長期保存資料的程度。

一些磁碟儲存系統產品如Dell Data Domain(現在的PowerProtect DD系列),便是以高效率的重複資料刪除功能,來切入歸檔儲存應用市場。

問題在於,基於硬碟的儲存設備,耐久性不如磁帶,必須每隔4、5年便更新硬碟、遷移資料,以確保資料儲存的可靠性,不像磁帶可保存10年以上。

除此之外,重複資料刪除技術對於不同性質的資料,縮減效果有著很大的差異,這也使得依靠重複資料刪除技術來壓低儲存成本的磁碟設備,在降低成本的效果上,存在著不確定性,若重複資料刪除效率不彰,那麼磁碟設備的成本將難以與磁帶競爭。

因此,如果只考慮5年的資料保存,那麼,低成本磁碟系統還能列為選項之一,但如果需要10年以上的長期資料保存,磁帶仍是更好的選擇。

所以,目前來看,這類低成本磁碟儲存系統更適合的角色,是與磁帶相互搭配,組成分層架構,由磁碟設備擔任資料歸檔的過渡中繼站,用於滿足快速取回近期資料的需求,而磁帶則擔任資料最終保存地點。

挑戰磁帶地位的公有雲儲存服務

無論是光學儲存、或是低成本磁碟設備,都未能挑戰磁帶在歸檔儲存應用中的地位。

而真正對其存在產生嚴重威脅的解決方案,主要是近年來誕生的公有雲歸檔儲存服務,因為,在成本、耐久、可靠、安全與管理便利性等方面,這類型產品都已能與磁帶一較高下。

堪與磁帶比擬的低儲存成本

公有雲儲存服務的底層,一般是超大規模的磁碟儲存設備,就成本來說,磁碟設備原本難以與磁帶競爭,而且公有雲儲存為了維持服務效能品質的穩定性,原則上都不使用重複資料刪除技術,無法藉此改善儲存空間效率。

但公有雲儲存的殺手鐧是「超大規模」透過超大規模的採購與系統建置,能大幅降低攤付到個別元件上的成本,從而提高價格競爭力。

除此之外,公有雲的歸檔儲存服務還會再搭配一系列政策限制,例如限制用戶端的傳輸率、檢索與取回資料的頻率,藉此大幅壓低公有雲服務商的維運負荷與成本。而這一連串措施結合起來,也讓公有雲歸檔儲存服務的費用,如今已經能與LTO磁帶競爭。

舉例來說,目前每卷12TB容量的LTO-8磁帶,價格最低可達70、80美元左右,也就是每GB成本約為0.006美元;而AWS、Azure、Google等公有雲服務商的歸檔儲存服務,月租費最低可達到每GB約0.001美元的等級,還不到磁帶的1/5。不過磁帶的採購成本是一次性的,而公有雲儲存服務則須持續付費,若以持續使用5年計算,公有雲歸檔儲存服務的每GB成本便要乘上60倍,仍高於磁帶媒體的費用。

不過,磁帶使用上,還要考慮到磁帶設備的建置與維運成本,這部分花費遠高於磁帶媒體的成本。相較下,公有雲儲存服務的應用,能為用戶省下本地端歸檔儲存硬體的建置成本及維運費用。

但另一方面,公有雲歸檔儲存服務也要考慮到檢索與取回資料的額外收費——若用戶需要取回的資料量較大,那麼取回資料的收費,可能會達到儲存成本的一半以上,從而會大幅拉高用戶使用公有雲歸檔儲存服務的總成本。

高度的耐久性與可靠性

磁帶的一大特點,便是擁有長期保存資料的耐久性,遠非一般本地端磁碟儲存設備所能比擬。

不過公有雲服務商以遍佈全球的超大規模資料中心基礎建設為基礎,搭配分散儲存機制,能將歸檔儲存服務損失資料的風險,降到足夠低的程度。

目前各主要公有雲歸檔儲存服務,多半都能提供99.999999999%等級的年度耐久性,這意味著在每年平均遺失物件的機率是0.000000001%,也就是說,公有雲並非不會遺失資料,但機率低到幾乎可以忽略。此外,公有雲服務商還會將資料分散複寫到3個分離的站點存放,也進一步提高了資料儲存的可靠性。

同時,就現實環境來看,公有雲服務商因為經濟、政治或其他非技術因素而停止服務的風險,還高於公有雲儲存系統失效的機率。

標準的企業級安全性功能

與擁有儲存媒體離線隔離、加密與WORM等安全性功能的磁帶相比,公有雲儲存服務則具有透過帳號的存取權限管制,以及軟體式的加密與WORM功能,除了沒有儲存媒體實體隔離外,其餘都能對應磁帶的安全性功能,已能符合多數企業環境的資安需求。

長期使用下的相容性

磁帶應用有一個麻煩之處,當磁帶規格更新時,將有無法相容於舊磁帶的問題,以LTO磁帶來說,每一世代的磁帶機,便只能向下相容兩個世代的舊磁帶,對於保存超過12至15年以上的舊磁帶,可能會有找不到可相容讀取的磁帶機之虞。

相較下,公有雲的歸檔儲存服務大多是建立在物件儲存系統平臺上,運作上是與底層硬體隔離,只要物件儲存格式相容,用戶即可存取。

極具吸引力的歸檔應用新選擇

公有雲歸檔儲存服務之所以能威脅磁帶,關鍵的原因還是在於成本,就長期使用的單位儲存費用來看,公有雲其實未必低於本地端的磁帶設備,但已經屬於同一個價格區間,此外還能讓用戶擺脫建置、管理與保存磁帶設備的負擔,因而成為十分有吸引力的選擇。

而這也正是光學儲存與低成本磁碟儲存設備,之所以難以取代磁帶的理由,儲存媒體的成本明顯高於磁帶,但卻又無法免除用戶的維運管理負擔。

對於公有雲本身而言,長期歸檔儲存服務,算是一項較新穎的雲端服務,雖然歷史還不長,但公有雲長期歸檔儲存服務,已經迅速成為企業用戶最感興趣的新興應用之一。

如市調研究機構Coldago不久前針對2059家美國與歐洲企業,所作的2021儲存與資料管理技術終端用戶報告,便顯示:考慮於2021年部署的儲存應用當中,「歸檔到雲端(Archive to Cloid)」位居第一,「備份到雲端」列第2,而近來聲勢浩大的「容器化儲存」應用則只居第三。

從「歸檔到雲端」與「備份到雲端」被用戶視為最高優先的兩項需求,也可看出公有雲上的低成本儲存空間服務,對企業具有強大吸引力,以及企業想擺脫磁帶的迫切需求。

備份與歸檔

我們這次的主題是歸檔(Archive)這項應用,所涉及的儲存媒體技術,但是,在許多場合,歸檔常常與備份(Backup)並稱,兩者都屬於支援性質,而非生產性質的第二線儲存應用,並且都使用磁帶等低成本儲存媒體作為存放設備,以致有時會有所混淆,但兩者的相似之處也僅止於此。就目的、操作對象來說,兩者都截然不同。

備份的目的是保護資料,藉由製作線上生產資料的複本,當原始資料損毀時,可利用備份複本還原。歸檔的目的,則是資料生命週期管理的一環,基於長期保存資料的需求(例如法規遵循),將線上生產資料轉存到長期保存儲存媒體上。

備份的產物,是獨立於線上生產資料外的「複本」,所以備份複本的損毀,不會影響線上資料;歸檔的對象則是「線上生產資料本身」,是將那些已經不活躍、很少有存取機會的歷史性資料,轉存到歸檔系統中,因此歸檔資料一旦損毀,也就損失了線上生產資料本身。

兩種應用的解決方案,側重點也有所不同。備份解決方案更重視還原效能,可以涵蓋個別資料、應用程式到作業系統的保護;歸檔解決方案則更重視長期保存資料的成本,以及個別資料物件(如個別電子郵件與檔案)的檢索與存取。

某種層面上,備份系統也能充當歸檔的角色,可以將備份複本長期保存,從而充當歸檔使用,但一般備份軟體缺乏歸檔軟體的個別資料物件層級精細檢索能力,作業效率有限。反過來說,歸檔保存的是歷史資料,而非複本,因而不能當作備份的角色。


熱門新聞

Advertisement