iThome

資料的完整性、安全、備份、備援等資料保護方面的問題與需求,可說歷久彌新,從我們這次調查可以看出,迄今仍是臺灣企業在儲存應用方面最關切的面向,尤其是關鍵應用的資料保護更是如此。

自以前至今,資料庫的備份與備援作業,都一直是企業資料保護需求中最關鍵的一環。許多關鍵應用的運行都是依靠後臺的資料庫支援,因而資料庫的完好與否,也決定了許多關鍵應用能否正常運作,連帶的,資料庫的備份與備援,也就成為企業資料保護中,最重要的一個環節。

理想上,資料庫必須7×24小時連續不斷地工作,但現實中並非如此,總是會出現各式各樣的原因,造成資料庫服務中斷,在我們的調查結果中,導致資料庫服務中斷的首要原因是IT硬體的故障,包括伺服器與網路故障,以及網路斷線。

為了維繫資料庫的可用性,並保護資料庫資料的完整性,企業使用了各種幫助保護資料庫的措施,在我們的調查中,最普遍的是最基礎的本地端備份與異地端備份。

IT硬體故障是資料庫中斷主因,但人為出錯比例也不低

我們來看有哪些原因造成企業的資料庫服務中斷。在企業回覆我們這次的調查中,IT硬體故障是造成資料庫中斷最主要的原因,排名前3名的原因—伺服器故障、網路斷線與儲存設備故障,都屬於IT硬體故障類型。

其次的原因是電力方面的問題,包括停電與電力設備故障,分別位於第4與第5名。接下來人員操作錯誤也占有一定的比重(約15%),至於其他原因如應用程式故障,使用量超過負荷、第三方供應商服務中斷與天災等,比重就相對低的多。

反過來說,從這個資料庫中斷原因排名來看,人為出錯難以完全避免,電力問題也不是單靠IT部門所能解決,若要降低資料庫服務中斷的機率,最有效作法便是設法降低IT硬體故障造成的影響,例如透過HA叢集架構的主機,或是多重配置的網路連線與儲存設備,就能抵抗造成資料庫服務中斷的最主要的硬體故障因素。

備份仍是企業當前資料庫主力保護機制

針對資料庫服務故障時的資料保護,有多種方式可以幫助維持資料庫的可用性,從最基本的本地端備份,到異地端備援,以至多主機叢集架構等。

我們的調查結果顯示,超過5成的用戶都建置了本地端備份與異地端備份,來作為保護資料庫的基本手段。至於在更進階的備援方面,無論是較便宜的本地端備援,還是較昂貴的異地端備援,都只有不到1/4的企業採用。備份可提供多時間點的複本保護,但必須進行耗時的還原程序才能恢復系統,不如備援可即時恢復系統,理想上是備份與備援兩者兼備。

另外較讓人注意的是,目前已經有1/4的企業,透過多主機HA叢集架構來提高資料庫的可用性,可以抵抗單一主機的失效,不過效果一般只及本地端。至於跨異地端的HA架構仍非常昂貴,但可提供目前技術水準下的最高層次的可用性,可以抵抗本地端大範圍的系統失效。

傳統實體平臺備份軟體仍是主流DB備份工具

備份是保護資料庫最基本的手段,在我們的調查中,採用本地端或異地端備份的比例也最高,接下來我們來看企業採用的備份工具。

如同意料的,儘管各種新興備份工具不斷湧現,但臺灣企業使用比例最高的備份工具,還是傳統實體平臺備份軟體,有超過1/3的企業使用。

但較讓人意外的是,在調查中使用比例排名第2的備份工具,是儲存設備內含的備份功能。目前只有較高階的儲存設備才提供這類工具,優點是可將備份作業負擔卸載到儲存設備上,減輕前端伺服器的負載。

至於近幾年來開始流行的虛擬平臺專用備份軟體,使用比例則與儲存設備內含備份功能並列第2名,這種新興備份軟體是專為支援虛擬平臺而設計,通常不支援實體平臺(或僅能有限度的支援),不過對於虛擬平臺的備份功能更完善,適用於虛擬化的重度用戶。

另外軟體平臺本身附帶的備份功能(VMware或Windows內含的備份工具),也有一定的使用比例,有1/4的企業使用,這種附帶的備份功能功能通常比較陽春,不過可免費取得是最大好處。

6成企業使用24小時一次的資料庫備份頻率

在備份作業的頻率方面,標準做法是每日(每24小時)執行一次備份,越密集的備份頻率,可以得到更精細的還原點,但耗費的儲存資源也越高。

不出意外的,超過6成的臺灣企業,還是以標準的每日一次為單位來執行備份工作,但有13.8%企業的備份頻率是超過24小時,就較讓人意外。以一般的企業應用來說,每24小時一次的備份頻率已經是最低的標準,可以讓資料回復到24小時前的狀態,若備份頻率超過24小時的話,則還原時損失的資料量將會太大,只適用於非關鍵性或異動頻率很低的應用系統。

合計起來,採用24小時以上的備份頻率的企業比例,占了超過2/3,採用低於24小時密集備份的企業,則不到1/3比重。

其中值得注意的是,有5%的企業採取低於1小時的作業頻率,這是非常密集,但也非常耗費資源的備份頻率設定,一定程度反映了當前臺灣企業中,擁有極具時間敏感性的關鍵資料、以致必須如此密集執行備份的企業比例。

備份時間太長是企業資料庫管理的最大挑戰

到了2017年的今日,仍有將近30%的企業,把備份時間過長列為資料庫備份的主要挑戰,不過這也和我們前面調查中臺灣企業最普遍使用的備份工具,是傳統實體平臺備份軟體這個結果相符。由於備份工具的使用較保守,以致未能充份應用新一代備份工具,以及當中提供的重複資料刪除、壓縮等資料減量技術。

在我們這次調查中,其他被企業列為資料庫備份作業主要挑戰的問題,如無法確認備份成功率、備份儲存成本過高、還原時間過長等,也可歸因於備份工具比較老舊、保守所導致,新興的備份工具有一系列新技術與新功能,可以幫助確認備份完好與否、快速還原與節省儲存成本,從而緩解這些問題。

但從另一方面來看,備份是個持續、不能中斷的作業,考慮到必須繼承過去留下來的備份,以及在備份工具上的投資,備份工具也難以輕易更換。

資料庫服務中斷後多快恢復?多數企業至少6小時

資料庫備份與備援的目的,就是有朝一日在資料庫服務中斷時,能幫助盡快恢復資料庫的運作。這裡我們就來看資料庫服務中斷後的還原情況調查結果。

在資料庫中斷後需要的恢復時間方面,占最大比例的是12~24小時,有30%企業在發生資料庫服務中斷後,需要半天到一天的時間來復原。但也有大約1/4的企業,可以在更短的3~6小時內讓資料庫復原。

一般來說,3~12小時的還原時間,也就是半天以內恢復中斷的資料庫服務,是目前多數企業所能達到與接受的標準。

至於若要要在1小時內就讓資料庫恢復,則通常得有較高階的備援系統支援,在我們的調查中只有14%的企業能達到這個層次。

另外還有將近15%的企業表示,他們需要超過24小時的時間,才能讓資料庫恢復服務,以目前的標準來看,這是較低的表現,與資料庫連結的相關應用與業務會因此停擺一天以上。

1小時復原!過半企業資料庫還原時間的未來目標

前面的統計是目前企業「實際能達到」的資料庫還原速度,至於在企業「期望能達到」的還原速度方面,超過50%的企業都期望他們的資料庫能在1小時內恢復,但實際能達到這個層次的企業只有14%,期望與實際之間有著相當大的落差,要達到這樣高水準的還原時間,必須增加備援系統的投資才能辦到;其次的還原時間期望值是3~6小時,有將近1/4的企業選擇,實際能達到這個層次的企業比例也大致是1/4,期望與實際的比例相符合。

企業能達到的資料庫還原時間,是取決於資料庫的大小,以及使用的備份備援系統能力。對於傳統的備份來說,能在3~12小時內還原已經是不錯的表現,若要達到1小時以內恢復的理想目標,就不能只依靠傳統備份,必須建置備援系統。若不想耗費巨資在備援上,一些新興技術提供了另外的選擇。例如一些基於映像型式的虛擬平臺專用備份軟體,以及可搭配特定資料庫的儲存設備快照功能,都能幫助企業達到加速資料庫還原時間的目標。

無法保證完全不掉資料,僅92.2%企業能完整復原資料庫

以最近一次還原時間為基準,當透過備份與備援系統,來恢復中斷服務的資料庫時,超過90%企業表示,他們的資料庫在中斷後能夠完整還原,其中能在要求時間內完成還原的比例占75%,另有17%比例是資料庫能完整還原,但需要的還原作業時間超過預期。至於還原失敗或未能完整還原資料庫的比例則約8%。

這樣的結果顯示,即便現在的備份工具與備援系統都已經相當成熟普遍,但企業執行資料庫還原時,仍沒有接近100%的成功率,仍有一定的比例無法完整還原。

單就統計數字來看,不到10%的還原失敗比例乍看不高,但資料庫連繫著企業關鍵應用,僅僅一次還原失敗,就可能會對企業的業務運帶來嚴重傷害,突顯了平日驗證備份完好與否的重要性。


Advertisement

更多 iThome相關內容