異地互援概念的萌芽
別於過去備而不用的思考,異地機房的角色開始產生一些變化,企業試著在既有的投資中,延伸異地機房所能發揮的功能,或是規畫雙中心架構,觀念上的轉變,是異地互援概念萌芽的關鍵。

從異地備援到異地互援
企業著手異地備份/回復的做法和策略不斷在蛻變,異地機房不再是默默守候的角色,還可以為主機房分憂解勞,甚至平起平坐,或者異地機房本身也可以是主機房。

企業營運永續管理有標準可循
企業營運永續管理(BCM),近年來受國際高度重視,因此企業更加注重提升災難回復的能力,新的BS25999規範,將可作為企業落實BCM的基礎,而企業的備援計畫也能以此作檢視。


異地互援案例

 


衛生署建構兩地互援機制
衛生署現階段是以資料備份為主,未來則規畫將最核心的系統也增加備援主機,當災難發生時,就能從遠端開啟作業。

長春石化強化備援機制讓業務不中斷
長春石化的主機房與備援機房之間是以8Mbps的光纖連結,並用E1專線作為備援網路,透過飛康的IPStore將ERP系統/資料作遠端複製,而異地機房內有備援的伺服器、資料庫和儲存系統。

第一銀行年底走向雙中心架構
對於第一銀行來說,臺中的備援中心不再只是備援之用,而未來在規畫時,也會將主中心與備援中心共同考量,若能把兩者的資源整合,便可讓成本和設備維護費用下降。

矽品精密用5層資料讓業務不中斷
為了徹底落實企業永續經營,矽品精密從2003年開始建置異地機房,除了備援之外,還提供報表、備份等功能。異地互援概念的萌芽

異地機房若僅是備而不用實在太浪費了,而且好像非得等到災難發生時,才能感受到異地機房的『價值』,但這又是我們最不願意見到的!」「我希望異地機房不僅作為備援之用,平常也可以使用,才能讓異地備援的投資效益最佳化。」

別於過去備而不用的思考,異地機房的角色開始產生一些變化,企業試著在既有的投資中,延伸異地機房所能發揮的功能,或是規畫雙中心架構,而主機房與異地機房之間的關係益加緊密,「異地互援」的思維便應運而生。

企業對於備援機房有更多期待
從「異地機房只能備而不用」到「如何發揮異地機房的最佳效益」,觀念上的轉變,是異地互援概念萌芽的關鍵。除了思考的轉變外,我們更發現,有越來越多的企業在規畫異地機房時,更實際落實異地互援的思維,將異地機房與主機房視為一體共同評估。而企業之所以會做異地互援,主要的目的不外乎為平衡負載、降低整體成本、善用現有資源以及提升備援的機動性等。

2003年,封裝測試大廠矽品精密開始著手規畫異地機房,加上當時由於業務不斷成長,資料量越來越龐大,ERP資料庫的效能便隨之下降,而矽品希望能同時解決所有的問題,於是將報表、備份作業從主機房移至異地機房,也徹底解決過去效能不佳的問題。矽品精密資訊處協理廖學銘表示,當初在規畫時,不僅只是從備援的思考角度,而是從整體IT架構做規畫,包括資料備份的機制也是如此,他進一步表示,這樣的建置,讓資料保護更加完善。

「備援中心的主機資源有一半是閒置的,為何不將主機房與異地機房的資源重新整合呢?」第一銀行資訊中心系統營運處處長李進富表示。適逢大型主機即將汰換,第一銀行評估整合主機房與異地機房的作業,預計將大型主機從3臺減為2臺,異地機房將接手原本在主機房的測試開發作業,而第一銀行僅需再提升頻寬即可,新架構預計在年底前完成。

此外,第一銀行也計畫增加異地機房的磁帶備份工作,欲透過網路將資料複製至遠端的磁帶機上。過去第一銀行必須每周固定將主機房的磁帶再運送至另一個分行,若改以網路備份至遠端,不僅可減少磁帶運送作業,也降低磁帶遺失而造成資料外洩的風險。「對我們來說,異地機房不僅是備援機房,我們將它稱為雙中心架構,」李進富表示。

衛生署資訊中心簡任技正黃偉宏則認為,其實只要頻寬足夠,兩地間互相備援便不是問題。行政院衛生署於2005年完成與全國醫療服務中心之間互相備援的架構。

類似這樣的案例越來越多,有更多的企業,希望異地機房能發揮更多功用,比如進行測試開發、資料探勘(Data Mining)、報表等作業。飛康國際亞太業務暨行銷副總裁江志祥表示,以其某一個製造業客戶為例,每天會將大陸工廠ERP系統的資料傳回臺灣總公司,以同時做為報表產出和備份之用,能在現有投資上提供更多功能,何樂不為?

以遠端叢集做異地互援確實可行
為了要徹底落實企業永續經營(Business Continuity,BC),國內某家壽險業者從去年年底開始著手異地備份/回復計畫。該企業在臺北和臺中各有一個機房,各有獨立的網頁伺服器、應用程式伺服器和資料庫,在臺北機房內則有另一套備援主機,以建構HA(高可用性)環境。

但該企業希望在既有的投資上進行異地備份/回復,於是,便規畫將臺北和臺中的伺服器作遠端叢集(Remote Cluster),讓兩機房的伺服器能互相備援,因此就不用另外再採購硬體設備;而資料會集中至臺北的資料庫,再同步複製至臺中機房的資料庫,於是兩地都擁有相同的資料、系統,若主機房發生災難,異地機房便能及時承接作業。

在評估系統、應用程式、網路頻寬均可配合後,該企業的異地互援架構已確定可行,預計今年開始進行,最快可望在年底前完成。

有賴於設備、複製技術和網路頻寬的演進,遠端叢集的架構已不再是難事,且確實可行。IBM整合資訊服務部經理郭健男表示,目前已有客戶在規畫多中心運作架構,除了預計將伺服器作遠端叢集外,還計畫透過前端的負載平衡伺服器,依據政策設定,將運算作業分配至主機房或異地機房的網頁伺服器、應用程式伺服器。

一般來說,主機房-異地機房的架構可分為3種類型,分別為Active-Standby、Active-Testing、Active-Active。Active-Active的定義則略微不同,有些意指異地機房也能負擔系統運算,甚至透過動態分配的方式,達到負載平衡的效益,有些則認為是指兩機房之間互相備援的架構。

以IBM提出的多中心運作概念為例,便是Active-Active的架構,郭健男表示,多中心運作架構的概念雖已提出1~2年,但直到今年國內才有企業要真正開始落實,他指出,主要的改變是在於企業對於異地備援觀念的轉變,加上技術的配合,「天涯若比鄰,讓過去僅在同一個機房內實現的架構,也延伸到兩地機房中了。」

然而,若要真的做到遠端叢集,還需頻寬的支援,距離也不可太遠,一般來說,約在50公里內是較恰當的距離,此外,應用程式還必須重新設定參數,因此,未必適用於每個企業。賽門鐵克(Symantec)技術顧問副理孫秀婷表示,過去便曾遇過企業欲做遠端伺服器叢集,但因為現有應用程式無法配合,於是作罷。

以財金資訊為例,也在約3年前嘗試大型主機遠端叢集的架構。財金資訊安控部組長鄧介銘表示,當時測試的結果,發現效能不如預期,原本預計可以提升到每秒執行300~400筆資料,結果發現約到300筆就幾乎快不行了,另一方面,因為應用程式與系統開發是兩組不同人員,所以應用程式要重新修改時,也遇到了瓶頸,最後於是擱置。

財金資訊目前則又重新開始測試遠端叢集和平衡負載的架構,並從大型主機開始,預計下一階段會將開放系統也作遠端叢集。鄧介銘表示,雖然作遠端叢集的費用很高,但考量到業務不中斷,所以除了在本機房已經建構HA架構外,還希望再進一步提升異地機房馬上接手作業的能力,他表示,「對客戶來說,我們可以提供更高的保障,而這也是我們的優勢!」

備援還是互援?需視不同企業需求而定
異地互援的概念不一定適用每個企業型態,事實上,若要增加異地機房的使用,可能需要增加其他費用,如網路頻寬、硬體規格、軟體等,計算之下,整體成本未必較低,且異地互援的架構相對更加複雜,甚至需要另外增加異地機房的人力管理。

企業的災難復原機制又往往是配合整體IT架構而制定,以日月光而言,由於是採分散式架構,所以在3個機房之間相互備援,以某一個機房為例,便依據不同的系統,將資料複製至另外兩個機房,且由於3個廠區均是採用相同的儲存系統,因此僅要在現有的架構下,增加遠端複製的軟體費用即可。
長春石化早期為分散式架構,各個廠區的資料必須自行備份,廠區之間再互相備份。為了集中資源和統一管理,長春石化從2002年開始轉為集中化架構,將臺北作為整個IT架構的心臟,其他廠區再透過網路與臺北機房連接,但這樣一來,臺北機房的運作就攸關其他廠房的運作,風險也大幅提升,於是長春石化開始規畫備援機房,2003年,苗栗的備援機房於是成立。

HDS技術總監張憲桐表示,許多企業確實想落實雙中心的架構,讓異地機房能充分利用,但可能要再增加遠端機房的人力配置,管理成本便會提高,若要進而做到遠端叢集,系統的穩定度則是很大的挑戰,國外雖有許多企業已採用這樣的架構,但其企業規模夠大,未必適用於臺灣企業,若企業若採用這種架構,也要有心理準備,可能比升級硬體和設備的成本高出許多。從異地備援到異地互援

「互援」這個用詞,主要是欲對照「備援」而使用,財金資訊安控部組長鄧介銘便認為,備援一詞讓人多少有浪費、備而不用的聯想。

我們談異地互援並非要宣揚一項新的技術,而是欲強調主機房和異地機房之間的關聯性和互動性越來越深,這背後顯示的,是企業在規畫異地機房時的思考更加全面,不論異地機房可以發揮多少功能,企業都不再只是為了備援而備援,而是為了永續經營所做的努力。

隨著相關建置案例越來越多,企業著手異地備份/回復的做法和策略也不斷在蛻變,有趣的是,我們發現異地機房不再是默默守候的角色,還可以為主機房分憂解勞,甚至平起平坐,或者異地機房本身也可以是主機房。


圖一是典型的異地備援架構,所有網頁伺服器、應用程式伺服器均處於「Standby」的狀態,當災難發生時,再將作業從主機房切換至異地機房,想當然爾,企業決不會希望有機會「使用」到異地機房,因為那往往意味著災難的發生。

圖二是異地互援的某一種類型,網頁伺服器、應用程式伺服器均處於「Active」的狀態,透過平衡負載伺服器,平均分擔運算作業,或是根據政策設定,將某些作業移至異地機房,然後再透過網路集中至主機房的資料庫上,而伺服器之間由於進行遠端叢集,因此當災難發生時,也能即時接手所有的作業,這樣的架構,在國外已經有許多企業採用,國內則有企業正在測試中。

然而,未必要透過遠端叢集的方式,才可達到異地互援。比如將複製至遠端的資料,再善加利用,包括做為測試開發、資料探勘、報告產出、備份等使用,也都是異地互援的做法,比如矽品、台新銀行、第一銀行、衛生署,都是採用這種做法。

此外,也有企業根據本身的架構而做異地互援,如許多製造業者,由於有許多廠區,因此透過不同廠區之間互相備份,包括將磁帶運送至其他機房的方式,另外,也有更多的業者開始採用線上複製作遠端備份,讓資料的備份更即時,如日月光等。

究竟該採用哪種方案做異地備份/回復,還需視企業本身的定位、IT架構而定。宏碁eDC處長吳乙南表示,以其某一位金融業客戶為例,每天將磁帶從臺北快遞至龍潭eDC的異地機房,然後作回復,這樣的方式仍可確保災難發生時,異地機房可接手所有作業,雖然資料遺失的時間差可能為一天,但此業者的資料更新頻率較低,且網路政策限制做線上複製,因此也不得不這麼執行。

異地互援是策略上的思維,企業要做異地備份/回復時,仍必須從營運不中斷的角度來評估,才能找到最適合自己的做法,而異地互援的思維,是希望能為欲著手災難復原計畫的企業,帶來一些不同的思考角度。企業營運永續管理有標準可循

針對企業營運永續管理(Business Continuity Management,BCM),英國標準協會(BSI)制定一項新的標準BS25999,其作業準則已於去年年底公布,並預計於今年年中會公布檢驗標準。

BCM近年來受國際高度重視,因此企業更加注重提升災難回復的能力,BSI訓練部協理蒲樹盛表示,新的BS25999規範,將可作為企業落實BCM的基礎,而企業的備援計畫也能以此作檢視。

以處理的風險來說,可從避免風險、降低風險、轉移風險和接受風險等方向考慮,蒲樹盛表示,而BS25999中欲強調的是,許多風險其實都可事先預防,但有賴於企業對於營運的了解、BCM文化的建立與深化,以及擬定一套完善的營運永續計畫(Business Continuity Plan,BCP),才能將災難和管理缺失造成的營運中斷情形降至最低。

BS25999共分為BS25999-1與BS2599-2兩部份。BS25999-1為企業要落實BCM的作業要點,企業可依此建立一套企業營運永續管理的作業框架,從風險評估(Risk Assessment,RA)、營運衝擊分析(Business Impact Analysis,BIA)、策略制定、營運永續計畫的撰寫和實施、BCM的測試、維護和重新評鑑等,以及BCM文化的制定,都有其實務做法的參照準則,BS25999-1已於2006年公布,計畫將取代PAS 56。

BS2599-2為驗證的標準,預計於今年年中公布,蒲樹盛表示,目前已經有許多企業開始詢問,其中又以金融業者居多。

從永續經營視角看災難復原
目前以金融、電信業進行異地備份/回復的比例最高,高科技製造業者次之,服務業則僅有少數實際落實,但隨著企業對於永續經營的認知越來越深,有更多企業開始著手災難回復計畫。

屈臣氏曾因納莉颱風,導致松山區機房淹水,甚至連銀行地下室保險箱的磁帶也受大雨侵襲,讓當時的營運大受影響,包括許多作業必須以人工代替,許多寶貴的資料甚至付之闕如。屈臣氏資訊部副理張善宏表示,相較於業務停擺所受的損失,投資災難回復的成本相對少的多,於是在2004年開始規畫備援中心,並於2005年完成。

一般來說,業務中斷而造成的損失會隨著時間的增加成二次曲線成長,主要不僅是有形成本的損失,更重要的是無形成本的受損,如商譽、品牌等。

為了確保營運不中斷,新竹貨運便於2006年也完成備援機房,為流通業者中少見的案例。新竹貨運資訊處處長彭垂乾表示,2003年年底便開始進行第一次的評估,但當時由於是採分散式的架構,全省42個營業站都是獨立運作,因此當時沒有那麼急迫;2004年,新竹貨運開始轉向集中式架構,風險便集中在台北的主機房,於是又於年底重新評估,但礙於經費,最後便暫時擱置;2005年,南亞大海嘯發生,促使新竹貨運重新面對營運中斷的風險,於是在7月時進行第三次的評估,11月開始執行,並選定以新竹機房為備援中心,約於2006年3月完成。

而新竹貨運對IT依賴之深,也為建置備援中心的推手,彭垂乾表示,以GPRS的導入為例,將過去派遣時間從平均30分鐘縮減至2秒鐘,配單送達的時間從4個小時縮減至20分鐘,而簽收單的確認更從4個小時縮減至6分鐘,對新竹貨運來說,一旦資訊系統中斷,影響非常大,因此資料的保護措施也須更周詳。

無論是規畫異地互援還是備援,都是為了擁有災難復原能力,而災難復原是企業永續經營管理中的一環,因此企業還是必須回歸永續經營的角度思考,才能在充滿挑戰的環境中更加屹立不搖。衛生署建構兩地互援機制

行政院衛生署於2001年年底整併北、中、南的區域資訊中心,成立全國醫療服務中心(Service Center,SC),主要提供對外資料查詢和服務,而SC是隸屬於衛生署中心下的機構。

為了提升對資料的保護,衛生署中心(Department of Health,DOH)除了在本地端進行資料備份,也開始計畫將資料備份至遠端,於是,2003年年底開始落實計畫,透過E1專線,將儲存系統EMC CX600的資料複製至SC機房新購的儲存系統CX500。

2005年年中,由於有充裕的經費,於是衛生所又規畫將SC機房的資料也備份至DOH機房,共包括衛生所衛生便民服務資訊、長期照護資訊、醫事管理、戶政異動通報、醫療數位學習資訊、子宮頸抹片,以及衛生人口死亡通報等系統,於是公開招標,最後選用飛康國際(FalconStor)的IPStor方案。

由於兩端複製的方式不同,從DOH至SC的資料是以儲存系統層級的EMC方案作遠端複製,但從SC至DOH則是採用網路層級的IPStor方案,衛生署資訊中心簡任技正黃偉宏表示,人員必須學習兩種機制,無形中提高了管理複雜度,但採用不一樣的複製方式,也有風險分散的好處。

隨著資料量日漸增加,2Mbps的網路頻寬已難以應付更多的作業,從2006年年中逐漸出現複製延遲的情形,於是衛生署又新增T3專線。現階段已經將DOH至SC的遠端複製作業轉至T3網路上,並預計今年會將SC至DOH的複製作業也移到T3網路上,並撤掉E1專線。

衛生署現階段是以資料備份為主,黃偉宏表示,未來則規畫將最核心的系統也增加備援主機,當災難發生時,就能從遠端開啟作業。長春石化強化備援機制讓業務不中斷

長春石化集團的業務涵括印刷體電路、半導體、塑膠、紡織、汽車等各種不同的產業,廠區分散在高雄、臺南、桃園、江蘇等地,要控管這些分散的資源且穩定營運,均有賴於背後完善的備援機制。


長春石化除了在主機房都有一套備援措施外,異地機房也建置一套備援系統,讓資料風險降至最低。


長春石化早期為分散式架構,各個廠區的資料必須自行備份,廠區之間再互相備份,優點是各個廠區的作業不會互相影響,即使一個廠區停止運作,其他廠區仍能繼續營運,但缺點是資源分散,且資料有不同步的問題。

為了集中資源和統一管理,長春石化從2002年開始轉為集中化架構,在整體網路的規畫上,共有3道防線,分別為E1專線、ADSL以及3G無線網路,各廠區可透過這3種方式連回總公司。長春石化資訊中心部長黃至善表示,剛開始對3G充滿疑慮,不知道是否能應付公司資料的傳輸,但後來發現該公司ERP系統平常的傳輸速度約維持在100~200kbps,而3G可以提供超過300kbps的傳輸速率。他表示,2005就曾發生臺電施工意外,同時挖斷高雄廠區的專線和ADSL固網線路,於是才又增加3G網路,讓網路備援更完善。

將台北作為整個IT架構的中心後,雖可集中管理,但這樣一來,臺北機房的系統運作就攸關其他廠房的運作,風險相對大幅提升,於是長春石化開始規畫備援機房。考量到苗栗廠區約位於所有廠區的中心,且有自己的氣電廠,即使停電了,還能自行供電,2003年,苗栗的備援機房於是成立。

目前長春石化的主機房與備援機房之間是以8Mbps的光纖連結,並用E1專線作為備援網路,透過飛康的IPStor將ERP系統/資料作遠端複製,而異地機房內有備援的伺服器、資料庫和儲存系統。

而臺北主機房內的備援機制也非常完善。長春石化將應用伺服器分為石油事業和人造事業群兩區,且兩區之間互相備援,當一區網路中斷時,可由另一區的伺服器接手作業;ERP是採用Oracle資料庫,之間也以RAC(Real Application Cluster)互相備援。

長春石化資訊中心課長賴恆暉表示,雖然許多技術都可以讓IT更加自動化,但完全自動化未必最好。長春石化過去也曾試過在本地機房內作伺服器叢集,卻發生伺服器輪流當機的情形,而叢集架構就很難找出問題點所在。又以廠區與主中心的網路連線為例,是讓使用者自行選擇登入的方式,而非自動分配,若連線發生問題時,就可馬上知道該修復哪個網路。長春石化次要的資料是以各廠區同地備份為主,下一階段則預計透過廠區間的儲存系統互相複製。第一銀行年底走向雙中心架構

第一銀行從早期以磁帶異地備份,開始轉向線上異地備份,直到兩年多前完成臺北主機房與臺中備援機房的同步複製,除了大型主機之外,開放系統的主機也已逐步進行遠端複製。

在大型主機系統方面,第一銀行目前的主機房共有兩臺設備,一臺為正式運作,另一臺則作為同地備援和測試開發之用,備援中心也有一臺主機,以作為異地備援之用。

第一銀行資訊中心系統營運處處長李進富表示,過去受限於網路頻寬不足,若要將測試開發作業移至異地機房會有困難,但目前是透過DWDM技術傳輸,頻寬約為17.5Gbps,且可再增加,在這樣的利基下,第一銀行於是思考是否可利用現有設備,將主機房的部份作業轉移至備援中心?於是便規畫將原本測試開發的主機功能轉至備援中心的機房上。

第一銀行將新架構稱為「雙中心架構」,李進富進一步解釋,之所以會如此定義,是因為對於第一銀行來說,臺中的備援中心不再只是備援之用,而未來在規畫時,也會將主中心與備援中心共同考量,且對於網路管理人員來說,就如同是一個中心。他表示,主中心和備援中心的資源若能整合,便可讓成本和設備維護費用下降。

而第一銀行主機房的備份機制,除了將資料備份至虛擬磁帶櫃(Virtual Tape Library,VTL)、實體磁帶之外,還會將磁帶運送至臺北的另一處分行,以做第三地備份。

但磁帶傳送的過程中,仍會有資料遺失的風險,若要進行實體磁帶加密,又必須再投資大量的金額,因此,第一銀行也預計透過網路在異地機房做磁帶備份,因此就可不用再透過人工運送磁帶,既降低資料遺失風險,又減少運送作業。

在開放環境上,以主中心而言,目前則約有200~300臺主機,而第一銀行也根據系統的重要程度,將部份系統透過Falconstor IPStor以非同步方式複製至備援中心,此外,也利用VMware的虛擬化技術整合伺服器,以減少主機房和異地機房的主機設備,而降低整體投資。

另一方面,第一銀行非常重視災害演練,並制定好一套完整演練計畫。當營業時間中發生災害時,會由「應變處理總指揮」進行評估,再決定是否啟動備援機制。而各個流程也明確定義處理時間,此外,也依各業務的重要性,將業務分為4個等級,以第一優先為例,便包括支票存款、存摺存款和ATM系統。矽品精密用5層資料讓業務不中斷

為了徹底落實企業永續經營,且由於在美國Nasdaq上市,因此必須遵循如美國沙賓法案等相關安全法規,封裝測試大廠矽品精密從2003年開始著手建置備援中心。

以矽品而言,主要業務為晶圓代工,因此高度依賴資訊系統,一旦系統中斷,相當於所有業務中斷。矽品精密資訊部協理廖學銘表示,以2006年的營業額為例,約近600億元,若業務中斷,粗略計算,相當於一天損失近2億元,而這僅是可量化的成本,若加上無形成本的損失,恐怕遠大於這個數字!

站在整體IT架構上規畫異地機房
為了著手災難復原計畫,矽品當時便成立異地備援專案小組,主要負責跨部門協調和專案執行,首要任務則是集合各部門的重要主管,共同討論各系統中斷對於業務的衝擊與影響。廖學銘表示,要著手備援計畫,必須從企業永續經營的角度規畫,而唯有各個部門的配合,才能順利完成。

根據系統的重要性,矽品將系統歸類為3個等級,分別為馬上回復、必須在5小時內回復以及3天內回復,然後將需要快速回復的系統和資料,如ERP系統和關鍵性的電子郵件等,備份至異地機房。廖學銘表示,不同的資料需配合不同的備份政策,否則全部的系統和資料若都要做異地備份,成本就太高了。

當時矽品同時面臨資料庫效能越來越差的問題,已難以應付不斷增加的資料量,於是矽品將占整體30~40%運算資源的報表作業移至異地機房的主機上,以減輕主機房的負荷,此外,也讓異地機房負責備份、開發測試作業。

而矽品也將許多既有的設備搬至異地機房,再添購新設備至主機房,同時升級硬體規格,包括新購一臺儲存系統HP XP1024,然後將原有的儲存系統HP XP128移到遠端機房。

五層資料保護讓風險降至最低
在評估完整個架構後,矽品於是開始規畫資料儲存的機制,以確保資料的安全。考量到不影響主機的效能,於是矽品選擇採用透過XP1024上的Continuous Access功能,將資料以鏡射(mirro)方式同步複製至遠端的XP128上。

為了讓遠端機房能進行報表和備份作業,又不影響系統的效能,XP128上的資料會透過HP OpenView Storage Data Protector軟體,每隔4小時在該系統上再備份一份資料,並以此備份資料作為報表產出使用,然後每天再將資料備份至主機房和遠端機房的磁帶上。

矽品的整個資料備份流程,也針對資料可能遺失的各個環節而有縝密的考量。以存放在XP1024上的第一份資料而言,同步複製至XP128,可確保同一份資料有兩份,當主機房的XP1024設備發生故障,便可將作業切換至遠端的XP128上,而不遺失任何的資料。

但兩份即時資料仍有同時遺失的風險,比如XP1024資料庫發生錯誤,XP128上的資料也會受波及,或是XP1024資料庫上某份重要資料可能不慎被誤殺,XP128資料庫也會同步作業,因此,藉由在XP128上的備份資料,便可進行回復,而資料遺失的風險最高為4個小時的時間差。

當XP1024和XP128兩臺設備都同時故障,則可透過磁帶回復資料。若主機房不幸發生災難,網路無法連線時,還能啟動備援網路機房,將作業切換至遠端機房,約在1小時內就能繼續營運。

在建置的過程中,矽品要面臨的最大挑戰,便是必須讓業務不中斷,於是根據不同系統搭配線上、非線上搬移的方式進行。廖學銘表示,每次停機都必須選擇在星期日凌晨進行,因為那是最不影響作業的時段,除了搬移前和搬移後,有兩次各停機最長4個小時外,其他的停機時間都縮短在1個小時之內,因此每一次停機前,都要再三演練,才讓搬移作業得以順利完成。

值得一提的是,矽品兼顧成本的考量,不僅要將資料線上搬移,也將原本效能較好的硬碟搬移至XP1024上,然而,這也增加了搬移的複雜度。首先,矽品先將XP128上的資料備份一份至該系統上較便宜的硬碟上,再將資料線上搬移至XP1024上,然後做切換動作,讓XP1024承接作業,最後再將XP128上較貴的硬碟搬移至XP1024上。

廖學銘也指出,在規畫異地備份的架構時,可以同時結合階層式儲存架構規畫,以讓資料保護更完整,而現有磁碟備份的技術也越來越多樣,因此,矽品也開始在測試連續資料保護(Continuous Data Protection,CDP)方案。

在整體儲存架構上,矽品精密不僅建置儲存區域網路(SAN),還根據次要的系統規畫網路附加儲存(NAS)和直接附加儲存(DAS)架構,廖學銘表示,矽品精密是高度重視架構的企業,根據不同的系統,都有相對應的架構,另外,若是較次要的資料和檔案,則是廠區和分公司自行儲存。

永續經營是企業最重要的事
自2004年完成雙數據中心架構後,矽品在2005年再建置雙網路架構,在主機房和備援機房的另一棟大樓上,各建置另一個網路機房,今年則預計會建立雙認證架構,即使某一個網路斷線,員工也可以從另一個網域登入。

矽品新的彰化廠區最近開始動工,廖學銘表示,現階段可能會先考慮將遠端機房搬移至新的廠區,以拉遠兩地機房間的距離,而提高異地互援的安全性,未來則不排除3地備援的可能性,因為永續經營是企業最重要的事。


Advertisement

更多 iThome相關內容