中國人壽資訊工程部資深副理林成鑫表示,虛擬化以後,IT人員對於企業內部的作業流程要更精確掌控,隨著流程設計產生的IT需求做最妥善的配置。

圖片來源: 

iThome

中國人壽在2006年首度導入虛擬化,歷經5年,所有臺北機房共200臺x86伺服器已經全數虛擬化,今年6月開始,他們還打算將分公司、備援端也全數虛擬化。

現在許多企業為了降低風險,導入虛擬化都從測試環境開始,中國人壽也不例外。不過,光是在測試環境導入虛擬化就帶來不少效益。中國人壽資訊工程部資深副理林成鑫表示,在測試環境導入虛擬化就為公司減少了將近3成費用。但是,這些節省的費用並非因硬體減少而來,而是來自軟體授權費的節省。

目前不少軟體授權費用是以處理器計價,甚至還會計算處理器的核心數,再依照核心數多寡訂出每單位的價格,即使用於測試環境,企業仍要付軟體授權費,另外,不同的應用軟體也必須再依照各自使用的硬體數付費,但虛擬化以後,只要調配好不同系統上線測試的時間,就可以讓不同系統共用一套硬體。

舉例來說,中國人壽的會計系統、保險核心系統與應收票據系統是各自獨立的,過去在測試環境的授權費用也要購買三套,計費方案也選擇較昂貴的不限連線人數版本。林成鑫表示,虛擬化以後,只要資源切割清楚,並且分配好工程師上線測試的時間,提高軟體使用率後,就只需要負擔一套的軟體授權費用,在選擇計費方案時,也改成最低用量門檻的計費方式。

虛擬化對企業來說,不僅能減少支出,也可以達到成本控制。林成鑫表示,在虛擬化的過程中,發現許多硬體的使用率都偏低,代表企業的IT投資往往會高估,而虛擬化中動態配置的功能就能提高硬體的使用率,也讓IT的投資會真正隨著企業業務成長。而不是每隔2、3年就要投資一筆鉅額費用。

測試環境虛擬化之後,中國人壽的虛擬化旅程,在2009年邁入第一階段VM1,除了逐步將新專案轉移到虛擬化環境運行,重點是將老舊機器以及原廠不支援的舊版作業系統環境,都先虛擬化。藉由軟體解決了硬體的問題。

接著,2010年初開始第二階段VM2,中國人壽花了一年多的時間,將臺北機房所有x86伺服器上的系統全都轉移到虛擬化的環境中運行。

在前面這幾個階段,他們其實遇到一些困難,並且預計在今年6月開始第三階段VM3來解決這些問題。

網路交換器支援虛擬化才能最佳化網路配置

首先,由於中國人壽在4年前建置的底層網路骨幹設備,沒有支援虛擬化的功能。林成鑫表示,當虛擬機器不斷搬遷,若網路交換器不支援虛擬化,就無法進行網路配置的最佳化,而且,當網路出現問題時,也無法透過vCenter找到問題發生源。因此,接下來他們打算更換新一代的網路交換器,一旦虛擬機器搬遷不需要再重新設定就可自動建立網路對應,也有利於網路資源的監控。

另外,在儲存面也遇到困難,雖然在第一階段時,中國人壽就已經建置了2套大型的儲存池,並且在伺服器端採用2條8Gb的光纖網路整合成1個16Gb的光纖網路架構,增大了頻寬。不過,由於當時並沒有導入儲存虛擬化的管理工具,再加上因營運業務產生的大量影像格式檔案,導致儲存設備頻繁讀取輸入資料,加重了I/O存取負擔。林成鑫認為,在VM3階段會導入儲存虛擬化的管理工具,為了改善I/O瓶頸,他也打算申請經費購買存取效能更好的SSD硬碟,來加快使用者開啟影像檔案的速度。

虛擬化監控管理工具應該具備預警功能

一次導入200臺規模虛擬化工作,當然在管理上也得下不少功夫。林成鑫表示,過去管理虛擬環境時都是透過vCenter監控,這個作法有幾個缺點,像是無法在同一個畫面看到全部虛擬機器的狀態,也無法直覺地呈現資訊。若要了解各個機器的狀況必須要逐一點擊VM清單上的名稱才能察看細節,也無法預警等,為此,他同時也使用了開放原始碼的免費工具OpenNMS與CACTI來監控流量。

不過,他認為中國人壽現在的監控工具還是只能做到監控,而無法有預警的功能,因此,他打算在第三階段時導入新的監控管理工具,再根據過往的歷史資料分析,像是處理器使用率、應用程式的運作狀況、資料成長等,找出虛擬機器運作的邏輯,當VM運作達到臨界值時,才能預先警告。

而且監控的周期長度也必須要依照企業業務特性而定,才能提供分析預測的數據。以中國人壽來說,每個月都會收一次保費,並且進行回銷的動作,因此,要觀測系統的使用狀況,觀測周期就必須以1個月為基準。從今年年初開始中國人壽每周都會固定製作每日流量報告與記錄,至今已累積了超過半年的資料,就是為了在第三階段時可以配合導入新的監控管理工具時,進行分析。

除了將原先的困難在第三階段進行調整之外,在第三階段的工作中還有另一些重要工作,就是利用虛擬化建置備援機制以及把所有的ESX虛擬平臺升級到ESXi。

中國人壽的備援機房設在林口,建置方式是把現在的虛擬環境作業直接移到備援機房的虛擬環境中,初期先建置大約80臺虛擬機器,頭一個月也會先以一半的規模進行測試。目前則是要先訂出備援機制的SOP。林成鑫表示,備援的RTO訂為72個小時,RPO則為1天。

第三個階段的另一個重點是把所有的ESX轉移到ESXi,林成鑫表示,這主要是基於安全性考量。過去VMware使用Red Hat Linux,萬一Red Hat本身有漏洞,虛擬軟體也容易受到攻擊。而VMware也在ESXi 4.0.1版移除了Linux作業系統,進而降低作業系統的漏洞威脅。因此,中國人壽也打算更換掉原先的版本。

中國人壽一路披荊斬棘走到現在,虛擬化腳步早就走在臺灣企業的最前端,基於這些領先的經驗,林成鑫建議,企業若想要導入虛擬化,IT部門一定要更清楚企業內部的作業流程,否則將比實體環境更容易出問題。他以VMware的DRS功能為例,由於這個功能會自動將閒置的虛擬機器下線或是搬移到其他實體機器上,以達到節能的效果。倘若IT不夠了解作業流程,沒有嚴格定義下線的條件時,就會造成有些必要排程無法執行。以中國人壽來說,有一些批次作業是下班以後才進行的,如果IT無法掌握該流程而未將條件設定好,就會導致系統下線,而沒有執行原訂該進行的批次作業。

這些經驗也產生了其他的價值。中國人壽在今年2月正式與中國建設銀行合資購買一家保險公司,開啟了他們的合作。中國人壽為了快速協助建設銀行在廣東、江蘇、上海三地布建2,500個分行的資訊系統,也打算運用虛擬化技術來加快導入速度。林成鑫相信,虛擬化的技術會在中國萌芽,而這些經驗,也有利於中國人壽與中國的建設銀行邁向合作大門。

 

為了要確實了解IT需求變化,中國人壽從今年開始每周都會進行網管周報,等到下個月開始進行虛擬化第三階段工作時,就能藉由監控管理虛擬化機器的軟體,設定預警機制。照片提供/林成鑫

 

在周報當中,IT人要清楚記錄網路連線異常的情形,包括發生時間、機器名稱、處理人員、處理情形等。林成鑫表示,平時該做的紀錄越清楚,真正出現問題時,解決的速度就越快。照片提供/林成鑫

 


相關報導請參考「私有雲實踐術

熱門新聞

Advertisement