話說8月初,臺灣面臨到進入供電警戒的狀態,好不容易到了8月13日,備轉容量率提升到8.64%,但在8月15日下午,又突然因為大潭電廠的天然氣供應管線事故,而導致全臺各地出現分區停電的狀況,直到接近半夜,才回復正常供電。

在這次意外的大停電當中,除了一般民眾的生活起居受到影響,許多商家和企業也被波及而無法正常營運,損失金額甚鉅。而在企業IT應用當中,我們所操作和維護的系統能否正常運作,電力的持續供應可說是最基本的條件,因為有了電,企業的個人電腦、伺服器、交換器、儲存設備,才能開機啟動,所以,許多有先見之明的企業,平時就會注意電力的備援,有些是在公司所在的建築物當中,設立備用發電機(或是租用的大樓本身就有),而在IT機房當中,企業也會建置不斷電系統(UPS),幫資訊設備爭取到足夠的時間,以便進行正常關機的動作。

然而,815大停電所導致的分區停電,卻是以輪流方式進行,每次長達50分鐘,這也考驗企業的應變之道。因為,若是一次性的停電,還容易處理,但如果是預到這種多次性的停電,可能許多公司就不一定知道該如何去處理。

為了解答這樣的疑惑,我們的記者余至浩也寫了一篇深入的報導,探討相關的作法,並且借重廠商的實務經驗,指出需要注意的幾個地方。而我們所洽詢的業界專家,主要是對於機房環境規畫相當在行的臺灣世曦。

該公司的資訊系統部副理張智欽認為,需留意UPS使用的程序。UPS保留的電力畢竟有限,應同時考慮到系統完成關機,以及之後開機完成的所需時間,電力持續性不能只考慮關機時間,因為若遇上輪流停電的狀況,可能到第二輪時,UPS的電力就不夠了。

而在電力恢復供應之後,應該優先讓UPS充電,儲備好電力再進行開機,然後再進行相關的異常檢測與診斷。若不這麼做,萬一又突然遇到停電狀況,電力不足的UPS將無法發揮作用,等於又讓資訊系統陷入不正常關機的風險。

另一個作業程序上需要留意的部份,則是重新啟動資訊設備時,進行逐一檢查時也有類型之分。張智欽的建議是先針對網路設備的部份,接著才是資訊系統。這麼安排其實很合理,一方面是因為網路設備本身的組成較單純,而且遇到突然停電而面臨故障的機率並不高,是否正常運作很容易從連線狀況來判斷,但資訊系統架構較為複雜,牽涉到伺服器、儲存系統、網路設備等種種環節,因此若要進行故障排除,首先還是要先從比較簡單的部份開始著手,分而治之,如此應可提升判斷的準確性,進一步縮短回復服務所耗費的時間。

在該篇報導中,張智欽也分享了許多一般人容易疏忽的小細節,建議大家好好細讀,並且省思如何在自家的環境中實現,並且能定期演練相關程序,以免這類意外狀況猝然發生時,能夠敏捷地因應,以免遭到責難。

除了做好萬全準備,另一方面,我們也建議政府與台電對於這類情況,應該要有完善的通報與公告機制,讓民眾和企業更直接、清楚地掌握目前對於停電的處置方式,我們才能決定最適合的因應方式。以這次事件來說,眾人間隔一段時間,才經由一些管道得知是輪流停電,如此也導致許多不必要的恐慌和擔憂。

作者簡介


Advertisement

更多 iThome相關內容