是方電訊總部大樓(麗源大樓)在今年2月25日發生火警,造成整棟大樓電力中斷,臺北市消防局研判,起火地點應該是位於麗源大樓地下2樓的機電室,造成起火的UPS電池設備,則是同棟大樓的數位通國際(eASPNet)所有。

數位通國際表示,2月25日當天正在進行例行的UPS不斷電設備檢修,在更換設備的過程中,導致UPS串接的高壓電池溫度過高,甚至產生悶燒的情形,一瞬間濃霧竄出,因而造成整棟大樓必須跟著消防作業流程中斷電力,IT服務跟著大停擺。

中信銀機房曾因UPS電池無法供電而大當機
機房備援電池引發機房當機的新聞,其實早在2010年就曾在臺灣發生過。早在2010年,中國信託商業銀行選在周五下班前夕進行例行停電演練,計畫將測試關閉臺電電源,並切換到備援柴油發電機來供電,以此來演練當臺電市電中斷時,備用發電機能否立即備援,讓機房持續運作。

原本測試演練的原意是好的出發,但結果,卻造成一發不可收拾的機房大當機問題。演練的過程中,因為啟用發電機需要30秒左右的緩衝時間,發電機才能正常供電,因此中國信託商業銀行計畫在關閉臺電市電後,改由發電機運轉供電的30秒前,先由UPS電池供應機房電力,以待發電機運轉接手供電。

演練的程序沒有發生人為疏失,但在切斷臺電電力後,UPS電池並未順利供電,導致機房備援的發電機還沒開始運轉,所有設備早已因為發電機供電不及而不正常關機,周五下班前,機房就大當機,所有金流作業停擺,民眾也不能至ATM提款。

當時中國信託商業銀行機房當機的情形,與此次是方電訊機房失火相比,同樣都是因為UPS電池出問題,才引發機房大當機。

中國信託起因於例行性演練,但UPS設備無法順利接手供電,導致機房當機;而是方電訊大樓火災,則是因為同棟大樓內的數位通國際UPS設備進行定期檢修,電池出問題造成電阻過高,導致電池過熱引發悶燒危機。消防員為了消防安全,強制要求是方大樓關閉機房高壓供電,機房服務停擺超過12個小時以上。

UPS電池彷彿機房未爆彈,人為疏失就很容易引發危險
台達電子關鍵架構事業部資料中心全球產品經理林士基表示,機房專用的備援電池,為了要能供應全機房用電,續電量和原本市面上常見的電池就有好幾萬倍以上的差距。

尤其再碰上數位通或是方電訊等整棟式IDC機房業者時,囤積了為數眾多的電池量原本就是機房常態。

光臺北市消防局當天到麗源大樓搶救,就發現地下二樓的電池室內串接了上百顆的UPS電池。

當機房電池接上專用的高壓用電時,好幾千瓦的電流,再加上高壓送電,原本就會有一定的高溫熱量釋放,因此也造成UPS電池彷彿成為機房內的未爆彈一樣,如果在串接的過程有異物接觸,或接觸不良,就很容易造成電池電阻過高,甚至引發爆炸危機。

過去就曾有企業在裝設新機房的過程中,在搬設新UPS不斷電系統時,組裝工程師一個不小心,就將未包覆絕緣材質的螺絲起子掉落在UPS電池接口上,瞬間電池就馬上爆炸,機房灑水消防設備立即啟用,機房全數泡湯。

由此就可見,機房專用的備援電池,原本就存有一定的危險性,如果人為不小心操作,就更容易引發起火爆炸或悶燒的情形。

UPS電池如果不定期檢測、更換,就是高危險物質
此外,因為UPS電池原本就屬機房備援設備,在市電正常供電的狀況下,UPS電池並不會特地使用,通常只在台電斷電,需要臨時轉換至備援發電機時,作為電力轉換下,臨時銜接的補充電源。

從中國信託當年的事件來看,發生問題無法順利供電的UPS電池,就是已經使用了7年的老舊電池。

林士基表示,企業通常採購的機房電池,保固期限在出廠前,都至少有10~12年的保固期。企業IT人員會想,我買了一顆保固12年的電池,頂多在11年期限過快期前再更換設備就好,但事實上,「電池的壽命,卻是很容易受環境因素影響的」,林士基強調。

電池出廠後,保存在企業機房內,機房內的溫、濕度,甚至是空氣中的粉塵等因素,都會影響電池的壽命,此外再加上電池如果沒有定期續電、放電,電池內的電池液也可能會老舊,而導致電池續電量不足。

而如果企業電池,放在企業機房內持續使用,風險就會增加。擁有多年宏碁eDC機房管理經驗的行政院政務委員張善政表示,電池很難由人肉眼判斷是否損壞,最好的方式,就是由機電人員一顆一顆實際測量,才能知道電池有沒有發生老舊損壞的問題。

但如此,企業必須要定期花在維護測試的功夫,就會比較高,甚至當電池只作為備用設備時,企業老闆願不願意提撥成本來投資採購新電池,就都是IT人員必須煩惱的大問題。

UPS電池的最佳壽命其實只有3~5年
林士基建議,企業機房內的UPS電池,最好的使用壽命其實只有3~5年。此外,現行市面上的UPS設備,其實都設備自動定時檢測電池續電量的功能,IT人員只要在安裝初期設定好檢測時間,UPS設備就會自動進行例行監測。

此外,林士基也強調,企業在每季或每個月在檢測機電設備時,最好要設定SOP流程,照著檢測步驟走,才可以避免因為人為的疏失,而釀成機房意外。除了電池設備之外,UPS不斷電設備內也有精密的交流定電流和定電壓設備,這些設備原本就很容易在機器操作的過程中釋放熱氣,而導致電池液溶解甚至蔓延到UPS設備內。

這樣的問題,如果企業沒有定期拆解UPS設備,就不會察覺。但如果每次定期檢查,就都要拆解UPS,那企業就必須要先斷電才能檢修。林士基表示,為了要能檢測又要能同時滿足企業不停機的需求,專業的檢修人員甚至會攜帶熱感應儀器,先就機器外觀掃描是否有不正常過熱溫度的情形。如果真的偵測到過高的溫度,再考慮拆解機器。

電池的風險往往比企業以為的還要更高,尤其在機房這種對可靠度要求達99.9%以上的高標準,一絲一毫的輕忽,就可能會釀成機房事故。相較於發生事故後的服務中斷損失和機房復原成本,再回頭衡量電池維護的謹慎措施,和看似無用的汰換投資,其實都是企業機房永續維運的必要基礎。

相關報導請參考「是方大樓機房失火內幕追追追」

熱門新聞

Advertisement