在今年的9月底,韓國國家資訊資源管理院(National Information Resources Service,NIRS)的資料中心發生嚴重的火災,導致韓國政府將近1/3資訊服務系統停擺,迄今仍只恢復5成,還造成大量公務資料損毀。

這起事故除了暴露電子化政府的弱點,也為全球IT基礎設施的安全性帶來一系列重要教訓——從鋰電池不斷電系統(UPS)的配置與管理,到資料中心消防設施,以及備份與復原架構的建置與管理等,都需重新審視與調整。

UPS鋰電池起火致災

NIRS負責管理大約1,600個政府部門的資訊系統與服務,總部位於大田,另在光州與大邱設有分部,這次事故是發生在NIRS大田資料中心的5樓。

火災發生在2025年9月26日晚上8點15分左右,大田當地消防單位於8點20分接獲NIRS報案,隨即出動消防人員與消防車前往滅火。10小時後,在9月27日上午6點30分初步撲滅火勢,但8點過後又復燃,直到當天傍晚6點才徹底撲滅,整起火災歷時大約22小時。

9月27日舉行的緊急記者會上,韓國中央災難安全對策總部副部長兼行政安全部次官金敏載(Kim Min-jae)解釋,事故發生起因於UPS的電池搬遷作業,當時13名外包商正在資料中心5樓更換UPS鋰電池,預定將卸下來的電池送至地下1樓,但其中一組卸下的電池突然起火,引發火災。

鋰電池滅火的難題

這場火災之所以耗時22小時方得以撲滅,主因在於鋰電池本身的特性,以及NIRS資料中心的UPS配置。

美國電池儲能系統製造商EticaAG公司,在10月6日針對此事發表的部落格文章中,指出鋰電池火災在滅火方面的困難。鋰電池起火屬於熱失控(thermal runaway)現象,也就是溫度升高、引發電池內部出現不受控的持續化學反應,導致溫度再次升高,進而起火或爆炸。

鋰電池起火後,不僅燃燒溫度高於傳統鉛酸電池,還會產生有毒氣體,即便撲滅明火,電池內部的化學反應仍可能持續進行,從而反覆復燃,而且,由於鋰電池儲存能量高,燃燒時間也更長,一般滅火手段難以應對鋰電池火災。

日本IT媒體Gigazine則在9月30日報導中,披露更詳細的滅火現場情況。火災發生後8小時,消防人員才於9月27日凌晨3點20分左右,使用雲梯車砸毀機房窗戶與內壁,成功排出有毒煙霧。但機房佈置又給滅火工作帶來阻礙,據稱數百組電池堆放在機房中,電池與伺服器之間的距離僅60公分,而韓國消防協會要求至少需間隔90公分,因此造成滅火時的兩難。

當前資料中心普遍使用的二氧化碳滅火系統(如FM-200環保氣體滅火系統),對鋰電池這種起火源的效果有限,必須大規模灑水澆灌該區域,或將電池浸入水中冷卻;但大量灑水澆灌電池,又會導致緊鄰的伺服器損壞。這迫使消防員一開始只嘗試使用少量灑水,加上二氧化碳氣體來滅火,從而影響到滅火效率。

受影響的政府業務與服務

這次火災所造成的損失,我們可以從設備直接燒毀,以及線上業務服務停擺等兩個方面,來進一步檢視與探討。

火災發生當下,由於空調與除濕系統中斷,機房溫度上升到160度以上,為了預防伺服器過熱受損,NIRS管理單位決定暫停該資料中心所有系統的運作,結果造成一共647個韓國政府的線上業務系統中斷。

火災結束後的清查顯示,總計有384組UPS電池,以及電池周圍的740臺伺服器燒毀,受此影響,而在火災當時關閉的647個線上業務系統中,有96個系統完全損毀。

因火災關閉的線上業務系統中,436個是公共服務系統,另211個是政府內部業務系統。而依重要性區分,韓國政府將其線上服務系統分為4個等級,這次火災事故停擺的系統中,一級系統占38個,二級系統86個,三級系統294個,四級系統229個。

在這些系統當中,對全國運作造成較大影響的服務,包括:韓國政府用於民事登記、稅務文件,以及政府通知等服務的Government24入口網站;位居韓國郵政營運核心的郵政與物流服務系統;119緊急救援服務定位系統,這是韓國消防與救護服務單位,用於定位呼叫位置與調度的系統;以及用於政府與金融服務登入驗證的數位身分與憑證驗證平臺。

另外,還有韓國政府的Onnara電子公文簽署系統,KONEPS韓國政府招標採購系統,G-Drive政府線上檔案儲存系統,海關通關系統,線上警政案件登錄系統,線上郵局購物中心,以及用於支付兒童保育費等的「國民幸福卡」等。

緩慢的復原工作

韓國行政安全部次官金敏載在火災當天(9月27日)的緊急記者會,說明韓國官方採取的復原對策,是優先恢復資料中心的冷卻系統,然後逐步重新啟動伺服器,先行恢復郵政、銀行與快遞等重要服務。行政安全部也在同日上午發出緊急通報,告知政府服務使用受限,並要求相關機構延長納稅與文件提交期限,直到系統恢復正常。

依行政安全部說法,截至9月28日上午7點為止,超過50%的網路設備已恢復正常,核心安全系統已有99%以上復原,相關的767臺設備當中,有763臺恢復運作,避開火災的2至4樓系統也於28日陸續重啟。

在被迫關閉的647個線上業務系統方面,依行政安全部9月29日的說明,完全受損的96個系統需耗費4週重建,其餘551個未受火災直接損毀的系統,也因國家綜合操作平臺系統(National Total Operating Platform System,nTOPS)的受損與關閉,以及現場清理尚未完成之故,復原速度十分緩慢,最初72小時內(至9月29日),只有46個系統復原。

截至9月30日下午2點,停擺的647個線上業務服務中已復原91個,佔總數13.5%。最重要的38個第一級系統中,則有21個復原,佔55.3%。

在9月30日下午的記者會中,根據行政安全部次官金敏載的解釋,NIRS是透過國家綜合操作平臺系統(nTOPS)來管理這647個系統,nTOPS系統的伺服器並不在這次發生火災的5樓,而是在6樓另一間機房,但由於切斷資料中心電源之故,該系統部分受損,雖然並非直接損壞,但暫時離線無法運作。韓國政府今年才剛開始nTOPS備援系統的測試,預定到12月才能全面啟用,當前仍無法派上用場。

我們從這裡也可看出,原本是基於集中管理便利目的而建置的nTOPS系統,此時反倒成了單點故障來源,一旦受損無法運作,就連帶影響到大量其他系統的運行。

另一方面,將近一半受影響的系統(330個),是位於發生火災的大田資料中心5樓,該樓層仍然斷電,清理也尚未完成,因而拖慢了復原進度。行政安全部長兼中央災難安全對策本部負責人尹浩正(Yun Ho-jung),前一天在國務會議上表示,他們目標是在10月12日完成火災現場清理,然後依序復原與重啟燒毀的機房。

金敏載表示,常用的Government24等行政服務已經基本穩定下來,不過房地產交易、社會安全資訊系統部分功能中斷,仍暫停線上服務,民眾必須親自前往各地辦事處手動處理文件。尹浩正也提醒,可能會出現與火災有關、冒充政府機構的簡訊與網路釣魚詐騙,呼籲民眾保持警惕。

參差不齊的系統備份情況

到了隔天(10月1日)上午,復原的系統只增加到98個系統,佔全部的15.1%,當天下午4點復原系統略為增加到101個,不過復原的一級系統仍只有21個,沒有進一步進展。

在10月1日中央災難安全對策本部說明會上,韓國行政安全部(Ministry of the Interior and Safety,MOIS)進一步說明受影響系統的備份與備援情況。依NRIS的統計,關閉的647個線上業務系統中,47個系統擁有伺服器主機或儲存層級的災難復原系統(前者27個,後者19個),352個系統有每日備份,每天都會備份並傳送到光州資料中心保存,剩餘248個系統則只有按月備份,在月底時將備份傳送到光州儲存。

也就是說,停擺的647個系統中,62%(399個)擁有災難備援或每日備份,相對較容易恢復服務,其餘38%則只有每月備份,而且部分系統的最後1次備份,是在8月31日,這意味著即便透過備份複本還原系統,也會損失整個9月份的資料。

最大受災對象:G-Drive政府檔案儲存系統

在10月1日的記者會中,韓國行政安全部還宣布一項令人震驚的消息:在大田資料中心火災完全受損的96個系統中,有95個可透過線上或離線備份復原,但G-Drive政府檔案儲存系統由於沒有外部備份,因而無法復原。

G-Drive是韓國政府公務員專用的雲端線上硬碟,「G」源自於「政府(Government)」之意,這項服務創立於2017年,目的是為公務員提供安全的線上共享檔案儲存空間,為每位公務員提供30 GB儲存空間,可隨時上傳、檢索檔案、照片等資料。行政安全部發布的G-Drive使用指導方針,是建議將所有工作資料儲存在 G-Drive 上,而不儲存在辦公室個人電腦上。

截至去年8月為止,韓國全國超過75萬名公務員中,使用G-Drive的比例為17%左右,約12.5萬人註冊使用(另有19.1萬人的說法),涵蓋74個政府部會,儲存的資料量達858 TB。公共服務局局長林正圭(Lim Jeong-gyu)在10月1日記者會表示,由於G-Drive未進行外部備份,儲存的所有資料均已遺失,他們判斷已無法恢復。

至於G-Drive未進行外部備份的原因,韓國中央日報(Korea Joongang Daily)引述行政安全部官員的說法是:「G-Drive容量大、效能低下的儲存結構不允許外部備份」,朝鮮日報(The Chosun Daily)所引述的官員說法也很相似超過50%網路設備:「G-Drive的容量巨大,無法備份系統」。

由於韓國政府各部會引進G-Drive的程度不一,受影響情況也有異。受創最大的單位,是唯一遵循行政安全部指示,將所有公務資料都儲存在G-Drive的人事管理部。相較下,較少使用該服務的政府政策協調辦公室,沒受到多少損失。

這也造成弔詭的結果——越遵循指示、導入G-Drive程度越高的單位,在這次事故中卻受到更大的「懲罰」;而無視指示,很少使用G-Drive單位反而不受影響。

韓民族日報(The Hankyoreh)引述人事管理部官員說法,差勤、晉升等人事相關資料,是由NIRS光州資料中心獨立的e-Person系統管理,但其他工作業務資料,都存儲在G-Drive上。由於G-Drive損毀,導致該部8年來的工作資料全部損失,包括內部會議資料、國會文件,公務員的個人資訊、人事認證資料與獎懲記錄等。

G-Drive的損毀,不僅導致人事管理部運作陷入停滯,還可能影響這個月的國會審計工作,無法提交國會要求的文件。該部表示正設法從其他管道復原一部分資料,包括過去一個月在個人電腦上保存的本地端檔案、電子郵件與紙本記錄等。

除此之外,進入正式審批流程的官方文件,也會另外儲存在Onnara電子公文簽署系統上,雖然這套系統也在這次火災中受損,但保有備份,一旦系統復原,就能取回這些資料,藉此恢復一部分在G-Drive上損失的原始資料。

善後與究責

接下來幾天,受影響的647個系統仍以緩慢的速度逐漸復原,10月2日復原系統達到112個,復原率17.3%,10月4日增加到115個,復原率17.8%,10月5日復原系統總數134個,復原率20.7%。

時間進入10月第2週後,恢復速度有所加快,在中秋節假期期間,搶修團隊一口氣復原47個系統,截至10月7日下午6點,已有163個系統恢復運行,復原率達25.2%,稍後在10月10日時達到217個,復原率30.6%。

到了火災過後第3週的當下,依韓國政府發布的最新消息,截至10月20日中午,已復原375個系統,復原率終於超過50%(52.9%)

至於在火災中完全受損的96個系統,行政安全部在10月2日說明的處理對策,是遷移到NIRS大邱分部的資料中心另行重建,包括退伍軍人事務部網站、e-People國家民事請願入口網站、國家法律資訊中心,以及Onnara電子公文系統等,最初預計在2週內完成重建工作,但進一步評估後,認為至少需耗費4週的時間,目標是爭取在10月28日之前完成相關作業。

為了加快復原速度,韓國政府將動用預備資金,行政安全部已就此在10月1日與財政部商討資金事宜。

與此同時,韓國檢警也展開調查行動。依韓國中央日報10月1日的報導,大田地方警察廳宣布逮捕4名火災相關人士,包括1名NIRS官員,3名在火災發生時負責監督電池遷移工作的外部工作人員。調查人員先前已經訊問12名證人,包括遷移計畫經理,以及現場其他工作人員。

韓國時報(Korea Times)則在隔天10月2日報導,警方突襲檢查NIRS與3家承包廠商,調查火災相關疏失情況。

在火災次日,今年6月新上任的韓國總統李在明(Lee Jae Myung)向國民公開道歉,批評緊急復原機制的缺失,並指出兩年前就曾發生類似的大火導致線上服務中斷事件,但政府竟未設立完整因應機制感到相當驚訝,承諾會調查並追究相關責任。

韓國數位政府創新辦公室也承認,G-Drive缺乏外部備份是個錯誤,誓言建立不會出現此類問題的新系統。

從目前官方訊息與各界評論,我們可將這次火災事故,歸因於3項顯而易見的疏失,這些疏失彼此連環相扣,共同導致嚴重後果。(報導未完,請見:解析韓國政府資料中心大火三項關鍵疏失


韓國NIRS大田資料中心火災事故時序

 9月26日 
● 承包商拆卸UPS電池時於20點15分引發火災,當地消防單位於20點20分接獲火災通報,滅火工作延續至次日
● 緊急關閉647個線上服務系統

 9月27日 
● 火災於上午6時30分初步撲滅,但8時復燃,至傍晚18時徹底撲滅火災,共歷時22小時

 9月28日 
● 核心系統部分重啟
● 未直接受災樓層重啟
● 韓國總統李在明就災情公開向全國致歉

 9月29日 
● 復原46個受影響系統(復原率7%)

 9月30日 
● 復原91個受影響系統(復原率13.5%)
● 第1級系統過半復原(38個中的21個)
● 總統李在明下令檢查政府網路基礎設施

 10月1日 
● 復原101個受影響系統(復原率15.6%)
● 官方確認G-Drive服務完全損壞無法復原
● 警方逮捕4名火災涉案官員與包商員工
● NIRS大田資料中心停車場車輛起火

 10月2日 
● 復原112個受影響系統(復原率17.3%)
● 警方突襲檢查NIRS與3家承包商

 10月4日 
● 復原115個受影響系統(復原率17.8%)
● 1名參與災後修復的官員跳樓輕生

 10月5日 
● 復原134個受影響系統(復原率20.7%)

 10月7日 
● 復原163個受影響系統(復原率25.2%)

 10月10日 
● 復原217個受影響系統(復原率30.6%)

資料來源:iThome整理,2025年10月

熱門新聞

Advertisement