由於德州的資料中心當機,使得美國中南部的多項服務受到影響。

圖片來源: 

微軟

在協調世界時間(UTC)周二(9/4)凌晨12點35分時(約台灣周二早上8點35分),微軟設置在德州的美國中南部(South Central US)資料中心突然發生故障,主要波及Visual Studio Team Services(VSTS)雲端開發工具,也有其它地區或其它Azure服務受到影響,迄今尚未完全復原。

根據Azure的服務健康狀態表(上圖),受損最嚴重的就是基於美國中南部資料中心的各式服務,從API管理、應用程式閘道、App Service、自動化、適用於MySQL與PostgreSQL的Azure資料庫、Azure Cosmos DB、Azure監視器、語言或機器學習服務或VSTS等都被波及。

儘管意外是發生在美國中南部的資料中心,但除了座落在當地的使用者無法存取帳號之外,有鑑於內部架構的相依性,大多數的美國客戶也無法使用發行管理(Release Management)功能,亦無法載入基於第三方工具的儀表板,所有區域的Mac Pools也都受到影響。

根據微軟的說法,資料中心的故障源自於一連串的骨牌效應,主要是因為美國中南部一個資料中心附近出現了包括雷擊在內的惡劣天氣,造成電源的電壓突然升高,進而影響冷卻系統,為了維護資料與硬體的完整性,資料中心啟動了關機的自動化程序,才會讓服務中斷。

冷卻系統為現代資料中心最關鍵的元素之一,因為它必須替密集容納數千台伺服器的資料中心降溫,且大多數的雲端服務供應商為了因應突然竄升的溫度時,都有自動關機程序的配置,只是在關機後也必須花一點時間重啟所有服務。

根據Azure目前的復原狀態,微軟已經重啟美國中南部資料中心的電源,也已恢復Azure Storage縮放單位的軟體負載平衡,目前仍在進行中的則是恢復對Azure Storage縮放單位的影響,以及恢復其它仰賴當地Azure Storage的各式服務。


Advertisement

更多 iThome相關內容