Cloudflare在臺灣時間7月18日凌晨,由於人為配置錯誤,使得骨幹網路流量出現異常,衝擊Cloudflare網路服務,導致諸如Shopify與Discord等知名服務受到影響,這個問題持續了27分鐘,Cloudflare整個網路流量下降50%,Cloudflare在早上6點10分修復問題,所有網路流量恢復正常。

Cloudflare骨幹網路連接著Cloudflare散布全球的資料中心,骨幹網路是專用的線路,可讓資料中心間的資料傳輸,不需要經過公共網際網路,如此帶來的好處,不只使Cloudflare資料中心間的通訊,更快也更可靠,而且Cloudflare能夠良好地控制路由網際網路流量的位置與方法。

這個事件發生的起始,是由於Cloudflare在紐瓦克和芝加哥間的骨幹網路連接出現問題,導致他們亞特蘭大到華盛頓特區間的骨幹網路壅塞,因此他們決定更新亞特蘭大路由配置,移走部分流往亞特蘭大骨幹網路的流量,以減輕壅塞的情況。

但是配置卻出現錯誤,原本應該從骨幹網路移除亞特蘭大路由,但是卻錯誤變更了線路,使得所有BGP路由灌進了Cloudflare骨幹網路中,且因為演算法的關係,所有Cloudflare骨幹流量都被導向亞特蘭大,亞特蘭大路由器因此不堪負荷,使得連接到骨幹網路的Cloudflare網路位置發生錯誤。

受影響的地區從美洲跨到了歐洲,包括聖荷西、達拉斯、西雅圖、芝加哥、華盛頓特區、倫敦、阿姆斯特丹、巴黎、斯德哥爾摩、聖彼得堡和莫斯科等地區,而其他地區服務則維持正常。

當下問題發生時,Cloudflare立刻隔離了亞特蘭大路由器,並關閉骨幹網路,轉而將流量跨網路服務供應商路由,使網路服務恢復正常。Cloudflare迅速地在問題發生後約3小時,發布完整的調查報告,並強調這個錯誤並非由任何形式的攻擊造成,而是配置錯誤導致,他們已經對骨幹網路進行適當的調整,避免之後還有類似情形發生。


熱門新聞

Advertisement