Cloudflare網路故障27分鐘，影響Discord與Shopify等服務

Cloudflare在臺灣時間7月18日凌晨，由於人為配置錯誤，使得骨幹網路流量出現異常，衝擊Cloudflare網路服務，導致諸如Shopify與Discord等知名服務受到影響，這個問題持續了27分鐘，Cloudflare整個網路流量下降50％，Cloudflare在早上6點10分修復問題，所有網路流量恢復正常。

We are aware that some regions may be experiencing issues with some Cloudflare services. We are currently investigating.

— Cloudflare Help (@CloudflareHelp) July 17, 2020

Cloudflare骨幹網路連接著Cloudflare散布全球的資料中心，骨幹網路是專用的線路，可讓資料中心間的資料傳輸，不需要經過公共網際網路，如此帶來的好處，不只使Cloudflare資料中心間的通訊，更快也更可靠，而且Cloudflare能夠良好地控制路由網際網路流量的位置與方法。

這個事件發生的起始，是由於Cloudflare在紐瓦克和芝加哥間的骨幹網路連接出現問題，導致他們亞特蘭大到華盛頓特區間的骨幹網路壅塞，因此他們決定更新亞特蘭大路由配置，移走部分流往亞特蘭大骨幹網路的流量，以減輕壅塞的情況。

但是配置卻出現錯誤，原本應該從骨幹網路移除亞特蘭大路由，但是卻錯誤變更了線路，使得所有BGP路由灌進了Cloudflare骨幹網路中，且因為演算法的關係，所有Cloudflare骨幹流量都被導向亞特蘭大，亞特蘭大路由器因此不堪負荷，使得連接到骨幹網路的Cloudflare網路位置發生錯誤。

受影響的地區從美洲跨到了歐洲，包括聖荷西、達拉斯、西雅圖、芝加哥、華盛頓特區、倫敦、阿姆斯特丹、巴黎、斯德哥爾摩、聖彼得堡和莫斯科等地區，而其他地區服務則維持正常。

當下問題發生時，Cloudflare立刻隔離了亞特蘭大路由器，並關閉骨幹網路，轉而將流量跨網路服務供應商路由，使網路服務恢復正常。Cloudflare迅速地在問題發生後約3小時，發布完整的調查報告，並強調這個錯誤並非由任何形式的攻擊造成，而是配置錯誤導致，他們已經對骨幹網路進行適當的調整，避免之後還有類似情形發生。

熱門新聞