Amazon雲端服務(Amazon Web Services,AWS)的美東-1區域(US-EAST-1, 北維吉尼亞)在太平洋夏令時間(PDT)10月19日23:49(臺灣時間10月20日14:49)出現故障,隨後蔓延成大規模中斷,總計影響142項服務,一直到10月20日2:24(臺灣10月20日17:24)才恢復,波及了Disney+、Lyft、麥當勞App、Reddit、Robinhood、Perplexity與英國政府網站等。AWS隨後表明,此一意外的觸發點為DynamoDB DNS解析異常。

Amazon DynamoDB是AWS推出的全託管NoSQL資料庫服務,專門針對高可用與高效能的應用設計。DynamoDB DNS解析異常,代表AWS伺服器無法正確將DynamoDB的服務名稱轉為實際IP位址,即使DynamoDB本身還在運作,其它服務也找不到它的位置,所有嘗試連結DynamoDB的AWS內部系統都會失敗或延遲。

在DynamoDB無法被存取時,依賴DynamoDB的EC2子系統便開始癱瘓,進一步導致Lambda、CloudWatch與SQS等服務受到連鎖影響,事實上,根據AWS的統計,總計有142項服務被牽連,涵蓋DynamoDB、RDS或Redshift等資料庫,EC2、ECS、Lambda、Glue等運算服務,VPC、NLB、CloudFront等網路負載平衡系統,以及監控與事件系統、AI服務到各式企業應用。

此外,US-EAST-1不僅是AWS第一個建立的區域,也是全球規模最大也最核心的區域,它匯集了許多全球控制平臺與管理後端,例如身分與存取管理IAM、CloudFormation、CloudFront、Route53、Lambda@Edge,以及DynamoDB Global Tables等,也有部分全球性功能會透過US-EAST-1協調,使得它不僅影響該區用戶,也會讓依賴該區端點的全球服務受到影響。

CNBC引用Downdetector的資料報導,因此而受到牽連的AWS用戶或服務包括Disney+、Lyft、Ring、麥當勞程式、紐約時報、Reddit、Robinhood、Snapchat、T-Mobile、英國政府網站、Lloyds銀行集團、加密貨幣交易平臺Coinbase,以及Perplexity的AI服務等。

此外,連Amazon內部的關鍵工具也停擺,不管是倉儲、配送或司機等員工都被迫休息;供第三方賣家管理業務的Seller Central也無法存取。

衛報(The Guardian)同樣引用了Downdetector的資料,指出總計有超過2,000家企業受到波及,至少有810萬筆問題回報,當中有190萬筆來自美國、100萬筆來自英國,以及近42萬筆來自澳洲。

根據市場調查機構statista今年第二季的統計,AWS為雲端基礎設施的最大供應商,市占率為30%,領先微軟Azure的20%與Google Cloud的13%。

熱門新聞

Advertisement