全站文章 iT邦幫忙
iThome Online提供免費電子報,現在就訂,最新IT訊息每日寄達。

iThome 每日新聞報
iThome 產品技術報
加入iThome Online會員,立即使用討論區、Blog等服務。

免費加入會員
登入 / 登出
管理會員帳號
忘記帳號密碼
聯絡客服
訂閱周刊
讀者服務
12' E政府專刊no.6(46)
12' 個資法專刊No2(45)
12' iTcloud No.2(44)
12' e政府專刊No.5(43)
12' 個資法專刊(42)
11' CIO專刊(41)
11' e教育專刊No.3 (40)
11' e政府專刊No.4 (39)
11'iTcloud專刊(38)
10' e教育專刊No.2 (37)
10'e政府專刊No.3 (36)
09'e政府專刊No.2 (35)
09'e教育專刊(34)
09'e政府專刊(33)
08'企業資安專刊-端點安全防護(32)
08'企業採購情報誌(31)
07'資訊安全技術應用專刊(30)
07' 新世代資料中心專刊(29)
07'企業資安技術應用專刊(28)
企業採購情報誌'06冬季號(27)
企業軟體技術應用專刊(25)
企業資安技術應用專刊(24)
Amazon公布平安夜當機細節:負載平衡出錯
文/陳曉莉 (編譯) 2013-01-02
分享到facebook
開發人員在進行維護時不小心刪除了ELB上的狀態資料,這些資料是用來管理美東的負載平衡器,但當時沒未發現,一直到ELB控制盤在呼叫API來管理負載平衡器時不斷出現延遲及錯誤才得知。

去年聖誕夜(12月24日)專門提供影片串流的Netflix服務中斷了近20小時,並說明是受到Amazon雲端(AWS)故障的影響,Amazon隨後出面解釋,是因負載服務(Amazon Elastic Load Balancing Service,ELB)的資料誤刪所引起。

Amazon ELB從故障到完全恢復的時間為2012年12月24日的中午12點24分到12月25日的12點05分。Amazon說明,該站的開發人員在進行維護時不小心刪除了ELB上的狀態資料,這些資料是用來管理美東的負載平衡器,但當時沒未發現,一直到ELB控制盤在呼叫API來管理負載平衡器時不斷出現延遲及錯誤才得知,且只有少數的ELB負載平衡器受到影響。

一開始Amazon並未發現出錯的原因,而以為是API錯誤,隨後AWS的客戶才提報他們在更改負載平衡的設定後效能出現問題,Amazon才發現癥結,並回復遺失的ELB資料。

Amazon表示,在最高峰的時候,只有6.8%使用負載平衡器的服務受到影響,因為其他的負載平衡器無法由客戶自行擴充或修改而未受波及,AWS團隊先致力於手動回復受到影響的負載平衡器,之後才裝回移失的ELB資料。

除了道歉外Amazon也祭出補救措施,包括提出更嚴謹的規定以降低ELB狀態資料被誤刪的風險,並藉由此次的經驗修改資料回復流程來加快資料回復速度。(編譯/陳曉莉)

分享到facebook

6/20-6/21 Enterprise Cloud EXPO
企業雲資源應用博覽會與企業雲端論壇
2013 BlackBerry Enterprise Experience Forum-無庸置疑的企業行動化使命
2013 BrainShare Technology Forum Asia Pacific Tour
2013台灣三星 飯店與零售解決方案高峰會
2013 Java Developer Day
更多研討會
▼ ADVERTISEMENT ▼
▲ ADVERTISEMENT ▲

電週文化事業版權所有、轉載必究 •Copyright © iThome | 刊登廣告授權服務服務信箱隱私權聲明與會員使用條款關於iThome