AWS推出混沌工程服務Fault Injection Simulator(FIS),這是一個全託管的服務,可以讓用戶針對在AWS上的應用程式注入錯誤,透過受控實驗來檢查系統的弱點,進而改善其韌性和效能。

AWS雲端平臺上提供各種元件,供用戶建構高可靠度系統,像是多地區服務、Amazon CloudWatch、負載平衡和跨地區備份等,AWS提到,當這些元件按照Well-Architected Framework中的指南組合,即便單個元件發生故障,系統也能夠繼續運作。但是除非經過測試,否則開發團隊無法確認系統是否按照預期運作,於是出現了混沌工程這個概念,透過創建破壞性事件,來觀察系統如何回應破壞,開發團隊也才能對症下藥改進系統。

除了發現需要改進的地方外,混沌工程也能夠發現系統盲點,像是需要額外監控和發出警示的部分,或是未發現的實作問題,並讓開發團隊有機會進一步修正。因此AWS推出了FIS服務,讓用戶對AWS工作負載注入故障,透過執行受控實驗,掌握系統對不同種類故障的反應,並更了解故障模式。

故障注入實驗是混沌工程的一種方法,透過破壞性事件對應用程式進行壓力測試,例如CPU或是記憶體消耗突然增加,藉以觀察系統回應該事件的方式並加以改進,故障注入實驗可以讓開發團隊,發現分散式系統中的隱藏錯誤和效能瓶頸。

故障注入模擬器簡化跨AWS服務,進行受控故障注入實驗的程序,用戶可以使用FIS提供的模板快速進行實驗,FIS也提供實驗用所需要的控制元件和護欄,讓開發團隊可以在滿足一個或是多個停止條件時,自動回退或是停止實驗,並在實驗對重要服務或是營運指標產生意外影響時,快速終止實驗。

用戶現在簡單地於控制臺中操作,就能夠執行複雜的場景,探索要在複雜條件下才會出現的故障。用戶可在系統未真正進入生產之前,就開始逐步將FIS加入到CI/CD工作流程中執行,最終在生產環境中運作。

每個FIS實驗都針對一組特定的AWS資源,並對這組資源執行一系列操作,Fault Injection Simulator目前支援EC2、ECS、EKS和RDS,接下來還會提供更多的資源和行動支援。除了亞洲大阪和中國兩地區之外,現在所有商業AWS地區都已經提供FIS服務。

熱門新聞

Advertisement