| Target | SRE | 金絲雀部署 | Canary Deployment | 服務級別目標.SLO | 服務水準指標 | SLI

新手Target SRE首次重大事件的4個教訓

因為系統異動造成的問題,經常會延後發酵;監控機制必須連備用系統都監控,才有完整數據;第一時間先採取緩解對策,而不是先找出問題根源來處理;不要浪費事故教訓的價值,必須從這些事件來累積和學習

2022-01-20

| google | GCP | SLI

Google釋出透明SLIs,助GCP用戶更快找出原因除錯

即便在GCP上已經有超過130種雲端服務API,但這對於企業運作在第三方雲端服務的應用程式除錯仍然不夠,於是Google推出透明SLIs,提供更細節的服務指標,幫助用戶更快速定位出服務發生問題的所在。

2018-07-30