今年早前Grafana併購Amixr,現在將該公司所開發的待命(On-call)管理工具,經過整合後改名稱作Grafana OnCall釋出,讓Grafana雲端用戶能夠更簡單地管理團隊間的協作,最佳化待命工作流程。

管理現代軟體開發其中一個重要的環節,便是配置和運作待命人員輪替,官方提到,這通常是一件苦差事,因為目前的工具都不夠友善。為了解決這個問題,Grafana開始對其雲端用戶提供Grafana OnCall,這是一個用來管理人員待命的工具,透過更簡單的流程和介面,簡化管理待命人員的工作量。

Grafana OnCall簡單的設計,讓用戶一開始從小規模應用起,隨著時間擴展使用規模,借助Grafana OnCall,DevOps和SRE團隊能夠更有效率地協作,使得待命工作流程更加順暢,進而更順利地解決突發事件。

待命管理的第一步是安排待命時間表,用戶可以使用日曆創建和管理待命時間表,只要任何帶有iCal地址的日曆都可以使用,管理者能夠以成員Grafana用戶名稱,作為創建事件的名稱,快速完成配置,由於成員都是使用熟悉的工具和流程,因此可以減少安排時間表的工作。

Grafana OnCall具有靈活的自動警報升級(Escalation)機制,以確保突發事件被解決,用戶可以在警報升級創建介面中,根據警報類型,使用IF、ELSE IF和ELSE邏輯來選擇路由目標,像是用戶可以將嚴重、關鍵警報事件發送到特定的警報升級鏈中,甚至設定命名空間等規則,將警報路由到其他警報升級鏈。

Grafana OnCall和Grafana Cloud深度整合,提供完整的可觀察性堆疊,集中檢視圖會在用戶熟悉的Grafana Cloud和Grafana UI中呈現,供用戶快速地查看和更新事件狀態,並且搜尋較舊的事件。

Grafana OnCall還深度整合Slack,並且透過自動分組來減少不必要的警報干擾,官方提到,Grafana OnCall在Slack會自動對警報進行分組,以避免用戶遭受大量警報騷擾,並降低事件期間團隊收到的雜訊干擾。Grafana OnCall還支援一系列常見的警報配置,包括Datadog、New Relic和AWS SNS等。

Grafana OnCall現在開放Beta預覽,免費和付費計畫的Grafana Cloud使用者現在都可以開始免費使用。


熱門新聞

Advertisement