障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開 - Publickey

障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開

2022年6月16日

クラウド対応のログ可視化ツールとして知られる「Grafana」や監視システム「Prometheus」などを開発し提供するGrafana Labsは、障害発生時に担当者へのオンコールを自動化できるオンコールマネジメントソフトウェア「Grafana OnCall」をオープンソースで公開したことを明らかにしました

Grafana OnCallは、昨年(2021年)11月に買収を発表したAmirが開発したソフトウェアで、発表と同時にGrafana Cloudのクラウドサービスとしても提供が開始されました。

今回それがオープンソースとして公開されたことになります。

各種監視ツールと連係、スケジュール設定による担当者への連絡など自動化

Grafana OnCallは、システム監視ツールから受け取ったアラートが、あらかじめ設定されたレベルを超えた場合に、自動的に運用担当者にSMSやチャットツールなどで連絡を行う、オンコールマネジメントと呼ばれる分野のソフトウェアです。

連携できるシステム監視ツールはGrafanaやPrometheusはもちろん、 Datadog、New Relic、AWS SNS、AlertManager、Zabbixなど多岐にわたり、連絡用のツールもSMSやSlackをはじめとする各種チャットツールなどに対応しています。

どのような場合にオンコールを発するかの条件は、IF文形式で設定することができます。

fig

オンコールの連絡先は、あらかじめ設定されたその日その時間の担当者にスケジュールを基に行われるようになっています。

fig

また、アラートの自動グルーピング機能によって、障害が継続しているあいだずっとアラートが鳴り続ける、いわゆるアラートストームを防止する機能も備えています。

これらの機能によって、別々の監視ツールからそれぞれ発せられるアラートを統合的に管理できるようになり、またあらかじめ決められたオンコール担当者に連絡を振り分ける作業も自動化されるなど、監視業務の自動化と効率化を進めることができるようになるとされています。

あわせて読みたい

運用・監視 Prometheus




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本