【New Relic】ミュート終了時にアラート状態の incidents が再通知されるようになった

記事タイトルとURLをコピーする

この記事は約4分で読めます。

こんにちはマネージドサービス部 大城です。

短い記事ですが New Relicでうれしい機能がリリースされていたので紹介します。

きっかけ

運用メンバーから「New Relic の Muting rules の設定画面で新しい項目が追加されているんですが、これってなんですか?」と質問をもらいました。

New RelicのMuting rules画面

確認したところミュート終了時に incident を close し、再通知される機能が追加されていました。これは助かる。

docs.newrelic.com

引用

Notification options for muting rules

When a muting rule is active, and an incident is opened, a user will not receive a notification. You can configure the behavior for notifications when a muting rule is inactive with the two settings below:

Notify: If there’s an ongoing incident after the muting rule window ends, you will be notified. This works by closing the existing, muted incident, and if the threshold is still being violated, a new incident will open in a non-muted state, triggering a notification. We recommend keeping this default setting.

Suppress notification: If there’s an ongoing incident after the muting rule window ends, you will not be notified. This works by leaving the existing, muted incident open past the muting rule window end timestamp.

これまで何が課題だったか

New Relicでミュート中にアラート状態が継続し、そのままミュートが解除されても、再通知されない課題がありました。

2024年9月11日開催の「New Relic User Group Vol.11 ただのLT大会」でも @nasutakashii さんが同じ課題をLTしていました。

運用中のシステムでも、毎日夜間ミュート状態にして、朝解除されるシステムがあったので、アラート状態が継続していた場合、解除時に再通知してほしい要件がありました。

これまでどうしていたか

下のような手作りツールを Amazon EventBridge Scheduler + AWS Lambda で動かして運用回避していました

  • ミュート解除のタイミングで Amazon EventBridge Scheduler にて AWS Lambda を起動
  • AWS Lambdaの処理内容
    • policy_id、condition_id を元にミュート時に通知されなかった issues を抽出
    • issues が actived or created であれば incidents を close 状態にする
    • close された後、アラート状態が継続していたら通知される

これが不要になります。うれしい

過去に設定していたMuting rulesはどうなるのか

これまでと挙動は変わらず Suppress notification(デフォルトではない方)に設定されています

そのため、ミュート中にアラート状態が継続しミュートが解除された後、通知されない設定になっています

挙動を変えたい場合は Notify に設定変更が必要です

これから設定するMuting rulesはどうなるのか

デフォルトが Notify になりますので

デフォルトで設定すると、ミュート中にアラート状態が継続しミュートが解除された後、通知される挙動になります。

もちろんデフォルトから Suppress notification に変えることも可能です。

まとめ

ここまで読んでいただきありがとうございます。この記事が誰かの役に立ったら幸いです。

大城 慶明 (記事一覧)

マネージドサービス部

2022年10月サーバーワークスに入社、沖縄からリモート勤務。AWSを勉強中。沖縄では大城が多いので「よっさん」と呼ばれています。AWS14冠。NRUG沖縄支部運営。X @yo_ohshiro