Azure リソース正常性(Resource Health)の監視設定

2020-07-18Azure,Monitor

Azure Monitorを使ったリソース正常性(Resource Health)の監視、アラート通知設定を試してみました。

リソース正常性(Resource Health)を使うと自身のAzureリソースが使用可能な状況にあるのかを知る事が出来ます。
サービス正常性(Service Health)はサービス全体の影響を確認するものでリソース個別に影響を受けたかは見えませんが、リソース正常性(Resource Health)では自身のリソースへの影響が分かります。

リソース正常性(Resource Health)はAzure 基盤の障害だけではなく、ユーザー自身が行った操作による影響も知る事が出来ます。
ユーザー自身が行った仮想マシン(Azure VM)の停止もリソース正常性の1つとして通知する事が出来ます。

今回は仮想マシン(Azure VM)に対してのリソース正常性(Resource Health)の監視、アラート通知設定からアラートメール確認までやってみます。

サービス正常性(Service Health)の監視設定についてはこちら。

スポンサーリンク

リソース正常性(Resource Health)をAzure Portalで確認

リソース正常性とは

リソース正常性(Resource Health)は、Azure Service Healthに含まれる1つのサービスになります。
自身のAzureリソース固有に関わるリソースの正常性状態を確認する事が出来ます。

ざっくり言うとサービス正常性(Service Health)はリージョン(Resource Health)に発生した影響、リソース正常性は個々のリソースの正常性を表します。
サービス正常性(Service Health)とリソース正常性(Resource Health)違いやリソース正常性確認方法についてはこちらに纏めていますので併せて見て頂けると有難いです。

Azure Portalでリソース正常性を確認

Azure Portalでのリソース正常性(Resource Health)確認例です。
リソース正常性はモニターのService Health内のリソース正常性や各Azureリソースでリソース正常性を選択すると確認出来ます。

リソース正常性確認

モニターのService Healthにリソース正常性があるので選択します。
リソースの種類を選択すると現在のリソース正常性を一覧表示出来ます。

※画面サンプルは仮想マシン(Azure VM)を選択した場合です。

Azureリソースのメニューでもリソース正常性を確認出来ます。
リソース正常性の履歴が確認出来ます。

※問題がない場合はグリーンのチェックマークで利用可能と表示されます。

何かあった場合はリソース正常性のマークをクリックします。
何があったかの詳細を表示出来ます。

※画面サンプルはユーザーが仮想マシン(Azure VM)を停止した際に発生した通知です。

Azure Monitorでリソース正常性(Resource Health)の監視設定

Azure Monitorを使ってリソース正常性の監視設定します。

リソース正常性アラートの追加

モニターのService Healthから設定します。

リソース正常性アラートの追加
モニターのService Healthを選択します。
リソース正常性を選択します。
リソース正常性アラートの追加を選択します。

スコープの設定

スコープでリソース正常性の対象を選択します。
リソースグループ、リソースの種類、リソースが選択できます。
将来作成するリソースを自動追加する設定も可能です。

スコープ設定

スコープでは以下の内容を選択します。

    • サブスクリプション
    • リソースグループ
    • リソースの種類
    • リソース

その他に今後作成するリソースを含めるかを選択する事が出来ます。

test-rgの仮想マシン(Azure VM)をスコープと設定した場合です。
すべて選択した場合のみ今後作成するリソースを含めるかどうかを選択できます。特定のリソースグループを除外と言う設定は出来ません。

条件設定

条件設定です。
条件の設定ではリソース正常性の変化条件を指定します。

    • イベントの状態:発生したのか、解決しているのかと言った状態
    • 現在のリソースの状態:対象リソースの状態遷移後(現在)の状況
    • 以前のリソースの状態:対象リソースの状態遷移前の状況
    • 理由の種類:ユーザー起因なのか、サービス側の影響なのかと言った発生原因
条件設定
イベントの状態、現在のリソース状態、以前のリソース状態、理由の種類の4項目を組合せて検出したいリソース状態変化を設定します。  

イベントの状態は4つになります。
発生と解消のタイミングで受信したいのでActiveとResolvedを選択します。

  • Active(発生)
  • In Progress(進行中)
  • Resolved(解決)
  • Updated(更新)

In Progress(進行中)やUpdated(更新)は発生中に随時される内容で、リソース状態の変化ではない為基本的には設定しません。

発報のトリガー / リソースの状態 (“condition”)

現在のリソースの状態は3種類です。
異常に変化した場合を把握したいので、DegradedとUnavailableを選択します。

  • Available(使用可能)
  • Degraded(パフォーマンス低下(リソースは使用可能))
  • Unavailable(使用不可)

※仮想マシン(Azure VM)の場合はDegradedはないそうです。

以前のリソースの状態は4種類です。
元々正常だった状態からの変化を把握したいのでAvailableを選択します。

  • Available(使用可能)
  • Degraded(パフォーマンス低下(リソースは使用可能))
  • Unavailable(使用不可)
  • Unknown(不明)

※Unknown(不明)はリソース状態がAzure基盤側で取得出来ない場合に発生します。リソースが正常に動作している場合でも発生する可能性があります。選択しておいた方が無難です。

理由の種類です。
今回はすべて選択します。
ユーザー自身が操作して発生させた場合はUser Initiatedとなります。

Platform Initiated:プラットフォーム(Azure基盤側)起因
Unknown:不明な場合
User Initiated:ユーザー操作起因

※Azure基盤側の障害による影響のみを把握したい場合は、Platform Initiatedを選択します。

※回復時を把握したい場合はリソースの状態を現在と以前の設定値を逆にします。

アクショングループやアラートルール名を設定

Azure Monitorのアクショングループやアラートルール名を設定します。
“リソース正常性アラートが発生しました。"と言うタイトルでメール送信させます。

アクショングループ、アラートルール名設定
アクショングループを選択します。
事前に準備しておいたメール送信用のアクショングループを選択しています。
アクショングループが設定されているか確認します。

アラートルール名やアラートルールの保存先を指定します。
アラートルール名はメールタイトルや本文に表示されます。

アラートルール名は"リソース正常性アラートが発生しました。"としています。

仮想マシンを停止してリソース正常性アラートメールを確認

稼働中の仮想マシン(Azure VM)を停止してアラートを発生させてみます。

受信したアラートメール

仮想マシン(Azure VM)を停止してしばらくするとリソース正常性アラートメールを受信します。

受信したアラートメール

Important notice: Azure Monitor alert リソース正常性アラートが発生しました。 was activatedとメールタイトルでアラートを受信しました。

本文を見るとカテゴリーにResourceHealthとあり、リソース正常性のアラートだと分かります。

Resource IDにアラート発生したリソースIDが表示されます。

状態遷移内容はPropertiesに表示されます。仮想マシン(Azure VM)を停止しているので、Stopping and deallocatingとなっています。現在のリソース状態はUnavailable、以前のリソース状態はAvailableとなっている事も分かります。

※今回はユーザー操作で発生させているので"csuse":"UserInitiated"となります。

※アラート通知はリソースID単位になります。

プラットフォームから出力される仮想マシンのリソース正常性理由

プラットフォーム(Azure基盤)の影響でリソース正常性に影響があった場合の理由はこちらに記載されています。

Resource Health 仮想マシンの正常性に関する注釈

最後に

リソース正常性のアラート通知について纏めてみました。
非常に簡単に設定出来ますしプラットフォーム(Azure基盤)の障害によるリソースへの影響なども把握する事が出来ます。
今後も引き続き色々試してみたいと思います。

Logic Apps(ロジックアプリ)を使ってリソース正常性状態をメール送信しています。

スポンサーリンク