Azure リソース正常性(Resource Health)の監視設定

2020-07-18

Azure Monitorを使ったリソース正常性(Resource Health)の監視、アラート通知設定を試してみました。

リソース正常性(Resource Health)では、自身のリソースが使用可能な状況にあるのかどうかを知る事が出来ます。サービス正常性(Service Health)はサービス全体の影響時にアラートとなる為、リソース個別の影響が見えませんが、リソース正常性(Resource Health)では自身のリソースへの影響が分かります。

Azure 基盤の障害だけではなく、ユーザー自身が行った操作による影響も知る事が出来ます。例としては、ユーザー自身が行ったAzure VMの停止もリソース正常性の1つとして通知されます。

リソース正常性(Resource Health)に関する詳細は下記サイトを参照ください。

サービス正常性(Service Health)の監視設定についてはこちら。

サービス正常性(Service Health)からリソース正常性(Resource Health)を確認する方法はこちら。

スポンサーリンク

リソース正常性(Resource Health)をAzure Portalで確認

リソース正常性(Resource Health)は、サービス正常性(Service Health)の中にあります。

Azure Portalで確認するには、まずモニターのService Healthのメニューを選択します。

サービス正常性の画面が表示されますので、リソース正常性を選択します。次にリソースの種類を選択します。(下記例では仮想マシンを選択しています)。選択したリソースの種類に関するリソース正常性状況が表示されます。

詳細を確認したい場合は、リソースを選択します。正常性の状況や利用できない場合はその理由が表示されます。

Azure Portal上でも確認が可能ですが、リソース状態の変化を都度確認するのも大変です。これをAzure Monitorを使って通知する設定を行ってみました。

Azure Monitorでリソース正常性(Resource Health)の監視設定

Azure Monitorを使ってリソース正常性の監視設定を行ってみました。

Resource Healthの設定画面

1)まずモニターでService Healthを選択します。

2)サービス正常性の画面が表示されますのでリソース正常性を選択します。

3)リソース正常性の画面が表示されますので、リソース正常性アラートの追加を選択します。

Resource Healthアラートルールの作成画面が表示されます。

Resource Healthアラート対象の選択

アラートの対象の設定を行います。以下の内容で絞り込みを行います。

      • サブスクリプション
      • リソースの種類
      • リソースグループ
      • リソース

1)リソースの種類について設定します。

リソースの種類は以下の通りAzureのサービスが個別に表示されます。今回は仮想マシンを選択してみます。

Azure Resource Health で利用できるリソースの種類と正常性チェック(公式サイト)

2)リソースグループを選択します。

      • すべての仮想マシン選択する場合は、すべてのリソースグループを選択します。
        • 仮想マシンやリソースグループが追加された場合に自動でResource Healthを追加する場合は将来のすべてのリソースグループにチェックを入れます。
      • 特定の仮想マシンを対象にする場合は、その仮想マシンが存在するリソースグループを選択します。

3)リソースを選択します。監視対象リソースを絞る場合は監視対象を選択します。絞らない場合はそのまますべて選択のまま進めます。

Resource Healthアラート条件を設定

アラートの条件で設定するのは以下の通りになります。

      • イベントの状態
      • 現在のリソースの状態
      • 以前のリソースの状態
      • 理由の種類(何に起因して発生したのか)

1)イベントの状態を選択します。イベントの状態は4つになります。

      • Active(発生)
      • In Progress(進行中)
      • Resolved(解決)
      • Updated(更新)

今回は発生時と解決時にという事でActiveとResolvedを選択します。

2)現在のリソースの状態を選択します。状態は下記3つになります。

      • Available(使用可能)
      • Degraded(パフォーマンス低下(リソースは使用可能))
      • Unavailable(使用不可)
      • Unknown(不明(リソースの状態が取得出来てない状態))

サービス影響を受けた可能性がある場合は、現在のリソース状態がDegraded、Unavailable、Unknownになります。今回はこちらにチェックを入れます。

3)以前のリソースの状態を選択します。

利用可能な状態から状態遷移した場合のみを検知したいので、今回はAvailableに選択を入れます。

4)理由の種類を選択します。

      • Platform Initiated(Azure側起因)
        • Azure プラットフォームが原因になって発生
      • Unknown(不明)
      • User Initiated(User操作起因)
        • ユーザーの操作が起因になって発生(ユーザー自身がVM再起動した場合等も検知)

今回はすべてを選択しています。

Azure Monitorの通知設定

Azure Monitorの通知設定を行います。

1)アクショングループで通知方法を選択します。アクショングループの選択をクリックすると、作成したアクショングループが表示されますので、適時選択します。

2)アラートルールの詳細を設定します。アラートルール名やアラートルールを保存するリソースグループ名を指定します。

設定が終わったら、アラートルールの作成をクリックしルールを作成します。

これで設定作業が終了です。

リソース正常性(Resource Health)をAzure Monitorを使ってアラート通知してみた感想

Azure VM等がAzure基盤影響でハングアップした場合等も通知出来る為、Azure Portalを確認しなくても済むため非常に便利だと思いました。

監視間隔は設定が出来ないのですが、感覚的には15分程度では通知が来ているように思います。システム運用時には必須の設定かと思います。