Azure リソース正常性(Resource Health)の監視設定

 

今回はリソース正常性(Resource Health)の監視、アラート通知設定をAzure Monitorを使って試してみました。

リソース正常性(Resource Health)では、自身のリソースが使用可能な状況にあるのかどうかを知る事が出来ます。

Azure 基盤の障害だけではなく、ユーザー自身が行った操作による影響も知る事が出来ます。例としては、ユーザー自身が行ったAzure VMの停止もリソース正常性の1つとして通知されます。

リソース正常性(Resource Health)に関する詳細は下記サイトを参照ください。

    • リソース正常性(Resource Health)

https://docs.microsoft.com/ja-jp/azure/service-health/resource-health-overview

なお、Service Health(サービス正常性)に関しては、下記に記載しております。併せて見て頂ければと。。。

Azure サービス正常性(Service Health)の監視設定

—-

1.リソース正常性(Resource Health)をAzure Portalで確認してみた。

リソース正常性(Resource Health)は、サービス正常性(Service Health)の中にあります。

Azure Portalで確認するには、まずモニターのService Healthのメニューを選択します。

サービス正常性の画面が表示されますので、リソース正常性を選択します。次にリソースの種類を選択します。(下記例では仮想マシンを選択しています)。選択したリソースの種類に関するリソース正常性状況が表示されます。

詳細を確認したい場合は、リソースを選択します。正常性の状況や利用できない場合はその理由が表示されます。

Azure Portal上でも確認が可能ですが、リソース状態の変化を都度確認するのも大変です。これをAzure Monitorを使って通知する設定を行ってみました。

2.Azure Monitorでリソース正常性(Resource Health)の監視設定をしてみた

Azure Monitorを使ってリソース正常性の監視設定を行ってみました。

1)まずモニターでService Healthを選択します。

2)サービス正常性の画面が表示されますのでリソース正常性を選択します。

3)リソース正常性の画面が表示されますので、リソース正常性アラートの追加を選択します。

下記のようなResource Healthアラートルールの作成画面が表示されます。まずアラートの対象の設定を行います。

      • サブスクリプション
      • リソースの種類
      • リソースグループ
      • リソース

4)リソースの種類について設定します。リソースの種類は以下の通りAzureのサービスが個別に表示されます。設定対象のサービスを選択します。

Azure Resource Health で利用できるリソースの種類と正常性チェック

https://docs.microsoft.com/ja-jp/azure/service-health/resource-health-checks-resource-types

 

※サービス正常性に比べて利用できる対象はまだ少ない状況です。

5)次にリソースグループを選択します。設定したリソースが存在するリソースグループ名を選択します。

6)次に監視対象としたいリソースを選択します。リソースの種類とリソースグループで絞り込まれたリソースが表示されますので適時選択します。

次にアラートの条件を設定します。アラートの条件で設定するのは以下の通りになります。

      • イベントの状態
      • 現在のリソースの状態
      • 以前のリソースの状態
      • 理由の種類(何に起因して発生したのか)

7)イベントの状態を選択します。

8)現在のリソースの状態を選択します。状態は下記3つになります。

      • Available(使用可能)
      • Degraded(パフォーマンス低下(リソースは使用可能))
      • Unavailable(使用不可)

例えばサービス影響を受けた場合検出したい場合は、DegradedとUnavailableにチェックを入れます。

9)以前のリソースの状態を選択します。利用可能な状態から状態遷移した場合のみを検知したい場合等はAvailableに選択を入れます。

10)理由の種類を選択します。

      • Platform Initiated(Azure側起因)
      • User Initiated(User操作起因)

プラットフォーム起因の影響のみ検出したい場合は、Platform Initiatedを選択します。User Initiatedにはユーザー自身が意図的に行ったAzureVMの再起動等が含まれます。

11)アクショングループで通知方法を選択します。アクショングループの選択をクリックすると、作成したアクショングループが表示されますので、適時選択します。

12)アラートルールの詳細を設定します。アラートルール名やアラートルールを保存するリソースグループ名を指定します。

設定が終わったら、アラートルールの作成をクリックしルールを作成します。

これで設定作業が終了です。



3.リソース正常性(Resource Health)をAzure Monitorを使ってアラート通知してみた感じ

Azure VM等がAzure基盤影響でハングアップした場合等も通知出来る為、Azure Portalを確認しなくても済むため非常に便利だと思いました。

しばらく、様子を見ながら試したいと思いますが、少なくともプラットフォーム起因の部分は設定しておいたほうが良さそうな感じでした。