Azure サービス正常性(Service Health)の監視設定

 

Azure基盤の障害やメンテナンス作業影響で自身のリソースや、サービス全体の影響が発生した場合に検知する方法としてサービス正常性とリソース正常性2つの方法があります。

    • サービス正常性(Service Health)

https://docs.microsoft.com/ja-jp/azure/service-health/service-health-overview

リージョン単位で発生しているような大規模なサービスの障害や、メンテナンス計画等の情報を表示します。(リージョン内の特定リソースを対象にしたようなものは表示されません。)

    • リソース正常性(Resource Health)

https://docs.microsoft.com/ja-jp/azure/service-health/resource-health-overview

リソース単位で発生している障害や、利用可能な状態にあるかの情報を表します。

サービス正常性(Service Health)にはメンテナンス計画等が含まれたり、リソース正常性(Resource Health)はリソース自体をユーザーが停止した場合も含まれるなど、同じ正常性でも用途や範囲が異なります。

Azure Portal上でも正常性の確認も出来ますが、Azure Monitorを使った監視、アラート通知する事が可能です。

今回はAzure Monitorでサービス正常性(Service Health)の アラート ルールを作成してみました。

なお、リソース正常性に関しては、下記に記載しております。併せて見て頂ければと。。。

Azure リソース正常性(Resource Health)の監視設定

1.Azure Service Health(サービス正常性)をAzure Portalで確認してみた。

Azure Portalで確認するには、モニター(Azure Monitor)のService Healthを選択します。

現在のサービス正常性が表示されます。(なお、本画面では過去の履歴を含めてサービスに関する問題も確認可能です。)

なお、デフォルトすべてのサービスが選択されているので、自身の利用していないサービスの問題も表示されます。(サンプルは何も発生していない場合の画面になります。)

2.Azure MonitorでService Health(サービス正常性)のアラート通知設定してみた

Azure Monitorを使ってService Health(サービス正常性)の監視設定を行ってみます。

1)まずモニターでService Healthを選択します。

2)サービス正常性の画面が表示されます。サービス正常性アラート追加を選択します。

3)下記のようなアラートルールの作成画面が表示されます。サービス正常性(Service Health)で設定する内容は下記の通りになります。

      • サービス(通知対象のAzureサービス)
      • リージョン(通知対象のリージョン)
      • イベントの種類
      • アクショングループ(アラートの通知方法)
      • アラートルールの詳細(ルール名や保存するリソースグループ名等)

4)サービスについて設定します。サービスは以下の通りAzureのサービスが個別に表示されます。自身が利用するサービスのみを選択します。

※かなりの数がありどれを指定すればよいのかわかりにくいものも多いです。ある程度広めに設定しておき、どんどん削っていくのが良さそうな感じです。

5)次にリージョンを選択します。Azureで展開されるているリージョンがすべて表示されます。アラート通知したい(利用しているリージョン)を選択します。

6)次にアラート通知を行う、イベントの種類を選択します。

イベントの種類については下記サイトに記載があります。適時選択します。

https://docs.microsoft.com/ja-jp/azure/service-health/service-health-overview#service-health-events

  1. サービスの問題 – ユーザーに今すぐ影響を及ぼす Azure サービスの問題。
  2. 定期的なメンテナンス – お使いのサービスの可用性に将来影響を及ぼす可能性のある今後のメンテナンス。
  3. 正常性に関する勧告 – ユーザーが注目する必要のある Azure サービスの変化。 例としては、Azure の機能が非推奨となることやアップグレードの要件 (サポートされている PHP フレームワークへのアップグレードなど) が挙げられます。
  4. セキュリティに関する勧告 (プレビュー) – Azure サービスの可用性に影響する可能性があるセキュリティ関連の通知。

※サービスの問題と計画メンテナンスと正常性の勧告&セキュリティ アドバイザリと3つそれぞれ別々にサービス正常性アラートを作るのが、受け取った時に一番わかりやすいかなぁと思います。

7)アクショングループで通知方法を選択します。アクショングループの選択をクリックすると、作成したアクショングループが表示されますので、適時選択します。

8)アラートルールの詳細を設定します。アラートルール名やアラートルールを保存するリソースグループ名を指定します。

設定が終わったら、アラートルールの作成をクリックしルールを作成します。

これで設定作業が終了です。

3.Azure サービス正常性(Service Health)を使ってみて

メンテナンス通知等がメールで来るので、こういうところは非常に便利だと思いました。

実際の障害時にがサービス正常性が来るのが、実際のサービスが影響発生してしばらくしてから来るので、この編は参考情報程度に近いかと思います。

幅広く設定すると色んなメールが来るので、内容確認に慣れていく必要があるなぁという感じです。