AWS Elastic Load Balancer監視 連携

AmazonのElastic Load Balancingは、着信アプリケーションリクエストを複数のターゲット(EC2インスタンス、コンテナー、ネットワークインターフェース)に自動的に分散するサービスです。Site24x7のAmazon Web Servicesとの連携により、ELBノードおよびすべてのタイプのElastic Load Balancer(ネットワーク、アプリケーション、およびクラシック)のターゲットに関する主要なパフォーマンスメトリクスを監視できます。

設定手順

  • まだ設定がお済みでない場合は、Site24x7をIAMユーザーとして作成するか、アカウントとSite24x7のAWSアカウント間にクロスアカウントのIAMロールを作成し、AWSリソースへのアクセスを有効にします。詳細はこちら
  • [AWSアカウント連携]ページの[ディスカバリーするサービス]フィールドで、[Elastic Load Balancer]のチェックボックスが選択されていることを確認します。 詳細はこちら

ポリシーと権限

Elastic Load Balancerノードの検出と監視では、以下の読み取り専用の権限を、作成したIAMまたはクロスアカウントロールに割り当てる必要があります。

  • elasticloadbalancing:Describe* : 設定されているすべてのElastic Load Balancerに関する情報を返します。

ポーリング間隔

Site24x7は、5分毎にCloudWatch APIおよびその他のサービスレベルAPIをポーリングして、パフォーマンスメトリクスとメタデータを収集します。

サポートしているパフォーマンスカウンター

Classic Elastic Load Balancerメトリクス

属性 詳細 統計 データタイプ
Backend connection errors load balancerとバックエンドEC2インスタンス間で正常に確立されなかった接続数です。 合計 カウント
レイテンシー (HTTPリスナー)リクエストがLoad Balancerを離れた後、インスタンスから応答ヘッダーを受け取るまでにかかった時間です(単位:秒)。
(TCPリスナー)インスタンスとのTCP接続を正常に確立するまでにかかった時間です(単位:秒)。
平均
正常なホスト数 各アベイラビリティーゾーンの、classic Elastic Load Balancerノードにおける正常なEC2インスタンスの数です。 最大 カウント
異常なホスト数 Classic Elastic Load Balancerノードの各アベイラビリティーゾーンの異常なインスタンス数です。 最大 カウント
リクエスト数 (HTTPリスナー)受信され、登録済みインスタンスにルーティングされたリクエストの合計数です。
(TCPリスナー)登録済みインスタンスとの間で確立された合計数です。
合計と平均 カウント
Spillover Count surge queueのキャパシティーがオーバーしたためにドロップされたリクエスト合計数です。 合計 カウント
Surge Queue Length 登録済みバックエンドインスタンスへの送信を保留しているリクエストの最大数です。 最大 カウント
ELB 4XX エラー load balancerで生成したHTTP 4XXクライアントエラー応答コードの数です。 合計 カウント
ELB 5XX エラー load balancerで生成したHTTP 5XXサーバーエラー応答コードの数です。 合計 カウント

設定詳細

属性 詳細
ELB名 Load Balancerの名前です。
リージョン Classic Load Balancerが作成されたリージョンの名前です。
アベイラビリティーゾーン Classic Elastic Load Balancerノードが作成されたアベイラビリティーゾーンです。
DNS名 Load BalancerのDNS名です。
スキーム 使用中のload balancerのタイプが内向きか外向きかを示します。
VPC-ID VPCでデプロイされているLoad Balancer用です。
セキュリティグループ VPC内のclassic load balancerに添付されているセキュリティグループのリストです。
作成時間 Classic Elastic Load Balancerノードが作成された時刻です。
接続タイムアウト ELBノードのアイドル接続タイムアウトです。
インスタンス load balancerに登録されているEC2インスタンスのIDです。
間隔 設定したステータスチェック間隔です。
レスポンスタイムアウト ヘルスチェックからの応答を受信するまでの待機時間です。
Pingターゲット EC2インスタンスに接続するときに使用するプロトコルとポートです。

監視するclassic load balancerへしきい値プロファイルを追加する手順は、こちらをご覧ください。

ターゲットグループ

ターゲットグループとは、Application Load Balancer、Network Load Balancer、またはGateway Load Balancerがトラフィックをルーティングする、ターゲット(EC2インスタンス、IPアドレス、Lambda関数など)の集合体です。

ターゲットグループタブでは、AWS ELBにアタッチされているターゲットグループ、個々のターゲットグループの設定詳細、およびCloudWatchメトリクスを表示できます。さらに、各ターゲットグループ内の正常なホストおよび異常なホスト数も確認できます。

  • このタブは、Application Load Balancer、Network Load Balancer、およびGateway Load Balancerの監視で利用可能です(Classic Load Balancerの監視は除きます)。
  • ターゲットグループタブには、AWS ELBにアタッチされているターゲットグループが最大40個まで表示されます。
  • AWSコンソールで、ターゲットグループにカスタムタグキーの「monitor_site24x7」を割り当て、その値を[false]に設定できます。このタグが設定され、値が[false]になっているターゲットグループは、ターゲットグループの検出時に無視されます。この動作を元に戻すには、リソースからタグを削除してください。変更内容は次回のポーリング時に反映されます。

以下の画像では、Application Load Balancerの監視において、ターゲットグループの正常なホストと異常なホストの数を確認できます。

正常なホストの数値をクリックすると、正常なホストとしてカウントされているインスタンスとそのIDの一覧が表示されます。同様に、異常なホストの詳細も確認できます。

監視対象リソース

Elastic Load Balancerに関連付けられている、監視対象のEC2インスタンスの一覧を表示します。個々のリストをクリックすると、そのリソースに関連するパフォーマンスやリソース使用率の統計を確認できます。また、[アクション] の下にある鉛筆アイコンをクリックすることで、しきい値を設定し、これらのサービスがいずれか障害を起こした際に通知を受け取ることも可能です。

予測

以下のClassic Elastic Load Balancerのパフォーマンスメトリクスについて将来の値を予測し、容量の追加やAWSインフラストラクチャのスケールアップについて、データに基づいた意思決定を行うことができます。

  • Spillover Count
  • Surge Queue Length

リソースレベルのトポロジー

トポロジービュータブは、リソースを中心としたリアルタイムの依存関係マップを提供します。ELBリソースが周囲のAWSインフラストラクチャとどのように接続されているかを動的に追跡するため、アラート発生時に根本原因をより迅速に特定・特定できます。

接続されているいずれかのコンポーネントがクリティカルな状態にある場合、トポロジービュー内でその旨がマークされ、障害の理由も合わせて表示されます。これにより、監視ページから移動することなく、正確な障害箇所を特定できます。

アカウント全体のトポロジービューとは異なり、このタブでは可視化する範囲を単一のリソースに絞り込んでいるため、「このELBリソースは何に接続されているのか、それが停止すると何が壊れるのか」という的確な疑問に答えることができます。個々のリソースから、主要な親エンティティ、サービスタイプ、リージョン、およびAWSアカウントレベルに至るまで、完全な依存関係の連鎖を追跡することが可能です。

関連ドキュメント