Amazon Elastic Kubernetes Service (Amazon EKS)はAWSのKubernetesを用いて、コンテナー化したアプリケーションをデプロイ、管理、スケーリングします。Kubernetesによって、コンテナー化されたアプリケーションの大規模な展開、スケーリング、管理を自動化できます。
Amazon EKSは、EC2とAWS Fargateの両方でアプリケーション稼働させるKubernetesサービスです。EKS監視にアタッチされているクラスターで実行されるアプリケーションがあるとします。Amazon EKSとSite24x7を連携すると、EKSクラスター、EKSネームスペース、EKSノードの監視が作成されます。クラスターやノードがダウンや問題に直面した際に、クラスターとノードの両方の監視で設定されているアラートで、問題の特定と追跡を行えます。
Site24x7とEKSを連携して、クラスター、ノード、ネームスペースレベルで、Amazon EKSを監視できます。
この連携でできることは次のとおりです。
Site24x7はAmazon EKS APIを用いてクラスターに関する情報を収集しています。AWS管理ポリシーのReadOnlyAccessをSite24x7のエンティティ―(IAMユーザーまたはIAMロール)に割り当てることで、Site24x7がメトリックやメタデータを収集します。カスタムポリシーを設定する場合は、JSONポリシーにある次の読み込みレベルのアクションを確認してください。詳細はこちら
Site24x7は設定したポーリング間隔ごとにクラスター、ノード、ネームスペースのメトリックデータを収集します。ポーリング間隔の範囲は、1分から1日です。詳細はこちら
| CloudWatchメトリック | 説明 | 統計 | データタイプ |
|---|---|---|---|
| クラスターの失敗ノード数 | クラスター内の失敗したノード数です。 | 最大 | ノード |
| クラスターのノード数 | クラスター内のノード総数です。 | 最大 | ノード |
| ネームスペースの稼働ポッド数 | ネームスペース内で稼働しているポッド数です。 | 最大 | ポッド |
| サービスの稼働ポッド数 | サービス内で稼働しているポッド数です。 | 最大 | ポッド |
| ノードの稼働ポッド数 | ノード内で稼働しているポッド数です。 | 最大 | ポッド |
| ノードの稼働コンテナー数 | ノード内で稼働しているコンテナー数です。 | 最大 | コンテナー |
| ノードの総CPU使用率 | 全てのノードで使用されているCPUです。 | 最大 | ユニット |
| ノードのCPU制限 | ノードに割り当てられているCPUです。 | 最大 | ユニット |
| ノードの予約されているCPUの容量 | ノードの予約されているCPUです。 | 平均 | パーセンテージ |
| ノードのCPU利用率 | ノードで使用されているCPUです。 | 平均 | パーセンテージ |
| ノードのファイルシステム利用率 | ノードのファイルシステム容量です。 | 平均 | パーセンテージ |
| ノードのメモリ制限 | ノードに割り当てられているメモリです。 | 最大 | メガバイト |
| ノードのワーキングセットのメモリ | ノードのワーキングセットで使用されているメモリです。 | 平均 | メガバイト |
| ノードの予約されているメモリ容量 | ノードで予約されているメモリです。 | 平均 | パーセンテージ |
| ノードのメモリ利用率 | ノードで利用されているメモリです。 | 平均 | パーセンテージ |
| ノードの総ネットワークバイト | ノードの総ネットワークトラフィックです。 | 合計 | メガバイト/秒 |
| ポッドの予約CPU容量 | ポッドで予約されているCPUです。 | 平均 | パーセンテージ |
| ポッドのCPU利用率 | ポッドで使用されているCPUです。 | 平均 | パーセンテージ |
| ポッド制限を超えたCPU利用率 | ポッドの制限を超えて利用されているCPUです。 | 平均 | パーセンテージ |
| ポッドの予約されているメモリ容量 | ポッドで予約されているメモリです。 | 平均 | パーセンテージ |
| ポッドのメモリ利用率 | ポッドで利用されているメモリです。 | 平均 | パーセンテージ |
| ポッド制限を超えたメモリ利用率 | ポッドの制限を超えて利用されているメモリです。 | 平均 | パーセンテージ |
| ポッドネットワークの受信バイト | ポッドで受信された総バイトです。 | 合計 | メガバイト/秒 |
| ポッドネットワークの送信バイト | ポットで送信された総バイトです。 | 合計 | メガバイト/秒 |
| CloudWatchメトリック | 説明 | 統計 | データタイプ |
|---|---|---|---|
| 稼働ポッドのノード数 | ノード内で稼働しているポッド数です。 | 最大 | ポッド |
| 稼働コンテナーのノード数 | ノード内で稼働しているコンテナー数です。 | 最大 | コンテナー |
| ノードの予約CPU容量 | ノードで予約されているCPUです。 | 平均 | パーセンテージ |
| ノードのCPU利用率 | ノードで使用されているCPUです。 | 平均 | パーセンテージ |
| ノードのファイルシステム利用率 | ノードのファイルシステム容量です。 | 平均 | パーセンテージ |
| ノードの予約メモリ容量 | ノードで予約されているメモリです。 | 平均 | パーセンテージ |
| ノードのメモリ利用率 | ノードで利用されているメモリです。 | 平均 | パーセンテージ |
| ノードネットワークの総バイト | ノードの総ネットワークトラフィックです。 | 合計 | メガバイト/秒 |
| CloudWatchメトリック | 説明 | 統計 | データタイプ |
|---|---|---|---|
| ネームスペースの稼働ポッド数 | ネームスペース内で稼働しているポッド数です。 | 最大 | ポッド |
| ポッドのCPU利用率 | ポッドで利用されているCPUです。 | 平均 | パーセンテージ |
| ポッド制限を超えたCPU利用率 | ポッド制限を超えて利用されているCPUです。 | 平均 | パーセンテージ |
| ポッドのメモリ利用率 | ポッドで利用されているメモリです。 | 平均 | パーセンテージ |
| ポッド制限を超えたメモリ利用率 | ポッドの制限を超えて利用されているメモリです。 | 平均 | パーセンテージ |
| ポッドネットワークの受信バイト | ポッドの受信した総バイトです。 | 合計 | メガバイト/秒 |
| ポッドネットワークの送信バイト | ポッドの送信した総バイトです。 | 合計 | メガバイト/秒 |
| CloudWatchメトリック | 説明 | 統計 | データタイプ |
|---|---|---|---|
| サービスの稼働ポッド数 | サービス内で稼働しているポッドの数です。 | 最大 | ポッド |
| ポッドのCPU利用率 | ポッドで利用されているCPUです。 | 平均 | パーセンテージ |
| ポッド制限を超えたCPU利用率 | ポッドの制限を超えて利用されているCPUです。 | 平均 | パーセンテージ |
| ポッドのメモリ利用率 | ポッドで利用されているメモリです。 | 平均 | パーセンテージ |
| ポッド制限を超えたメモリ利用率 | ポッドの制限を超えて利用されているメモリです。 | 平均 | パーセンテージ |
| ポッドネットワークの受信バイト | ポッドの受信した総バイトです。 | 合計 | メガバイト/秒 |
| ポッドネットワークの送信バイト | ポッドの送信した総バイトです。 | 合計 | メガバイト/秒 |
| CloudWatchメトリック | 説明 | 統計 | データタイプ |
|---|---|---|---|
| ポッドの予約CPU容量 | ポッドで予約されているCPUです。 | 平均 | パーセンテージ |
| ポッドのCPU利用率 | ポッドで利用されているCPUです。 | 平均 | パーセンテージ |
| ポッド制限を超えたCPU利用率 | ポッド制限を超えて利用されているCPUです。 | 平均 | パーセンテージ |
| ポッドの予約メモリ容量 | ポッドで予約されているメモリです。 | 平均 | パーセンテージ |
| ポッドのメモリ利用率 | ポッドで利用されているメモリです。 | 平均 | パーセンテージ |
| ポッド制限を超えたメモリ利用率 | ポッドの制限を超えて利用されているメモリです。 | 平均 | パーセンテージ |
| ポッドネットワークの受信バイト | ポッドが受信した総バイトです。 | 合計 | メガバイト/秒 |
| ポッドネットワークの送信バイト | ポッドが送信した総バイトです。 | 合計 | メガバイト/秒 |
| ポッドのコンテナー再起動数 | コンテナーの再起動数です。 | 最大 | コンテナー |
| ポッドのCPUリクエスト | ポッドのCPUリクエストです。 | 最大 | ミリコア |
| ポッドのメモリリクエスト | ポッドのメモリリクエストです。 | 最大 | バイト |
| ポッドのCPU制限 | ポッド内のコンテナーに定義されているCPU制限です。 | 最大 | ミリコア |
| ポッドのメモリ制限 | ポッド内のコンテナーに定義されているメモリ制限です。 | 最大 | バイト |
| ポッドの失敗ステータス | ポッド内のすべてのコンテナーが停止したことを示します。 | 最大 | 数 |
| ポッドの待機ステータス | ポッド内のすべてのコンテナーが待機していることを示します。 | 最大 | 数 |
| ポッドのステータス実行中 | ポッド内のすべてのコンテナーが実行していることを示します。 | 最大 | 数 |
| ポッドのスケジュール済みステータス | ポッドがノードにスケジュールされていることを示します。 | 最大 | 数 |
| ポッドの未知のステータス | ポッドのステータスが取得できないことを示します。 | 最大 | 数 |
| ポッドの保留中ステータス | クラスターで受容されているが、複数コンテナーがまだ準備完了状態になっていない状態を示します。 | 最大 | 数 |
| ポッドの成功ステータス | ポッド内のすべてのコンテナーが停止していて再起動していない状態を示します。 | 最大 | 数 |
| ポッドのコンテナー数 | ポッド仕様で定義されているコンテナーの数です。 | 最大 | 数 |
| ポッドの実行中コンテナー数 | 現在実行状態であるポッドのコンテナー数です。 | 最大 | 数 |
| ポッドの停止状態コンテナー | ポッド内の停止状態のコンテナー数です。 | 最大 | 数 |
| ポッドの実行状態コンテナー | ポッド内の実行状態のコンテナー数です。 | 最大 | 数 |
| ポッドの待機状態のコンテナー | ポッド内の待機状態のコンテナー数です。 | 最大 | 数 |
| ポッドのインターフェース受信ネットワークドロップ | ポッドの受信時にドロップしたネットワークインターフェースのパケット数です。 | 合計 | MB/秒 |
| ポッドのインターフェース送信ネットワークドロップ | ポッドの送信時にドロップしたネットワークインターフェースのパケット数です。 | 合計 | MB/秒 |
| メトリック名 | 説明 | 統計 | 単位 |
|---|---|---|---|
| コンテナーのCPU使用率 | コンテナーで使用されたCPUのパーセンテージです。 | 平均 | パーセンテージ |
| コンテナーのコンテナー制限を超過したCPU使用率 | コンテナー制限に関連するコンテナーで使用されたCPUパーセンテージです。 | 平均 | パーセンテージ |
| コンテナーメモリ使用率 | コンテナーで使用されたメモリパーセンテージです。 | 平均 | パーセンテージ |
| コンテナー制限を超過したメモリ使用率 | コンテナー制限に関連するコンテナーで使用されたメモリパーセンテージです。 | 平均 | バイト/秒 |
| コンテナーメモリ失敗の合計 | コンテナーで発生したメモリ割り当て失敗回数です。 | 平均 | MB/秒 |
| コンテナーファイルシステム使用量 | コンテナーファイルシステムで使用されている現在のディスク容量です。 | 平均 | バイト |
| コンテナー空きファイルシステム | コンテナーファイルシステム内の空きディスク容量です。 | 平均 | バイト |
| コンテナーファイルシステム使用率 | コンテナーファイルシステム内の空きディスク容量と使用ディスク容量の割合です。 | 平均 | MB/秒 |
[管理]→[設定プロファイル]→[しきい値と可用性 (+)]の順にアクセスし、監視タイプで[EKSクラスター]、[EKSノード]、[EKSネームスペース]のいずれかを選択します。この手順により上記で選択したメトリックのしきい値を設定できます。さらに、EKSネームスペースとEKSノード監視では、しきい値フォームで非アクティブなネームスペースとノードをメンテナンスとして設定することができます。
Site24x7のEKS統合にはステータス伝達機能が含まれており、EKSノードおよびEKSネームスペース監視からのアラートを親EKSクラスター監視に伝達できます。
個々の子モニターのアラートを管理することもできます。
これらのオプションをクラスターレベルで有効にするだけでなく、個々の子モニターにステータスアラートを設定する必要があります。ステータスアラートが明示的に設定された子モニターのみが親モニターにアラートを送信します。
子モニターのステータスアラート設定方法
次のAmazon EKSクラスターメトリックの未来の値を見積ることで、AWSインフラのキャパシティ追加やスケーリングの計画に役立てられます。
ネームスペースレベルメトリックでは、次の予測値を表示できます。
ノードレベルメトリックでは次の予測値を表示できます。
各EKS監視の監視データを以下に示します。
本社情報を記載しているため、英語表記となります。
EKSクラスタ監視データでは、次のタブで次のデータを表示できます。
Gain an overview of different events occurring within each resource with time series charts. These charts provide event timelines on CPU utilization and memory utilization at a pod and node level in percentage, total bytes sent or received, the file system capacity, and the number of running containers and pods. All time series charts have the average, minimum, and maximum values listed.
Node groups automate the provisioning and life cycle management of nodes (Amazon EC2 instances) for Amazon EKS Kubernetes clusters. You can view the list of node groups associated with your EKS monitor on the Node Group tab. This tab will be displayed only if a node group is created for the EKS cluster.
Fargate profiles are part of your Amazon EKS cluster and enable you to manage which pods start on Fargate and how they run with Fargate. The Fargate Profile tab shows the list of Fargate profiles associated with your EKS monitor. This tab will be displayed only if a Fargate profile is created for the EKS cluster.
Here you can view a list of nodes and namespaces associated with your Elastic Kubernetes environment. Click on an individual listing to see performance and resource usage stats associated with that resource. You can also set thresholds and be notified when any of these services fail by clicking the pencil icon under Action.
The Monitored Resources tab displays the EC2 instance and EC2 autoscaling group associated with the EKS cluster.
OIDC is an object representing the OpenID Connect (OIDC) identity provider information for the cluster. You can view the OIDC associated with the EKS cluster on the OIDC tab.
Add-ons are common operational software, like Amazon VPC CNI, CoreDNS, and kube-proxy, that extend the Kubernetes operational functionality. The Add-ons tab displays the list of EKS cluster add-ons and the add-ons related to update events.
Obtain configuration updates related to the EKS cluster and node groups on the Update History tab.
Collect EKS control plane log entries for selected log types, with the logs being fetched from CloudWatch and categorized under log stream name.
The configuration details of an EKS are provided under this tab. Details on the resource name, endpoint URL, region of a resource, status of a resource, security groups, subnets, VPC ID, status on the public access/private access, security groups, and many more are provided in this section.
You can view the EKS Node monitor data on the following tabs:
Gain an overview of different events occurring within each resource with time series charts. These charts provide event timelines on CPU utilization and memory utilization at a node level in percentage, total bytes sent or received, the file system capacity, and the number of running containers and pods. All time series charts have the average, minimum, and maximum values listed.
The Pods tab displays EKS Pods Availability details and the list of EKS Pod monitors in the EKS Pods section. Click any monitor name to view the EKS Pod monitor details.
This tab shows the forecast chart that displays future points of a performance metric (measurement of resource usage) based on historical time series data. Thirty days of historical data is used to predict what your metric usage will be in the next thirty days.
Obtain configuration details of the EKS Node monitor such as Instance ID, Node Name, Cluster Name, and Instance Type.
The Outages tab provides details on an outage's start time, end time, duration, and comments, if any.
Obtain details like Cluster Name, Node Name, Region, and Monitor Licensing Category from the Inventory tab. Set and view the Threshold and Availability Profile and the Notification Profile according to the user in this tab.
This tab offers a consolidated report of the EKS Node monitor's log status, which can be downloaded as a CSV file.
You can view the EKS Namespace monitor data on the following tabs:
Gain an overview of different events occurring within each resource with time series charts along with the configuration details. All time series charts have the average, minimum, and maximum values listed.
The Pods tab displays EKS Pods Availability details and the list of EKS Pod monitors in the EKS Pods section. Click any monitor name to view the EKS Pod monitor details.
The Containers tab displays EKS Container Availability details and the list of EKS Container monitors in the EKS Containers section. Click any monitor name to view the EKS Container monitor details.
The Services tab displays EKS Service Availability details and the list of EKS Service monitors in the EKS Services section. Click any monitor name to view the EKS Service monitor details.
This tab shows the forecast chart that displays future points of a performance metric (measurement of resource usage) based on historical time series data. Thirty days of historical data is used to predict what your metric usage will be in the next thirty days.
The Outages tab provides details on an outage's start time, end time, duration, and comments, if any.
Obtain details like Cluster Name, Namespace Name, Region, and Monitor Licensing Category from the Inventory tab. Set and view the Threshold and Availability Profile and the Notification Profile according to the user in this tab.
This tab offers a consolidated report of the EKS Namespace monitor's log status, which can be downloaded as a CSV file.
You can view the EKS Pod monitor data on the following tabs:
Get details of different events occurring within each resource with time series charts along with the configuration details. All time series charts have the average, minimum, and maximum values listed.
The Containers tab displays EKS Container Availability details and the list of EKS Container monitors in the EKS Containers section. Click any monitor name to view the EKS Container monitor details.
The Outages tab provides details on an outage's start time, end time, duration, and comments, if any.
Obtain details like Cluster Name, Pod Name, Region, and Monitor Licensing Category from the Inventory tab. Set and view the Threshold and Availability Profile and the Notification Profile according to the user in this tab.
This tab offers a consolidated report of the EKS Pod monitor's log status, which can be downloaded as a CSV file.
You can view the EKS Container monitor data on the following tabs:
Get details of different events occurring within each resource with time series charts along with the configuration details. All time series charts have the average, minimum, and maximum values listed.
The Outages tab provides details on an outage's start time, end time, duration, and comments, if any.
Obtain details like Cluster Name, Container Name, Region, and Monitor Licensing Category from the Inventory tab. Set and view the Threshold and Availability Profile and the Notification Profile according to the user in this tab.
This tab offers a consolidated report of the EKS Container monitor's log status, which can be downloaded as a CSV file.
You can view the EKS Service monitor data on the following tabs:
Get details of different events occurring within each resource with time series charts along with the configuration details. All time series charts have the average, minimum, and maximum values listed.
The Pods tab displays EKS Pods Availability details and the list of EKS Pod monitors in the EKS Pods section. Click any monitor name to view the EKS Pod monitor details.
The Outages tab provides details on an outage's start time, end time, duration, and comments, if any.
Obtain details like Cluster Name, Service Name, Region, and Monitor Licensing Category from the Inventory tab. Set and view the Threshold and Availability Profile and the Notification Profile according to the user in this tab.
This tab offers a consolidated report of the EKS Service monitor's log status, which can be downloaded as a CSV file.