ヘルプ Kubernetes CoreDNS監視

Kubernetes CoreDNS監視

CoreDNSはKubernetesバージョン1.13以降のデフォルトDNSサーバーであり、サービス名をIPアドレスに変換し、クラスター内でサービスディスカバリーが正しく機能することを保証します。Site24x7のKubernetes CoreDNS監視を利用することで、DNSパフォーマンス、クエリ処理、キャッシュ効率、リソース使用状況を詳細に可視化し、ワークロードのアクセスと応答性を確保できます。

リクエストのレイテンシ、応答エラー、キャッシュ ヒット率、Goランタイムパフォーマンスなどの主要なCoreDNSメトリックを監視して、DNS の問題がワークロードに影響を与える前に積極的に対処します。

ユースケースは以下の通りです。

  • ポッド間の通信を中断する可能性のある、高遅延または失敗したDNSルックアップを検出します。
  • 誤った設定、転送エラー、および正常でないアップストリームリゾルバーを特定します。
  • キャッシュの使用を最適化して、クエリ時間と外部DNSへの依存を減らします。
  • リソースの使用状況を追跡して、CoreDNSが適切なサイズで安定しているかどうか確認します。

Site24x7を使用してCoreDNSの展開を正常に保ち、適切に監視することで、DNS関連の問題に先手を打ってクラスターの安定性を維持します。

サポートされているバージョン

本機能は、Linux サーバー監視エージェント、バージョン 21.0.0からサポートされています。

コントロール プレーンの監視やその他の最新機能を使用するには、Kubernetes エージェントを最新バージョンにアップグレードする必要があります。

Kubernetes監視をまだ追加していない場合は、こちらの手順をご参照ください。

CoreDNS監視

エージェントがアップグレードされると、Site24x7 Kubernetes監視エージェントはすべてのCoreDNSメトリックを取得します。

CoreDNS監視に移動する手順:

  1. Site24x7アカウントにログインします。
  2. K8sに移動し、クラスター > CoreDNSを選択します。
  3. 選択したクラスターのCoreDNS監視のリストが開きます。監視をクリックすると、詳細なDNSメトリクスが表示されます。

監視パラメーター

使用率

メトリック名 説明 単位
DNS応答エラー数 DNS応答エラーの数 カウント
転送最大同時拒否数 最大同時実行制限により拒否された転送リクエストの数 カウント
正常性チェック失敗 失敗した正常性チェックの数 カウント
Kubernetes DNS プログラミング期間 CoreDNSがKubernetesサービスのDNSレコードを更新またはプログラムするのにかかった時間
成功したキャッシュヒットレート 総リクエスト数に対する成功したキャッシュヒットの割合 %
平均DNSリクエストサイズ期間 DNSリクエストの処理にかかる平均時間
平均転送要求期間 CoreDNSによって転送されたDNSクエリに上流DNSサーバーが応答するまでにかかる平均時間
DNSリクエスト数 処理されたDNSリクエストの総数 カウント
DNS応答数 送信されたDNS応答の総数 カウント
UDPリクエスト数 UDP経由で受信したDNSリクエストの数 カウント
TCPリクエスト数 TCP経由で受信したDNSリクエストの数 カウント
IPv4 DNSリクエスト数 処理されたIPv4 DNSリクエストの数 カウント
IPv6 DNSリクエスト数 処理されたIPv6 DNSリクエストの数 カウント
平均DNSリクエストサイズ DNSリクエストの平均サイズ バイト
平均DNS応答サイズ DNS応答の平均サイズ バイト
転送リクエスト数 CoreDNSが設定された上流DNSサーバーに転送したDNSリクエストの数 カウント
転送応答数 CoreDNSが設定された上流DNSサーバーから受信したDNS応答の数 カウント
レコードタイプ別のDNSリクエスト レコードタイプ(IXFR、AAAA、DNSKEYなど)別にグループ化されたDNSリクエストの数 カウント
Goスレッド 最後のポーリング間隔中にCoreDNSプロセスのGoランタイムによって作成されたOSスレッドの数 カウント
Goルーチン CoreDNSプロセスに現在存在するGoroutineの数 カウント
プロセスオープンファイルデスクリプター 最後のポーリング間隔中にCoreDNSプロセスによって開かれたファイル記述子の数 カウント
プロセスCPU時間 最後のポーリング間隔中にCoreDNSプロセスによって消費されたCPU時間
プロセス常駐メモリ 最後のポーリング間隔中にCoreDNSプロセスによって使用された常駐メモリの量 バイト
プロセス仮想メモリ 最後のポーリング間隔中にCoreDNSプロセスによって使用された仮想メモリの量 バイト

正常 & 異常

メトリック名 説明 単位
CoreDNSパニック CoreDNSパニックイベントの数 カウント
ブロークンフォワーダー正常性チェック 転送プラグインで設定されたすべての上流サーバーが不健全な状態になった回数 カウント
正常性チェック失敗 正常性の失敗の総数 カウント
プロキシ正常性チェック失敗 アップストリームごとの失敗した正常性チェックの数 カウント
リロード失敗数 CoreDNSリロード失敗回数 カウント
転送最大同時拒否数 最大同時実行制限により拒否された転送要求の数 カウント
転送リクエストエラー数 フォワードDNSリクエストのエラー数 カウント
返されたコードごとの転送リクエスト数 返されたコード別に分類されたフォワードDNSリクエストの数 カウント
転送応答エラー数 フォワードDNS応答のエラー数 カウント
返されたコードごとの転送応答数 返されたコード別に分類されたフォワードDNS応答の数 カウント
DNS応答エラー数 DNS応答エラーの数 カウント
返されたコード別の応答数 返されたコード別に分類されたDNS応答の数 カウント

キャッシュ使用

メトリック名 説明 単位
成功したキャッシュエントリ 成功したキャッシュエントリの数 カウント
拒否されたキャッシュエントリ 拒否されたキャッシュエントリの数 カウント
キャッシュエントリ成功レート 成功したキャッシュエントリの割合 %
成功したキャッシュヒット 成功したキャッシュヒットの数 カウント
拒否されたキャッシュヒット 拒否されたキャッシュヒットの数 カウント
成功したキャッシュヒットレート 成功したキャッシュヒットの割合 %
キャッシュミス数 キャッシュミスの数 カウント

関連リンク