SLOメトリック

SLO結果の参照

サービスレベル目標(SLO)メトリックで、定義したSLOに対してサービスのパフォーマンス、エラー消費、コンプライアンスを分析します。このダッシュボードでサービスの信頼性を追跡しパフォーマンス管理を行えます。

下記のタブによりパフォーマンスを分類して表示します。

  • サマリー
  • ログレポート
  • インベントリー

サマリー

サマリータブにはすべてのSLOメトリックを表示します。サマリーページで表示されるメトリックは次のとおりです。

メトリック 説明
繰り返し時間枠 SLOパフォーマンスを計測する継続的な期間です。
現在のSLO SLOの可用性や信頼性のリアルタイムなパーセンテージです。
目標SLO サービスが到達すべき信頼性のゴールです。
想定内のエラー消費 使用された許可されたダウン時間のパーセンテージです。
残りのエラー時間 SLO違反前の残りの想定しているダウン時間です。
バーンレート 消費された想定内エラーのスピードです。

グラフ表示

サマリータブでは重要メトリックのグラフが表示されます。表示されるグラフは次のとおりです。

  • SLO
  • 残りのエラー時間
  • 想定内のエラー消費
  • バーンレート
  • サービスレベル指標(SLI)
  • SLOグラフ(棒グラフ)

    SLOパフォーマンス経過時間、SLOパーセンテージが監視間隔ベースのタイムスタンプで表示されます。

    指定した間隔のSLOステータスがそれぞれ表示されます。目標達成における一貫性または変動を表示します。
  • 残りのエラー時間

    選択した期間での残りのエラー時間を表示します。
    これが低下すると、サービスが想定内エラー消費していて、SLO違反のリスクがあることを表します。
  • 想定内のエラー消費

    このグラフは想定内のエラーバジェットを表します。SLO違反が発生する前の許容できる障害レベルとダウンタイムです。
    これが上昇すると、サービスの中断やエラーバジェットの消費が発生していることを表します。

    0を推移している場合、エラーバジェットの消費が発生していないことを表します。

  • バーンレートグラフ

    エラーバジェットが使用された時間帯を表示します。0を推移している場合は、エラーバジェット消費が発生していないことを表します。

    バーンレートの値が1以上の場合、サービス障害やバジェット消費が発生していることを表します。

    バーンレートの解読:
    • バーンレート = 1:エラーが記録されておらず、サービスがSLOに準拠している状態
    • 段々と上昇:小さいまたは局所的なエラーが発生しているが、重大ではない状態
    • 急なスパイク:エラーバジェットの消費が激しいサービス問題が発生し、SLO違反のリスクがある状態
  • SLIグラフ

    SLOに設定している各SLIのグラフであり、評価方法ごとに表示されます。

    評価方法
    • 数ベース
    • 時間ベース
    • 時間スライスベース

    • 数ベース:特定のイベントの発生回数ベースでSLOを計測します。99.9%の成功レートであるSLOをもつAPIを考えます。評価期間ないでリクエスト合計に対して成功したAPIリクエスト数をこの方法で評価します。
      1000リクエストのAPIが生成され999が成功した場合、そのレートは99.9%となりSLOに準拠しています。エラーが数の合計に対して0.1%を超過すると、SLO違反が発生します。
    • 時間ベース:サービスが良いまたは悪い状態であった時間の合計ベースでSLOを計測します。SLOが99.9%のアップ時間であるWebサイト(www.example.com)を考えます。Webサイトにアクセス可能であった時間の長さを評価します。30日の間でWebサイトがアップしていた時間が43200分でした。SLOが99.9%であった場合、アップする時間は43157分である必要があり、43分の余裕がありました。月のダウン時間が43分を超過した場合、SLO違反に該当します。
    • 時間スライスベース:時間間隔で分けてその各枠で評価します。SLOが1時間の99.9%がアップ時間であるWebサイトを考えます。この場合、Webサイトが1時間ごとに99.9%アップしている必要があります。
    各SLIのグラフは次のとおりです。ハンバーガーアイコンから[SLI名の変更]を選択するとSLI名を変更できます。[ダッシュボードに追加]をクリックすると、SLIをダッシュボードに追加します。
  • SLIレポート

    各SLIのNew tab iconアイコンをクリックするとSLIレポートが表示されます。すべての関連する監視のSLIが時間ベースのグラフで表示され、SLI配下に監視数の合計を表示します。

ログレポート

SLO監視に連携されたログレコードを使用して、SLO監視の様々なログ情報について分析します。可用性によりログをフィルターすることも可能です。
収集時間、ステータス、エラー消費した予算(%)、エラー残りの時間、バーンレート、SLOコンプライアンス(%)のパフォーマンスもここに表示されます。表アイコンでログレポートの列をフィルター、[CSVでダウンロード]で、CSV形式でエクスポートできます。

インベントリー

監視ライセンスカテゴリー、チェック間隔、しきい値と可用性プロファイル、通知プロファイル、ユーザーアラートグループ、監視作成時間、直近の修正時間といった基本的な情報を表示します。

[インシデントチャット]をクリックして、ボットとSLO監視に関する会話を行います。[メモの追加]をクリックしてSLO監視に関するメモを追加できます。

関連ガイド