SLOメトリック
SLO結果の参照
サービスレベル目標(SLO)メトリックで、定義したSLOに対してサービスのパフォーマンス、エラー消費、コンプライアンスを分析します。このダッシュボードでサービスの信頼性を追跡しパフォーマンス管理を行えます。
下記のタブによりパフォーマンスを分類して表示します。
サマリー
サマリータブにはすべてのSLOメトリックを表示します。サマリーページで表示されるメトリックは次のとおりです。
メトリック |
説明 |
繰り返し時間枠 |
SLOパフォーマンスを計測する継続的な期間です。 |
現在のSLO |
SLOの可用性や信頼性のリアルタイムなパーセンテージです。 |
目標SLO |
サービスが到達すべき信頼性のゴールです。 |
想定内のエラー消費 |
使用された許可されたダウン時間のパーセンテージです。 |
残りのエラー時間 |
SLO違反前の残りの想定しているダウン時間です。 |
バーンレート |
消費された想定内エラーのスピードです。 |
グラフ表示
サマリータブでは重要メトリックのグラフが表示されます。表示されるグラフは次のとおりです。
- SLO
- 残りのエラー時間
- 想定内のエラー消費
- バーンレート
- サービスレベル指標(SLI)
-
SLOグラフ(棒グラフ)
SLOパフォーマンス経過時間、SLOパーセンテージが監視間隔ベースのタイムスタンプで表示されます。
指定した間隔のSLOステータスがそれぞれ表示されます。目標達成における一貫性または変動を表示します。
-
残りのエラー時間
選択した期間での残りのエラー時間を表示します。
これが低下すると、サービスが想定内エラー消費していて、SLO違反のリスクがあることを表します。
-
想定内のエラー消費
このグラフは想定内のエラーバジェットを表します。SLO違反が発生する前の許容できる障害レベルとダウンタイムです。
これが上昇すると、サービスの中断やエラーバジェットの消費が発生していることを表します。
0を推移している場合、エラーバジェットの消費が発生していないことを表します。
-
バーンレートグラフ
エラーバジェットが使用された時間帯を表示します。0を推移している場合は、エラーバジェット消費が発生していないことを表します。
バーンレートの値が1以上の場合、サービス障害やバジェット消費が発生していることを表します。
バーンレートの解読:
- バーンレート = 1:エラーが記録されておらず、サービスがSLOに準拠している状態
- 段々と上昇:小さいまたは局所的なエラーが発生しているが、重大ではない状態
- 急なスパイク:エラーバジェットの消費が激しいサービス問題が発生し、SLO違反のリスクがある状態
-
SLIグラフ
SLOに設定している各SLIのグラフであり、評価方法ごとに表示されます。
評価方法
- 数ベース
- 時間ベース
- 時間スライスベース
- 数ベース:特定のイベントの発生回数ベースでSLOを計測します。99.9%の成功レートであるSLOをもつAPIを考えます。評価期間ないでリクエスト合計に対して成功したAPIリクエスト数をこの方法で評価します。
1000リクエストのAPIが生成され999が成功した場合、そのレートは99.9%となりSLOに準拠しています。エラーが数の合計に対して0.1%を超過すると、SLO違反が発生します。
- 時間ベース:サービスが良いまたは悪い状態であった時間の合計ベースでSLOを計測します。SLOが99.9%のアップ時間であるWebサイト(www.example.com)を考えます。Webサイトにアクセス可能であった時間の長さを評価します。30日の間でWebサイトがアップしていた時間が43200分でした。SLOが99.9%であった場合、アップする時間は43157分である必要があり、43分の余裕がありました。月のダウン時間が43分を超過した場合、SLO違反に該当します。
- 時間スライスベース:時間間隔で分けてその各枠で評価します。SLOが1時間の99.9%がアップ時間であるWebサイトを考えます。この場合、Webサイトが1時間ごとに99.9%アップしている必要があります。
各SLIのグラフは次のとおりです。ハンバーガーアイコンから[SLI名の変更]を選択するとSLI名を変更できます。[ダッシュボードに追加]をクリックすると、SLIをダッシュボードに追加します。
-
SLIレポート
各SLIの
アイコンをクリックするとSLIレポートが表示されます。すべての関連する監視のSLIが時間ベースのグラフで表示され、SLI配下に監視数の合計を表示します。
ログレポート
SLO監視に連携されたログレコードを使用して、SLO監視の様々なログ情報について分析します。可用性によりログをフィルターすることも可能です。
収集時間、ステータス、エラー消費した予算(%)、エラー残りの時間、バーンレート、SLOコンプライアンス(%)のパフォーマンスもここに表示されます。表アイコンでログレポートの列をフィルター、[CSVでダウンロード]で、CSV形式でエクスポートできます。
インベントリー
監視ライセンスカテゴリー、チェック間隔、しきい値と可用性プロファイル、通知プロファイル、ユーザーアラートグループ、監視作成時間、直近の修正時間といった基本的な情報を表示します。
[インシデントチャット]をクリックして、ボットとSLO監視に関する会話を行います。[メモの追加]をクリックしてSLO監視に関するメモを追加できます。
関連ガイド