SLO:概要

サービスレベル目標(SLO)で、顧客に配信するサービスのレベルを定義し計測します。明確なパフォーマンス目標をSLOとして設けることで、サービスレベルの監視、評価、継続的な向上に繋げられます。

Site24x7では、可用性やパフォーマンス属性に関連するメトリックを使用してSLOを定義します。これによりサービスがSLAに準拠しているか評価できます。

サービスの信頼性を追跡することで、サービスを高いレベルに保ち、顧客の信頼を維持します。これにより、SLO違反が発生するまでのエラー予算の管理を行うことができます。

目次

SLOとは

SLOとはサービスの信頼性における目標です。可用性やパフォーマンスのレベルで定義します。

固定された時間枠における割合を表示します。例として、直近30日のアップ時間が99.9%である必要があるWebサイト稼働状況がSLOとなり得ます。サービスがこのしきい値を下回ると、そのサービスレベルが準拠していないことを示します。

SLOにはサービスレベル指標(SLI)という重要なKPIに基づいて構成され、SLOへの到達状況が監視されます。

SLOが必要な理由

SLOでサービスの信頼性を監視し、サービスレベル向上のためにデータ起点の判断をすることができます。
SLOを監視するメリットは次のとおりです。

  • パフォーマンスの傾向の追跡:指定した期間でサービスがどのように稼働しているかを把握します
  • 違反の防止:顧客に影響が及ぶ前に、問題を事前に解決します
  • 顧客の信頼性の向上:SLOに準拠しているかどうか監視し、顧客の信頼を構築します
  • エンジニアリングの決定を判断:開発が必要な領域を特定し、効率的に修正を実施します
  • 中心的な管理:全監視リソースのSLOを定義し、単一ダッシュボードで管理します
  • パフォーマンスの可視化:様々なグラフを使用してSLOパフォーマンスを可視化し、それらデータのレポートを表示します
  • エラー予算追跡:エラー予算とバーンレートを自動で計算し監視します
  • アラート:指定したしきい値にSLOが近づくまたは超過した際にアラートを受信します

ユースケース

アプリケーションのSLOを監視
アプリケーションパフォーマンスのSLOを把握における例は次のとおりです。

Site24x7 APMを使用してWebアプリケーションを監視しており、2秒以内でユーザーのリクエストに応答できた割合が全体のリクエスト数の95%以上を目標にしたいとします。その場合、次の設定でSLOを作成してください。

  • SLI:応答時間(APMメトリック)
  • 期間:直近7日間
  • しきい値:2秒以内に完了したトランザクションが95%

上記設定を行うと、Site24x7が定義したしきい値に対するアプリケーションパフォーマンスを評価します。2秒を超過したトランザクション数が全体の5%を超えた場合、違反とみなされます。この結果、SLO違反となりエラー予算の使用量が変動します。

バーンレートも同時に計算され、エラー予算消費の速さを把握できます。エラー予算がすべて消費されるとSLO違反となり、顧客との間に交わした基準に失敗したことを表します。

Site24x7でSLOを監視すると、目標の達成度を把握でき顧客とのコミットメントを追跡できます。この分析により、パフォーマンスの低下を未然に防止し、向上を図ります。

SLOの仕組み

Site24x7で監視と関連するSLI(可用性や応答時間など)を設定します。その後、しきい値と評価期間を選択し、定義した目標に準拠しているか継続的に確認します。パフォーマンスがしきい値違反となると、SLOに失敗したことを表します。

個々の監視またはタグを使用した監視のグループに対してSLOを定義できます。設定後、グラフやレポートでSLO評価結果を表示され、そこでサービス信頼性を評価できます。

関連ガイド

SLOに関するその他のガイドは、次の各リンクを参照してください。

ユーザーガイド 内容
SLOの追加方法 SLOの作成と設定、目標の定義、監視の設定方法について記載しています。
SLOのパフォーマンスメトリック 現在と過去のSLOパフォーマンスを分析、傾向の追跡、目標設定によるコンプライアンス評価におけるメトリックについて記載しています。
しきい値と可用性 パフォーマンスしきい値の定義し可用性の計測を行い、顧客に信頼されるレベルに準拠しているか確認します。
SLOレポート SLOレポートを生成し、重要なメトリックの表示とコンプライアンスの追跡を行います。
SLOダッシュボード 全SLOの概要をグラフやメトリックとして、1つのダッシュボードで表示します。
SLOについて SLI、エラー予算、バーンレート、コンプライアンス割合などのSLO関連の用語について記載しています。