サービスレベル目標(SLO)で、顧客に配信するサービスのレベルを定義し計測します。明確なパフォーマンス目標をSLOとして設けることで、サービスレベルの監視、評価、継続的な向上に繋げられます。
Site24x7では、可用性やパフォーマンス属性に関連するメトリックを使用してSLOを定義します。これによりサービスがSLAに準拠しているか評価できます。
サービスの信頼性を追跡することで、サービスを高いレベルに保ち、顧客の信頼を維持します。これにより、SLO違反が発生するまでのエラー予算の管理を行うことができます。
SLOとはサービスの信頼性における目標です。可用性やパフォーマンスのレベルで定義します。
固定された時間枠における割合を表示します。例として、直近30日のアップ時間が99.9%である必要があるWebサイト稼働状況がSLOとなり得ます。サービスがこのしきい値を下回ると、そのサービスレベルが準拠していないことを示します。
SLOにはサービスレベル指標(SLI)という重要なKPIに基づいて構成され、SLOへの到達状況が監視されます。
SLOでサービスの信頼性を監視し、サービスレベル向上のためにデータ起点の判断をすることができます。
SLOを監視するメリットは次のとおりです。
アプリケーションのSLOを監視
アプリケーションパフォーマンスのSLOを把握における例は次のとおりです。
Site24x7 APMを使用してWebアプリケーションを監視しており、2秒以内でユーザーのリクエストに応答できた割合が全体のリクエスト数の95%以上を目標にしたいとします。その場合、次の設定でSLOを作成してください。
上記設定を行うと、Site24x7が定義したしきい値に対するアプリケーションパフォーマンスを評価します。2秒を超過したトランザクション数が全体の5%を超えた場合、違反とみなされます。この結果、SLO違反となりエラー予算の使用量が変動します。
バーンレートも同時に計算され、エラー予算消費の速さを把握できます。エラー予算がすべて消費されるとSLO違反となり、顧客との間に交わした基準に失敗したことを表します。
Site24x7でSLOを監視すると、目標の達成度を把握でき顧客とのコミットメントを追跡できます。この分析により、パフォーマンスの低下を未然に防止し、向上を図ります。
Site24x7で監視と関連するSLI(可用性や応答時間など)を設定します。その後、しきい値と評価期間を選択し、定義した目標に準拠しているか継続的に確認します。パフォーマンスがしきい値違反となると、SLOに失敗したことを表します。
個々の監視またはタグを使用した監視のグループに対してSLOを定義できます。設定後、グラフやレポートでSLO評価結果を表示され、そこでサービス信頼性を評価できます。
SLOに関するその他のガイドは、次の各リンクを参照してください。
ユーザーガイド | 内容 |
SLOの追加方法 | SLOの作成と設定、目標の定義、監視の設定方法について記載しています。 |
SLOのパフォーマンスメトリック | 現在と過去のSLOパフォーマンスを分析、傾向の追跡、目標設定によるコンプライアンス評価におけるメトリックについて記載しています。 |
しきい値と可用性 | パフォーマンスしきい値の定義し可用性の計測を行い、顧客に信頼されるレベルに準拠しているか確認します。 |
SLOレポート | SLOレポートを生成し、重要なメトリックの表示とコンプライアンスの追跡を行います。 |
SLOダッシュボード | 全SLOの概要をグラフやメトリックとして、1つのダッシュボードで表示します。 |
SLOについて | SLI、エラー予算、バーンレート、コンプライアンス割合などのSLO関連の用語について記載しています。 |