OCI監視におけるステータス伝播
ステータス伝播機能は、子監視で生成されたアラートを、親監視に自動で反映する機能です。この機能を有効化すると、子監視でのステータスの変更が、親監視に反映されます。
これにより、各リソースを個別で監視することなく、OCIインフラストラクチャ全体の正常性に関する統一されたビューを維持でき、アラートの管理を大幅に簡素化できます。
ステータス伝播のメリット
ステータス伝播には次のメリットがあります。
- アラート管理プロセスの簡素化
個別の子リソースから都度アラートを受信するのではなく、親監視から単一のアラートのみを受信する運用へと効率化します。
- OCIインフラストラクチャの包括的な把握
個別に発生したアラートを集約することで、OCIインフラストラクチャ全体の正常性とステータスを包括的に把握できます。
- アラート疲れの防止と見落としの軽減
アラートの総数を減らすことでアラート疲れを最小限に抑え、重要なアラートの迅速な検知と、見落としの防止を実現します。
- 監視運用の効率化
通知の総数を減らし、各リソースのステータスを網羅した統合ビューを提供することで、効率的な監視を実現します。
ユースケース
OCIでコンピュートインスタンスを親リソースとして監視し、アタッチされたブロックボリュームを子リソースとして監視している構成を想定します。
ブロックボリュームで高いレイテンシー、IOPSの低下、利用不可などの問題が発生すると、コンピュートインスタンスのパフォーマンスに直接影響します。しかし、インスタンス側のメトリクスだけでは、問題がストレージ層に起因するのか判断が難しく、切り分けに時間がかかります。
ステータス伝播を利用することで、ブロックボリュームがトラブルまたはクリティカル状態になった際、そのステータスが自動的にコンピュートインスタンス側へ反映されます。これにより、親インスタンスでアラートがトリガーされ、個別にボリュームを調査しなくても、ストレージ関連の問題を即座に把握できます。
この設定により、以下の効果が得られます。
- ストレージボトルネックの早期検知:OCIコンピュート性能への影響を素早く把握
- インスタンス/ボリューム関連の相関分析効率化:トラブルの関連付けにかかる時間を短縮
- アプリケーション遅延の根本原因分析:速度低下の要因を明確化
- OCIコンピュートとブロックストレージの統合監視強化:依存関係を跨いだ監視を改善
ブロックストレージの正常性をコンピュートインスタンス監視に関連付けることで、インスタンス全体のパフォーマンスをより正確に把握し、Oracle
Cloud上のワークロードに影響を与える問題へ迅速に対応できます。
該当するOCIサービスで本機能を有効にするには、以下の手順に従います。
- Site24x7アカウントにログインし、[Cloud]→[OCI]に移動します。
- ステータス伝播を有効にしたいサービスを選択します。
- [編集]をクリックし、設定プロファイルに移動します。
- しきい値プロファイルの編集ページで、該当する子監視のしきい値設定を[はい]に切り替えます。例えば、ブロックストレージ監視のステータス伝播を有効にしたい場合は、コンピュートインスタンス監視の「しきい値プロファイル編集」ページで、「ブロックストレージのステータス変更の通知」を[はい]に切り替えます。
- [保存]をクリックします。
これにより、各子監視でステータス伝播が有効になります。
ステータス伝播を有効にしたら、それぞれの子監視のアラートを受信するために、以下の手順を実行します。
- 親監視から、それぞれの子監視リストに移動します。たとえば、ブロックストレージ監視の通知を有効にするには、[コンピュートインスタンス]→
[ブロックストレージ]に移動して、ブロックストレージ監視リストを表示します。
- 監視リストの上にある[しきい値設定]をクリックします。
- アラートを受信したい子監視を選択します。
- [アラートをスキップ]オプションは、デフォルトで[いいえ]に設定されています。アラートをスキップしたい場合は、オプションを[はい]に切り替えます。
- [通知タイプ]オプションで、必要に応じてアラートタイプを選択します。利用可能なオプションは、[ダウン]、[トラブル]、[クリティカル]です。
- [保存]をクリックします。
変更を保存すると、親監視だけでなく、子監視のアラートも受信するようになります。たとえば上記の例では、ブロックストレージ監視のアラートが、コンピュートインスタンス監視を通じて通知されます。