Zabbixでリソース監視する手順をWindowsとLinuxともに詳しく紹介

Zabbix 5.0でサーバーのリソースを監視するための設定手順を紹介します。また、無料かつ5分でリソース監視を始める方法も紹介していますので参考にしてみてください。

Zabbixでリソース監視する手順

1. Zabbixサーバーの構築

Zabbixサーバーの構築手順はこちらの記事をご確認ください。AWS上のCentOS 8にZabbix 5.0を構築する手順を詳しく説明しています。

2. Zabbixエージェントのインストール

Zabbixエージェントのインストール手順はこちらの記事をご確認ください。Windows編、Linux編に分けて詳しく説明しています。

3. リソース監視設定

サーバーのリソース監視は、CPU、メモリ、ディスクの監視を意味します。ここではCPU使用率の監視設定手順を紹介します。監視対象サーバーのOSにより少し異なるため、Windows編とLinux編にわけて紹介します。

なお、メモリ使用率の監視設定手順はこちらの記事ディスク使用率の監視設定手順はこちらの記事で紹介していますので、合わせてご確認ください。

Windows編

テンプレートを最初から作成することも出来ますが、用意されているテンプレートを利用していきましょう。今回設定したテンプレート(Template OS Windows by Zabbix agent)には基本的な役割ごとのテンプレートがリンクされています。

Zabbixでリソース監視する手順Windows編01

CPUに関するものを見てみると、トリガーの条件文で{$CPU.UTIL.CRIT}が使われており、マクロの項目でしきい値(90%)が設定されているのが分かります。

Zabbixでリソース監視する手順Windows編02

[設定]→[ホスト]→[対象のサーバー](今回はWindows Server)をクリックし[トリガー]を見てみます。 Windowsの標準テンプレートは最初からトリガーが になっていることが分かります。

Zabbixでリソース監視する手順Windows編03

次に、実際に適用されているのをグラフで確認してみましょう。

[監視データ]→[ホスト]で対象のWindowsサーバーの[グラフ]をクリックします。

Zabbixでリソース監視する手順Windows編04

Windows host:CPU utilizationというグラフを見ると、黄色い点線で のが分かります。5分平均で90%の使用率を超えると障害になります。

Zabbixでリソース監視する手順Windows編05

無料かつ5分でリソース監視を始める方法はこちら

Linux編

Linuxで設定するテンプレート(Template OS Linux by Zabbix agent)にもWindowsと同じように役割ごとのテンプレートがリンクされています。CPUに関するものをみていると設定が入っているのが分かります。確認していきましょう。

Zabbixでリソース監視する手順Linux編01

Template Module Linux CPU by Zabbix agentの値を確認すると、トリガーの条件文で{$CPU.UTIL.CRIT}が使われており、しきい値90%が指定されていることがわかります。

Zabbixでリソース監視する手順Linux編02

Windowsと同じで最初から監視できているのでは?と思ってしまいますが、Windowsのテンプレートとは異なりLinuxのテンプレートではCPU使用率のトリガーは有効になっていません。情報取得はしているのでグラフ表示は出来るのですが、異常を検知した時に連絡して対応するといった運用にはもっと設定作業が必要になります。

検知させるためにトリガーの設定をしていきましょう。

[設定]→[ホスト]→[対象のサーバー](今回はLinux Server)をクリックし[トリガー]を見てみます。Windowsで確認したようにフィルターをかけると確認しやすいです。

ロードアベレージ単位でのトリガーは有効なのですが、分かりづらい監視指標のため、使用率で監視できる[CPU utilization]を有効にします。ステータスが[無効]になっているのでクリックすると[有効]にできます。

Zabbixでリソース監視する手順Linux編03

次に、実際に適用されているのをグラフで確認してみましょう。

[監視データ]→[ホスト]で対象のWindowsサーバーの[グラフ]をクリックします。

Zabbixでリソース監視する手順Linux編04

Linux Server:CPU utilizationというグラフを見ると、黄色い点線で のが分かります。

Zabbixでリソース監視する手順Linux編05

5分平均で90%を超えると障害になり、ダッシュボードでは次のように表示されます。

Zabbixでリソース監視する手順Linux編06

無料かつ5分でリソース監視を始める方法はこちら

4. 通知設定

このままでもWebコンソールから障害の確認はできますが、常に目視しているわけにも行きません。実際の運用現場ではメールなどで通知を受け取ります。今回はAWS環境で紹介していますので、サービスとして用意されているSimple Email Serviceを利用してメール通知を実装したいと思います。社内などにメールサーバーがある方はそちらに読み替えて御覧ください。

[管理]→[メディアタイプ]→[Email(HTML)]をクリック。

メール送信に必要な情報を入力して[更新]をクリック。

右端の[テスト]をクリック。

有効な送信先メールアドレスを入力し[テスト]をクリック。

設定に問題がなければ成功となります。

届いていることが確認できました。

次にこのEmail設定をユーザーに紐付けます。

[管理]→[ユーザー]→[Admin]をクリック。

[メディア]タブを選択。

[追加]をクリック。

タイプのプルダウンから先程設定した[Email(HTML)]を選択し、アラートメールを受け取りたい送信先メールアドレスを入力、[追加]します。

追加されました。

続いてメール送信を有効化します。デフォルトで管理者グループへメッセージを送信する項目がありますが、無効化されています。

[設定]→[アクション]→[無効/有効]をクリックし切り替えます。

実際に障害などが発生した際はこのようにアクション(メール送信)が実行されています。

次のようなメールを受信していることが確認できました。

無料かつ5分でリソース監視を始める方法

Zabbixによる監視にトライして、わずらわしさや難しさを感じた方もいるかもしれません。そんな方はここで紹介する方法も試してみてください。上記で紹介したZabbixの構築から通知設定までと同等の内容を5~10分で完了することができます。

数あるサーバー監視ツールの中でも、監視を開始するまでの工数が最もかからないもののひとつがSaaS型ツールの「Site24x7(サイトトゥエンティーフォーセブン)」です。FREEプランが提供されているのも好評で、今ユーザーが増えています。

ここからは、そのSite24x7でCPU使用率を監視する手順を紹介します。

1. アカウントの作成

まず、FREEプランにサインアップします。クレジットカード情報などは必要ないので安心です。

わずか30秒ほどで日本語の画面を確認することができました。今回は[サーバー監視]をクリックして次のステップに進みます。

2. エージェントのインストール

次に、監視対象のサーバーにエージェントをインストールします。Windows編とLinux編、それぞれの手順を紹介します。Site24x7もZabbix同様エージェントをインストールしていきますが、ホストの追加などの作業はありません。

Windows編

Windowsの手順は次のリンクでわかりやすく説明されているのでそちらをご確認ください。

Windows監視を5分で始める方法:
https://www.site24x7.jp/simple-server-monitoring.html

Linux編

[Linux]をクリックします。

Linux上で実行するコマンドが表示されますので[クリップボードへコピー]をクリックします。

Linuxサーバー(Amazon Linux2)に接続します。

コピーしたコマンドを実行します。wgetなどインターネット接続出来ていることが前提となりますので、オンプレ環境などの場合は作業前に確認が必要です。

シェルを実行します。

successfullyと表示されて完了。5分もかかりませんでした。

しばらく経つとクラウドポータル上に表示されます。監視対象が2つ見えているのが確認できました。ホストの追加操作は必要ありません。

3. リソース監視設定の確認

Site24x7の監視設定はデフォルトで値が入っているため、何かを設定する必要はありません。ここではその確認方法を紹介します。

[管理]→[設定プロファイル]→[しきい値と可用性]→[Default Threshold – SERVER]をクリックします(サーバー毎に分けたい場合は自身でプロファイルを作成できます)。

CPU使用率だけでなく、メモリ使用率、ディスク使用率のしきい値が設定されています。例えばCPU使用率だと65%を超えるとトラブルとして通知、90%を超えるとクリティカルとして通知してくれます。

実際にしきい値を超えると、このようにアラートが表示されます。Linuxの場合、「yes > /dev/null」コマンドなどでテスト出来ます。

4. 通知設定の確認

こちらも設定は不要です。Site24x7はクラウドサービスのため、すでにアカウント作成時のメールに障害の通知は飛んでいます。もちろんメールサーバーなどの用意は必要ありません。

ここでは、デフォルトの設定内容の確認方法と通知メールの内容を紹介します。必要に応じて設定を変更しましょう。

[管理]→[ユーザーとアラートの管理]→[ユーザー&アラート]をクリックすると自身のアカウントが登録されていますのでクリックします。

自身のアカウントのメールアドレスや権限、どのグループに所属しているかが確認できます。[アラート設定]でメールによるアラートが設定されていることが分かります。

アラート期間やアラートをしない曜日、メールをHTMLかテキストで受け取るかなども選択可能です。

グループとは[ユーザーアラートグループ]に紐付いており、他にもアプリケーション、ネットワークチームが存在しています。運用に沿って必要なアカウント、好きなグループを作り、設定すると良いでしょう。デフォルトで作成ユーザーはすべてに登録されています。

エージェントをインストールして自動的に追加されたサーバーは管理グループに紐付いています。

[ホーム]→[監視]から対象のサーバーの右端にある設定項目を選択し[編集]をクリックして確認できます。

ユーザーアラートグループが[管理グループ]に設定されています。WindowsもLinuxもデフォルトは同じです。

先程の障害通知はこのように届きます。

復旧するとこのように届きます。色付けされていて分かりやすいですね。

まとめ

ここまで、ZabbixとSite24x7によるリソース監視手順を紹介してきました。

皆さんがサーバー監視をしている運用の現場ではどのようなツールが合いそうでしょうか。Site24x7はサインアップするだけで今すぐ監視を始められます。是非この機会にお試しください。

FREEプランのサインアップはこちら:
https://www.site24x7.jp/signup.html?pack=1&l=ja

プランと価格の詳細はこちら:
https://www.site24x7.jp/pricing.html

ZabbixとSite24x7の機能比較一覧はこちら:
https://www.site24x7.jp/zabbix-alternative.html

関連記事