Linuxサーバー監視のパフォーマンスメトリック

Linuxサーバー監視結果の読みかた

Linuxサーバー監視では、LinuxサーバーのCPU、メモリ、ディスク利用状況、プロセス、ネットワークトラフィックなどの重要メトリックの監視が、統一ダッシュボードで可能です。Linuxサーバーのパフォーマンス関連レポートをすべて表示するには、ホームページへ移動し、設定したLinuxサーバーをクリックしてください。

Linux監視の追加手順は、Linuxサーバー監視を参照ください。あわせて、サーバー監視のアーキテクチャも確認ください。

各種のレポートは、次のタブへ移動し、表示します。

サマリ
- 平均負荷
- システムビジー・アイドル時間
- CPU：コアごとのCPU利用率、割り込みとコンテキストスイッチ、平均CPU利用率（％）
- プロセス統計
- メモリ：メモリの内訳け、メモリのページング（イン、アウト、フォールト）、スワップと空きメモリの利用状況
- ディスク利用状況：ディスクパーティション、それぞれのディスクの利用状況（平均値と現在値）ディスク（I/O）
- システム統計：ログイン件数、実行中の総サービス・プロセス数
- 資産の詳細：ホスト名、IPアドレス、OSタイプ、CPUコア数
- CPUやメモリ消費で見たTopプロセス
- Docker等アプリの自動ディスカバリ
- ダウン・トラブル履歴
プロセス
- CPUとメモリの使用率（％）
- スレッドとハンドルの数
- インスタンス数
ネットワーク統計
- 属性レポート
プラグイン
リソースチェック
syslog：下記のメトリックを取得します。
- 障害
- パフォーマンス低下
- セキュリティ違反
- プログラムメッセージのログ
- プロセス重要度
サーバーツール
- プロセスビューワー
カスタムタブの追加：Site24x7ダッシュボードへのメトリック表示のカスタマイズ
根本原因分析（RCA）のレポート：障害の背後にある本当の原因を把握し、エンドユーザーへの影響が出る前に問題を診断します。
ライセンス

サマリ：

Linuxパフォーマンスの重要パラメーターすべてが、1つのコンソールで把握できます。ヒートマップ分析では、サーバーの直近7日の、ステータスとパフォーマンスが、手早く確認できます。サーバーが利用しているCPU、メモリ、ディスクなどの、重要サーバーメトリックをご確認ください。

詳細ページに表示されたメトリックをクリックすれば、それぞれの説明が詳しく表示され、包括的な関連レポートを見ることが可能です。アイコンをクリックすると、CPU、メモリ、ディスク利用状況などのパフォーマンスレポートが表示されます。ドロップダウンから値を適宜、選択し、期間を指定しての、レポート作成も可能です。レポートは、CSV/PDFにエクスポートすることも、メールで送ることも可能です。

平均負荷

平均負荷は、特定期間における平均システム負荷です。平均負荷のデータは、物理CPUが過負荷であるか、負荷が軽すぎるかの判断に利用できます。過負荷であれば、リソースを無駄にしているプロセスを検討したり、ハードウェアリソースを増強したり、負荷を他のシステムに動かしたりの対策が取れます。

システムビジー・アイドル時間を参照ください。

システム過負荷を避けるには、利用状況の確認が必要なこともあります。アイドル時間が長い場合、サーバーの過負荷が考えられ、サーバー内のリソース分配が最適ではない可能性があります。

CPU利用状況

CPU利用量の定期監視は、指定期間でのCPU負荷の分析や、パフォーマンス低下の克服には重要です。

とはいえ、CPU利用量の増大は、いつでも重大事態とは言えません。Site24x7の期間を区切ってカスタムレポートを表示する機能は、CPU利用状況が、現実の問題かを判定する際、有用です。CPU利用のスパイク（突出値）を起こしている実際の理由まで、ドリルダウンするのにも役立ちます。この分析にもとづき、CPUハードのアップグレード、CPU追加、リソースを無駄に追い回す些末なサービスの停止など、解決策を見つけることができます。

CPU利用状況は、topコマンドを利用し計算します。詳細はこちら。

CPU利用状況＝100－アイドル時間

CPU利用時間のパフォーマンスレポートは、アイコンをクリックすると利用でき、次のメトリックが表示されます。

コアごとのCPU利用状況
割り込み：プロセッサーが受信する、ハードウェア割り込みの平均件数
コンテキストスイッチ：あるスレッドから別スレッドへの切り替わりの発生率をさします。スレッドスイッチは、単一プロセス内でも、複数プロセス横断でも、発生します
平均CPU利用量（％）

プロセス統計

Linuxサーバーでの、実行中プロセスとブロックされたプロセスを、手早く確認するのに利用できます。それぞれのアプリケーションや各種サービスに関連する、プロセスごとのパフォーマンスを把握することは、Linuxサーバーへの負荷発生原因を理解するうえで重要です。

メモリ利用状況

メモリ利用量の監視により、利用率の低いサーバーを特定し、効率的な負荷の再配分が可能となります。これによって、障害やデータ損失の発生前に、サーバー過負荷を検知します。

メモリ利用量は、freeコマンドを利用して計算します。詳細はこちら。

メモリ利用率＝｛（総量ー空き容量）÷総量｝×100

メモリ利用量の パフォーマンスレポートは、アイコンをクリックすると利用でき、次のメトリックが表示されます。

スワップメモリ利用状況
使用済みメモリ利用状況
空き物理メモリとスワップメモリの内訳け
メモリページイン：ページフォールトを避けるために、ディスクからページ読み込みを行った件数
メモリページアウト：物理メモリを空けるために、ディスクにページ書き込みを行った件数
メモリページフォールト：ページフォールトは、プロセッサーがワーキングセット（すなわち、物理メモリのスペース内）に、コードやデータを見つけることができない時に、発生します。
平均メモリ利用量（％）

メモリ内訳け

サーバー内の、空きメモリとスワップメモリの内訳けも把握できます。あまり利用されないファイルは、必要時まで、スワップへ移動されることがあり、新しいファイルはRAMへと格納されます。これによって、リソース配分を改善、サーバーの過負荷とデータ損失を回避できます。

ディスク利用状況

Site24x7 Linuxサーバー監視では、ディスク利用量を注視しており、サーバー内のディスク空き容量について、情報更新を行います。サーバーの空きディスク容量と利用済み容量は、円グラフで表示します。

ディスクパーティション情報では、使用済み容量と空き容量の内訳けを、データ量（MB）と割合（％）で表示します。アクションからアイコンをクリックすると、しきい値は、ディスクごとの設定も、ディスク全体での設定も可能です。

ディスク利用状況のパフォーマンスレポートでは、次のメトリックを表示します。

平均ディスク利用率（％）
現在のディスクごとの利用状況（％）
ディスクごとの利用状況（％）
ディスク（I/O）
ディスク読み込み：ディスクからの読み込みデータ量です（バイト）。
ディスク書き込み：ディスクへの書き込みデータ量です（バイト）。

サマリページに表示される、その他のメトリック

システム統計と資産の詳細

資産の詳細では、次のサーバー情報が分かります。

ホスト名、IPアドレス
OSとアーキテクチャ（64ビットか32ビット）
論理CPUコア数：論理コアは、単一コアで複数作業の同時実行を可能とします。論理コア数を把握すれば、パフォーマンスとエネルギー消費のバランスを適正化できます。
搭載メモリ（MB）：サーバーに搭載の総RAMサイズを表します。
プロセッサータイプ：プロセッサーの製造者、ベンダー名、処理速度が表示されます。

システム統計では、次の情報が分かります。

ログイン件数：サーバーへのログインユーザー数です。
総プロセス：サーバーで実行しているプロセスの総数。停止中、起動中、動作中のステータスは不問です。
実行プロセス数：サーバーで実行しているプロセスの総数。
起動時刻：サーバーの起動時間です。

CPUやメモリ消費で見たTopプロセス

サーバーで実行されているTopプロセスのリストを表示することもできます。トグルボタンで、メモリごとかCPUごとかの表示切り替えができます。

アプリケーション情報

サーバーで動作している、Dockerなどのアプリケーションは、Linuxエージェントが自動検出し、ここに表示されます。サーバーで実行中のプロセスにもとづきエージェントは該当するプラグインを選択、推奨プラグインで表示して、監視を容易なものにします。

ダウン・トラブル履歴

サーバーのステータス（ダウンやトラブル）、その継続時間、詳細情報、根本原因分析 (RCA)は表形式で提示されます。

プロセス

Linuxサーバーで動作しているプロセスの監視を始めます。Linuxサーバーで稼働中のプロセスが見つからない場合は、プロセスのディスカバリを利用し、マニュアルで追加してください。

詳細は、プロセス監視で実行できるメトリックとアクションの見つけ方を参照ください。

プロセスごとのしきい値は、下記のように、セットできます。プロセスごとしきい値の編集詳細はこちらです。

ネットワーク統計

ネットワーク統計では、次の情報を表示します。

入出力トラフィック：インターネットやラップトップ・PCから、インターフェースへのトラフィックを、入力トラフィックと呼びます。トラフィックがインターフェースから、インターネットやラップトップ・PCに出て行く場合は、出力トラフィックと呼びます。
帯域利用状況：拠点、ユーザー、インターネットの間での、トラフィックレベルや、転送データ量が分かります。
ネットワークインターフェースカードの速度
送信データ
受信データ
パケット送信数
パケット受信数

入出力トラフィックアイコンのそれぞれをクリックすると、属性レポートを作成できます。次の追加メトリックをレポートから算出可能です。

入出力トラフィック：送受信パケットと、その平均をグラフ表示します。
帯域利用状況：入出力トラフィックと、送受信平均データをグラフ表示します（Kbps）。
エラーパケット：エラーパケット、その平均超過時間、廃棄パケットを示します。

追加したネットワークインターフェースに、個別しきい値をセットすることも可能です。

プラグイン：

プラグインを利用すれば、ニーズにあわせ、監視データをテーラーメイドにできます。

50以上のプラグイン連携：

Site24x7の50以上のプラグイン連携を利用すれば、MySQL、Redis、MongoDB、nginx、HAProxy、ZooKeeper、WordPress、Apache、ゾンビプロセスなどを含め、インフラ全体を把握できます。さらに、当社はNagiosをサポートしており、あらゆるNagiosプラグインがSite24x7で実行可能で、オープンソースコミュニティ(英語)の活力を共有できます。

カスタムプラグイン

Site24x7のオープンなエコシステムでは、カスタムプラグインをPythonやShellスクリプトで作成でき、必要データを、希望の方法で監視できます。

パフォーマンスメトリック

パラメーター	説明
ステータス	プラグインが利用可能な状態か、ダウンしているかを示します。
バージョン	これは必須項目で、プラグインのバージョン番号を表します。ユーザーが、属性を追加・修正・削除するには、プラグインバージョンを変更してから、新規テンプレートを作成してください。プラグインのバージョン変更が必要となるケースも確認ください。
テンプレート名	監視する属性リストを掌握する、プラグインテンプレートに、名前をつけてください。テンプレート設定方法は、プラグインテンプレートを参照ください。
属性	当該プラグインにリストアップされた属性の総数をさします。
パフォーマンス分析	プラグインテンプレートの設定の間に、ここにリストアップする属性を決めてください。詳細はこちらです。
アクション	プラグイン監視の編集・削除ができます。

インベントリ

インストール・削除のステータスや、発生しうるエラーメッセージを知れば、アカウントに追加したプラグインごとのトラブルシュート方法が分かります。この情報は、プラグインのフォルダー構造に変更があった場合のみ更新されます。

プラグインの再登録を利用すれば、サーバーに追加したプラグインのリロードが可能です。それぞれのプラグインからのメッセージにもとづき、次の作業のアクションを呼び出し、次の手順へ進んでください。

推奨プラグイン

サーバーで稼働中のプロセスにもとづき、エージェントは該当するプラグインを選択、ここへのリストアップによって、プラグイン監視をアカウントに容易に追加できるようにします。

リソース確認：

ファイル、ディレクトリ、syslogなど、Linuxサーバー上のリソースを監視します。監視リソースをチェックとして追加し、ことなるチェックをグループにまとめて、リソースチェックプロファイルを作成することが可能。1つのリソースチェックプロファイルを、複数のサーバー監視に関連付けることもできます。

Linuxサーバー監視でサポートするチェック：

詳細はこちら。

syslog

Linux syslogでは、十分な量のデータを、グラフにします。情報には、障害、パフォーマンス低下、セキュリティ侵害が含まれます。プログラムメッセージのログとプロセス重要度の詳細メトリックは、外挿法でsyslogグラフから算出できます。

ユーザーは、キーワードを指定し、syslogでの出現状況を確認できます。ログは、IDと送信元でフィルターし、予期せぬ挙動があれば、即時アラートできます。

サーバーツール

各種アクションの管理、タスクの実行を、サーバーツール1つで、すべて容易に実行できます。

プロセスビューワー

プロセスは、画面トップの検索バーから検索可能です。プロセスにマウスカーソルをあてると、次の項目を表示します。

プロセス識別子（PID）
実行パス
引数

カスタムタブの追加

必要なパフォーマンスメトリックを、望みの方法で、監視・分析できます。このビューは、各ユーザーアカウントで、すべてのサーバー監視のタブとして利用できます。

カスタムビューの追加手順：

カスタムタブの追加ボタンをクリック。
特定に使える表示名を指定してください。
この画面から、表示・監視するメトリックを選択します。
変更を保存してください。
追加情報へ移動すると、カスタムダッシュボードが表示されます。
クリックすると、ダッシュボードに表示されます。

カスタムビューの編集では、表示名の編集や、カスタムビューの削除ができます。

根本原因分析（RCA）：

障害検知のたびに、根本原因分析レポート（RCA）が起動し、連絡先と手段に応じて、ユーザーにアラートを送ります。作成されたLinuxサーバー監視のRCAは、接続の問題を分析するためのトレースルートマップとあわせ、障害の背後にある実際の理由を提示します。

ライセンス

Linuxサーバー監視1つで取得できるメトリックについて、詳細はこちらを参照ください。

Linuxサーバー監視の追加
一括インストールChef | Puppet | SaltStack | Ansible
サーバーメトリック：Windows | FreeBSD | OS X
サービスとプロセスの監視
60以上の標準プラグインサポート
設定テンプレートの作成
しきい値・可用性プロファイルの設定
サーバー監視のしくみ
リソースチェックのプロファイル作成
その他対応OS：FreeBSD | Windows | OS X
トラブルシュートのヒント

Linuxサーバー監視のパフォーマンス メトリック