ZABICOMの設定方法 - サーバー監視編

Zabbixエージェントによるログ監視
ZABICOMは、テキスト形式のログ・ファイルとWindowsのイベント・ログを収集できます。ログ監視においては、障害監視としてerrorなど文字列の検知による障害の判定が可能です。複数のログを時系列順に並べて表示するなど、ログ解析を支援する機能も備えています。
ログ・メッセージを収集するアイテム設定のやり方を解説します。
| /var/log/ messages | |
|---|---|
| タイプ | Zabbixエージェント(アクティブ) | 
| キー | log[/var/log/ messages,,EUC-JP,] | 
| データ型 | ログ | 
| 更新間隔 | 1 | 
ログ監視を行う場合、アイテム・タイプは必ず[Zabbixエージェント(アクティブ)]を選択します。[Zabbixエージェント]ではログ・メッセージを収集できません。
アイテム・キーの第3引数は、文字コードを指定します。この場合は、EUC-JPを指定しています。
この例では、logというアイテムを使っています。ただし、logでは、収集間隔の間にログ・ローテーションが発生した場合、ログを取りこぼすことがあります。このため、更新間隔を最短の1(秒)とすることで、取りこぼしを最小にしています。
一方、logの代わりに、ZABICOM1.8から新たに追加されたlogrtというアイテム・キーを使うと、ログ・ローテーションが発生した場合でも、ログ・メッセージを取りこぼさずに監視できます。
logrtを使う際には、ローテーション後のログを含めたすべての対象ログ・ファイルをzabbixユーザーが読めるよう、パーミッションの設定が必要です。また、ログ・ローテーションの際にファイルを圧縮して保管するログ・ファイルでは、logrtを使うことができません。
| Windowsイベント・ログ [システム] | |
|---|---|
| タイプ | Zabbixエージェント(アクティブ) | 
| キー | eventlog[system] | 
| データ型 | ログ | 
| 更新間隔 | 1 | 
イベント・ログを監視する場合は、eventlogというアイテム・キーを使います。ZABICOM 1.8から文字コードは自動判別するようになったので、文字コードの指定はありません。
ログ監視やイベント・ログ監視では、大量のログを受信する場合があります。このような場合、監視帯域やZABICOMサーバーのデータ領域を圧迫しないように、アイテム・キーの引数の中で文言や重要度などを指定し、エージェント・サイドでフィルタリングすることができます。アイテム・キーの引数の詳細は、第2回で紹介したアイテム・キー・リストを参考にしてください。
フィルタリング時には、単純な文字列パターンのほか、正規表現マクロを用いてフィルタリングすることも可能です。
サービス・プロセス監視
ネットワーク・サービスを提供しているサーバーでは、サービス・プロセスが起動しているかどうか、サービスに接続可能かどうか、がとても重要です。ZABICOMは、エージェントを用いてサーバー内部からプロセスを監視したり、外部からサービス・ポートの応答確認を行ったりすることで、サービスの提供状態を総合的に監視できます。
以下では、実際のWebサーバーを想定し、サービスの稼働状態を確認するアイテムの設定方法を解説します。
| httpdプロセス数 | |
|---|---|
| タイプ | Zabbixエージェント | 
| キー | proc.num[httpd] | 
| データ型 | 数値(整数) | 
この設定例では、httpdのプロセス数を集計します。
アイテム・キーproc.numでは、第1引数または第4引数でプロセスを指定します。 第1引数にはプロセス名を設定します。Linuxサーバーの場合、プロセス名には、以下のコマンドの実行結果(COMMAND列に表示される文字列)を指定できます。
#ps -A
第4引数では、起動オプションやディレクトリなどを含んだ文字列を指定できます。起動オプションが異なるプロセスを別々に監視したい場合などに使います。集計対象となる文字列は、以下のコマンドの実行結果(COMMAND列に表示される文字列)を指定できます。
#ps aux
| IIS Webサービスの監視 | |
|---|---|
| タイプ | Zabbixエージェント | 
| キー | service_state[W3SVC] | 
| データ型 | 数値(整数) | 
| 値のマッピングの使用 | Windows サービス・ステータス | 
Windowsのサービスの場合は、アイテム・キーservice_stateを使います。Windowsの内部で定義されている、サービスの状態を表す整数を、サービス・ステータスとして取得できます。サービス・ステータスの値の意味は、次の通りです。
| Windows サービス・ステータス | |
|---|---|
| 0 | 開始 | 
| 1 | 一時停止 | 
| 3 | 一時停止中 | 
| 4 | 再開中 | 
| 5 | 停止中 | 
| 6 | 停止 | 
| 7 | 不明 | 
| 255 | サービスが見つかりません | 
サーバー内部でプロセスやサービスを監視するとともに、サービス・ポート監視によって外部からWebサービスにアクセス可能かどうかを確認します。
ポート監視を行うアイテムを作成します。
| Webポート監視 | |
|---|---|
| タイプ | シンプルチェック | 
| キー | http,80 | 
| データ型 | 整数 | 
httpを使ってポートを監視する場合、アイテム・キーにhttpを使います。httpのほかにも、SMTPやPOPなど多くのプロトコルを使って監視できます。
| ポート監視の結果 | |
|---|---|
| 0 | Down | 
| 1 | Up | 
| 2 | タイム・アウト | 
アイテム・タイプ[シンプルチェック]によるポート監視は、ZABICOMサーバーから監視対象サーバーに対して直接行われます。ほかにも、監視対象内のZabbixエージェントから任意のサーバーに対するポート監視を行うこともできるので、複数のアクセス経路による監視も可能です。
判定のための値を取得できました。続けて、障害を実際に検知するためのトリガーの設定方法を解説します。
 
  










