Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

SNMP による正常性の監視

正常性監視の概要

正常性監視は、RMON アラームのインフラストラクチャを拡張して、定義済みのオブジェクト セット(ファイル システムの使用率、CPU の使用率、メモリ使用率など)と Junos OS プロセスを監視する SNMP 機能です。

正常性監視機能を有効にするには、[edit snmp] 階層レベルで health-monitor ステートメントを使用します。また、下降しきい値、上昇しきい値、間隔などのヘルスモニターパラメーターを設定することもできます。監視対象のオブジェクトの値が上昇しきい値または下降しきい値を超えると、アラームがトリガーされ、イベントがログに記録される場合があります。

下降しきい値は、監視対象オブジェクトインスタンスの下限しきい値です。上昇しきい値は、監視対象オブジェクトインスタンスの上限しきい値です。各しきい値は、可能な最大値のパーセンテージとして表されます。間隔は、オブジェクト インスタンスがサンプリングされ、上昇しきい値と下降しきい値と比較される期間 (秒単位) を表します。

イベントは、各サンプル間隔の後ではなく、最初に一方向にしきい値を超えたときにのみ生成されます。たとえば、上昇しきい値アラームとそれに対応するイベントが発生した場合、対応する下限アラームが発生するまで、しきい値超過イベントは発生しません。

ヘルス・モニター・イベントのシステム・ログ・エントリーには、汎用の SNMPD_RMON_EVENTLOG タグではなく、対応する HEALTHMONITOR タグがあります。ただし、正常性監視は汎用の RMON 上昇しきい値トラップと落下しきい値トラップを送信します。show snmp health-monitor 操作コマンドを使用して、ヘルス モニターのアラームとログに関する情報を表示できます。

正常性監視を構成すると、表 1 に示すように特定のオブジェクト インスタンスの監視情報を利用できます。

表 1: 監視対象のオブジェクト インスタンス

オブジェクト

説明

jnxHrStoragePercentUsed.1

スイッチ上の /dev/ad0s1a: ファイルシステムを監視します。これは、/ にマウントされたルートファイルシステムです。

jnxHrStoragePercentUsed.2

スイッチ上の /dev/ad0s1e: ファイルシステムを監視します。これは、/config にマウントされた構成ファイル システムです。

jnxOperatingCPU (RE0)

ルーティング エンジン(RE0)による CPU 使用率を監視します。

jnxOperatingBuffer (RE0)

ルーティング エンジン(RE0)で使用可能なメモリの量を監視します。

sysApplElmtRunCPU

各 Junos OS プロセス (デーモンとも呼ばれる) の CPU 使用率を監視します。同じプロセスの複数のインスタンスを個別に監視して、インデックスを作成します。

sysApplElmtRunMemory

Junos OS の各プロセスのメモリ使用量を監視します。同じプロセスの複数のインスタンスを個別に監視して、インデックスを作成します。

Junos OSを搭載したデバイスでの正常性監視の設定

一般的なネットワーク管理システム(NMS)で管理されるデバイスの数が増え、デバイス自体の複雑さが増すにつれて、NMSがポーリングを使用してデバイスを監視することはますます非現実的になっています。よりスケーラブルなアプローチは、注意が必要なときにネットワークデバイスに依存してNMSに通知することです。

ジュニパーネットワークスのルーターでは、RMONアラームとイベントが、NMSからのポーリングオーバーヘッドを減らすために必要なインフラストラクチャの多くを提供しています。ただし、このアプローチでは、特定の MIB オブジェクトを RMON アラームに構成するように NMS を設定する必要があります。そのために、デバイスに特化した専門知識や、監視アプリケーションのカスタマイズが必要になることがよくあります。また、監視が必要な MIB オブジェクトのインスタンスには、初期化時のみ設定されるか、実行時に変更されるものがあり、事前に構成することはできません。

これらの問題に対処するため、ヘルスモニターでは、RMONアラームのインフラストラクチャを拡張して、選択したオブジェクトインスタンスセット(ファイルシステムの使用率、CPUの使用率、メモリ使用率)に対して事前に定義済みの監視を提供し、未知のオブジェクトまたは動的オブジェクトインスタンス(Junos OSプロセスなど)のサポートが含まれています。

正常性の監視は、ユーザーの構成要件を最小限に抑えるように設計されています。正常性監視エントリを構成するには、[edit snmp] 階層レベルで health-monitor ステートメントを含めます。

[edit snmp health-monitor]階層レベルで監視イベントを設定すると、システム全体の正常性に応じたポーリング間隔が設定されます。[edit snmp health-monitor idp]階層レベルで同じオプションを設定した場合、侵入検出および防止(IDP)システムによって使用されるデータプレーンメモリの割合が設定値を上回ったり下回ったりすると、デバイスによってSNMPイベントが生成されます。

show snmp health-monitor 操作コマンドを使用して、ヘルス モニターのアラームとログに関する情報を表示できます。

このトピックでは、最低限必要な設定について説明し、正常性監視を設定するための次のタスクについて説明します。

監視対象のオブジェクト

正常性監視を構成すると、表 2 に示すように特定のオブジェクト インスタンスの監視情報を利用できます。

表 2: 監視対象のオブジェクト インスタンス

オブジェクト

説明

jnxHrStoragePercentUsed.1

ルーターやスイッチで、以下のファイルシステムを監視します。

/dev/ad0s1a:

これは、/ にマウントされたルートファイルシステムです。

jnxHrStoragePercentUsed.2

ルーターやスイッチで、以下のファイルシステムを監視します。

/dev/ad0s1e:

これは、/config にマウントされた構成ファイル システムです。

jnxOperatingCPU (RE0)

ルーティング エンジン(RE0 および RE1)の CPU 使用率を監視します。ルーティング エンジンに割り当てられるインデックス値は、シャーシ MIB がゼロベースまたは 1 ベースのどちらのインデックス方式を採用しているかによって異なります。インデックス方式は構成可能であるため、ルーターまたはスイッチが初期化されたとき、および構成が変更されたときに、適切なインデックスが決定されます。ルーターまたはスイッチにルーティング エンジンが 1 つしかない場合、CPU 値の取得に 5 回失敗すると、アラーム エントリー監視 RE1 が削除されます。

jnxOperatingCPU (RE1)

jnxOperatingBuffer (RE0)

ルーティング エンジン(RE0 および RE1)で使用可能なメモリの量を監視します。このオブジェクトのインデックスは jnxOperatingCPUに使用されるものと同じであるため、インデックス値はシャーシMIBで使用されているインデックス方式に応じて調整されます。jnxOperatingCPUと同様に、ルーターまたはスイッチにルーティング エンジンが 1 つしかない場合、アラーム エントリー監視RE1は削除されます。

jnxOperatingBuffer (RE1)

sysApplElmtRunCPU

各 Junos OS プロセス (デーモンとも呼ばれる) の CPU 使用率を監視します。同じプロセスの複数のインスタンスを個別に監視して、インデックスを作成します。

sysApplElmtRunMemory

Junos OS の各プロセスのメモリ使用量を監視します。同じプロセスの複数のインスタンスを個別に監視して、インデックスを作成します。

正常性監視の最小構成

ルーターまたはスイッチで正常性監視を有効にするには、[edit snmp] 階層レベルで health-monitor ステートメントを含めます。

下降しきい値または上昇しきい値を設定する

下降しきい値は、監視対象変数の下限しきい値(可能な最大値のパーセンテージとして表されます)です。現在のサンプリング値がこのしきい値以下で、最後のサンプリング間隔の値がこのしきい値より大きい場合、1 つのイベントが生成されます。このエントリが有効になった後の最初のサンプルがこのしきい値以下の場合も、1 つのイベントが生成されます。下降イベントが生成された後、サンプリングされた値がこのしきい値を超えて上昇しきい値に達するまで、別の下降イベントは生成できません。下限しきい値は、可能な最大値に対するパーセンテージで指定する必要があります。デフォルトは 70 % です。

デフォルトでは、上昇しきい値は、監視対象オブジェクトインスタンスで可能な最大値の 80 %です。上昇しきい値は、監視対象変数の上限しきい値です。現在のサンプリング値がこのしきい値以上で、最後のサンプリング間隔の値がこのしきい値未満の場合、1 つのイベントが生成されます。このエントリが有効になった後の最初のサンプルがこのしきい値以上の場合にも、1 つのイベントが生成されます。上昇イベントが生成された後、サンプリングされた値がこのしきい値を下回り、下降しきい値に達するまで、別の上昇イベントは生成できません。上昇しきい値は、モニター対象変数の最大値のパーセンテージとして指定する必要があります。

下降しきい値または上昇しきい値を設定するには、[edit snmp health-monitor]階層レベルで falling-threshold または rising-threshold ステートメントを含めます。

percentage は、 1 から 100 までの値を指定できます。

下降しきい値と上昇しきい値は、ヘルスモニターによって監視されるすべてのオブジェクトインスタンスに適用されます。

間隔を設定する

間隔は、オブジェクト インスタンスがサンプリングされ、上昇しきい値と下降しきい値と比較される期間 (秒単位) を表します。

間隔を設定するには、 interval ステートメントを含め、 [edit snmp health-monitor] 階層レベルで秒数を指定します。

seconds は、 1 から 2147483647 までの値を指定できます。デフォルトは 300 秒 (5 分) です。

ログエントリとトラップ

正常性監視イベント(しきい値を超えた、エラーなど)に対して生成されるシステムログのエントリには、汎用の SNMPD_RMON_EVENTLOG タグではなく、対応する HEALTHMONITOR タグが付けられます。ただし、正常性監視は汎用の RMON risingThresholdfallingThreshold トラップを送信します。

正常性監視を構成する

このトピックでは、QFX シリーズ デバイスのヘルス モニター機能を設定する方法について説明します。

正常性監視機能は、SNMP RMON アラームのインフラストラクチャを拡張して、選択したオブジェクト インスタンス(ファイル システムの使用率、CPU の使用率、メモリ使用率など)と動的オブジェクト インスタンス(Junos OS プロセスなど)のセットに対して、事前に定義済みの監視を提供します。

この手順では、サンプリング間隔は 600 秒 (10 分) ごとで、下降しきい値は監視対象の各オブジェクト インスタンスで可能な最大値の 85 % であり、上昇しきい値は監視対象の各オブジェクト インスタンスで可能な最大値の 75 % です。

正常性の監視を構成するには:

  1. 正常性監視を設定します。
  2. 下限しきい値を設定します。

    たとえば、以下のように表示されます。

  3. 上昇しきい値を設定します。

    たとえば、以下のように表示されます。

  4. 間隔を構成します。

    たとえば、以下のように表示されます。