QUICKGUARD ホームページ >

サービスチェックのスケジュール問題

2014.06.18

Nagiosのちょっと困った話

Nagios3.4.1という古いバージョンを触る機会があり、その際にちょっとした
バグっぽい動作があり、検証を取ってみましたが、WEB上にも情報がなく手を
焼いています。実際にどんな動作で困っているかというと、サービスチェック
のスケジュールが重複するという問題です。

Nagiosは基本的にすべての内部イベント(サービスチェックや外部コマンドチェック等)はイベントキューに溜まっていきます。イベントキューには実行される時間が設定されており、基本的にその時間に実行しようとします。たまに処理遅延などはありますが・・・。

しかし、Nagiosの機能である手動サービス再試行を実行した場合、本来のサービスチェックのイベントキュー以外に手動サービス再試行の分のイベントキューも追加されて、サービスチェックの回数が2回に増えるのです。もちろん、再度手動サービス再試行を実行した場合には、3回に増えるという状況です。

チェック回数が本来5分に1回なのに、知らない間に5分に2回、3回とチェックにいくという問題が、このバージョンのNagiosには内包されています。