QUICKGUARD ホームページ >

マリコ、もがく。―監視項目ってなぜ複数必要なの―

2022.05.13

あっと言う間にもう5月、町行く新社会人の皆様の顔つきが少しずつ精悍になっていくのを感じます。
こんにちは、マリコです。

第19回目のテーマは『監視の必要性』です。

監視:
各種サーバによって提供されるサービスの安定稼働のため設定されている。
死活監視、サービス監視、リソース監視、プロセス監視など、多様な監視項目が存在する。

想起

先日、弊社のスーパーエンジニアである権田原 ”パー子” 夢子さんが書いたQG Tech Blog 「URL監視の始め方 – 押さえておきたいポイントと選び方の指針」を読み返している中で、ふと、ある古い記憶が蘇ってきました。
それはマリコがまだクイックガードに入社してすぐの頃、IT業界の右も左も分からなかった頃のもがきの記憶。
新人研修が終わった今頃の時期、きっと当時のマリコと同じような内容でもがいている人がいるかもしれない!
ということで今回は「そういえばマリコが入社当時、疑問に思っていたなー」というポイントを書きたいと思います。

素人の疑問

仮に「この社内ブログがちゃんと見れているか監視したい」という場合です。
弊社はMSPやってる会社ですからね、当然おまかせあれと色々と監視を行うわけですよ。たとえば、「死活監視」「サービス監視」「リソース監視」「システム監視」「ログ監視」and more.
個々の監視についての説明はおいおい理解していくとして…

(入社当時マリコ)これ、なんでこんなにたくさん監視する必要があるの?

いやだって、考えてみてください。例えば「URL監視」や「httpdプロセス監視」という二つの項目。

URL監視は読んで字のごとく、https://blog.quickguard.net/ という固定のURLに対し、監視サーバからのレスポンス状況を確認する外形監視です。

そしてhttpdプロセス監視と言うのは、これまた読んで字のごとく対象のWebサイトを提供しているWEBサーバの中のhttpdプロセスが正しく動いているか確認する内部監視です。

入社当時、マリコは「空っぽのサーバをWEBサーバにしてくれるのはApacheやnginxといったソフトウェアだ」ということを学びました。(マリコがもがくブログ第2回「マリコ、もがく。-サーバ、って何よ?-」より)
そしてhttpdはApacheのプロセス(プログラム)であるということを学んだわけです。つまりhttpdプロセスが正しく動いていなければ(=httpdプロセス監視にひっかかる)、WEBサーバとして機能していないってことなので、対象サイトも見れなくなりますよね?(=URL監視にひっかかる)

(入社当時マリコ)もうURL監視だけで良くない?

CPUやMemoryなどのリソース監視だってそうです。多少足りなくなっても結果的にWebサイト見えてるなら個別で監視しなくてもよくない?…と。

気付き

そんなマリコがどうして「色々監視するってめちゃ大事じゃん!」となったかと言いますと…いったん「Webサイトが見えない」という障害を、現実世界での「目的のお店に辿り着けない」という問題に置き換えて考えてみたのです。

・そもそもお店がオープンしていない
・お店の入り口が開いていない
・店舗運営上で必要設備が機能していない
・店員さんの人数や在庫など必要リソースが足りない
・何か店内でトラブル発生
・お店の本来の住所とは違う住所登録がされているため辿りつけない
・お店に行くまで公共交通機関が麻痺している

などなど様々な原因が考えられますよね。
そして原因が分かってから「入口を開けてあげる」とか「在庫を追加発注する」などの対応をするわけです。
はい、賢明な皆様ならお気付きですよね?これはWebサイトが正しく表示されなくなる(URL監視にひっかかる)場合でも同じなんです!!

・そもそもサーバが動いていない(Ping監視)
・80番ポートや443番ポートが正しく機能していない(ポート監視)
・httpdプロセスが正常に動いていない(プロセス監視)
・CPUやメモリーなどの負荷が高く、サーバの処理が追い付かない(リソース監視)
・何か処理場のエラーが起きている(ログ監視)
・DNSが別のサーバを向いてしまっている
・ネットワーク障害

などなど、結果は同じ「Webサイトが正しく表示されない」という現象であっても、その原因はさまざまなのです。そして原因が違えばもちろん対策が変わってくる。
障害発生時、「いかに早く原因究明を行い」「いかに早く復旧させるか」が肝であり、その原因の切り分けとして複数の監視項目を適切に設定してあげる必要があったのです。
(※リソース監視などサーバの負荷傾向を見ることで障害を予防するためでもありますよね)
気づいてみればとっても当たり前なんですが、当時のマリコにはこの当たり前が分かっていなかった。お恥ずかしい限りです。

聞くは一時の恥、聞かぬは一生の恥

今回は権田原 ”パー子” 夢子さんの記事を読んだことから思い出されたマリコの記憶を元に、素朴すぎる疑問、「複数監視の必要性」についてマリコなりの理解を書いてみました。
「こんな監視項目があるんだな」という知識以前の「そもそもなんで監視する必要があるの」という疑問。
この辺りって、理解しているのが当たり前っぽい雰囲気を勝手に感じてしまって、聞くに聞けないまましばらくモヤモヤしてた記憶があります。もったいない時間でしたね。

素人なら素人らしく、堂々と質問していけば良かった。

もし読者の中に、新しい環境で「こんなこと聞いたら恥ずかしいかな」と靄ついている方がいらっしゃったら、是非とも申し上げたい。

大丈夫です、聞きましょう!「聞くは一時の恥、聞かぬは一生の恥」と言いますし、正直、素人なんだから疑問を抱くことは恥ですらないです!

ということで、これからもマリコは小さな疑問を大事にしながらもがいていこうと思います。