SNMP/MRTG

  • 投稿日:
  • by
  • カテゴリ:

自宅のネットワークには、メインのサーバを中心に、NAS箱やら、何やら、色々ぶら下がっています。これらを、手抜き管理するために、様々なツール(単一の統合ツールの下に統合する方法も色々あるのですが、ばらばらと分散的に動いている方が安心できるワタシは、多分、古い人間。)を動かしているわけですが、そんな中の一つが、MRTG。SNMPを利用して、マシンのリソース利用状況などをビジュアル化してくれるツールです。

基本的に、大した仕事をしている訳ではない、NAS群は、定期的なバックアップなどのジョブに合わせて、ネットワークの利用や、CPUの使用率が上昇するのです。が、これが、時折乱れるのです。

先日は、NAS箱の一つに、リプル状のネットワーク使用率の変化が現れました。調べてみたら、NTPで、時間を合わせようとして失敗し続けていた様子。失敗の原因は、サーバを更新したときに、NTPの設定関係を直すのを忘れていたからでした。

問題のCPU使用率のグラフ

また、今日、CPUの使用率が100%になったままになっていました。調べると、バックアップ準備のために、不要となる古い世代のバックアップを削除するジョブが、何やら、刺さったようになっていて、CPUを食いつぶし続けていた上に、バックアップに失敗もしていたという、結構ヤバげな問題を生じていました。

こうして、モニタリングしていることで、間接的にマシンの挙動不審を見つけ、問題を早期に解決することができるのを、改めて実感し、その重要性を再確認しました。