操作
日記 #1024
完了
NO
NO
日記 #958: 2026年
2026-W17
日記 #1024:
2026-W17
ステータス:
終了
担当者:
開始日:
2026/04/20
pinned:
いいえ
リマインド予定日:
前回確認日:
2026/04/26
操作
日記 #958: 2026年
nop_thread さんが2ヶ月前に追加. 約2ヶ月前に更新.
#1018 で Zabbix を試し始めた。
セットアップそのものについては Prometheus + Thanos の方が好みかも。
宣言的にテキストで監視設定を書いてデプロイが一発で終わる Prometheus は楽。
ただし Prometheus には snmp まわりでヒジョーーーーーーーに苦労させられたので、それが Zabbix でどうなっているかは気になるところ。
これは Grafana で interval の異なるデータソースを組み合わせるとき面倒があるという事情も込みでのダルさなので (そうでなければ timeout しない程度に interval を伸ばせば済む話だった)、 Zabbix では単にその辺り1分おきとかで幅が伸びているから気にならないだけの可能性もある。
(とはいえ既に Zabbix 側で snmp のために timeout をデフォルトの3秒から6秒へと延ばしており、トラブルの気配は見え始めている。)
ダッシュボードと警告部分については Zabbix もなかなか悪くない。
まだ全然使えていないが、複数の監視対象をまとめた大きな単位での監視とか Redmine 連携とかいろいろ機能がありそうなので、まだ見るべきところは多そう。
Grafana も可視化だけでいえば割と良かったのではと思うところはありつつ、 PromQL を全然使いこなせていなかったりグラフでない見せ方 (それこそイベントログとか) をよくわかっていなかったりなど、使い方の面でいろいろ最適でない点は多かったので、ちゃんと比較するなら両方とももう少し真面目に使い込むべきなのかもしれない。
とはいえ、 Zabbix 系と Prometheus + Grafana 系のダブルメンテにするのもなぁ。
どうせ ansible でシュッとやるだけなので大したコストではないといえばそうなのだが。