機能 #1018
未完了機能 #340: あらゆるものを †監視† する
Zabbix による監視を試みる
0%
説明
今のところ Grafana に超不慣れだったり Prometheus の exporter が各サーバでポートを解放する必要があって絶妙にダルかったり (どうせ ansible で自動化してはいるが) などいろいろあり、全くといって良いほどサーバ監視ができていない。
加えて、 Prometheus の後ろで永続化を任せている Thanos から使っている MinIO のプロジェクト上流が現状アカン感じになっていることもあって、これを使い続けるにしても環境の見直しは必要になっている。
サーバのスペックには十分な余力があるので、敢えて pull 型の Promethus を使わなくても Zabbix とかで良いのではないかという気が若干してきているので、これを試したい。
(Zabbix でも push / pull どちらもできそうな雰囲気の話をどこかで読んだ気がするが、どうせどちらでも良いので調べるなら後で。)
NO nop_thread さんが約2ヶ月前に更新
- 親チケット を #340 にセット
NO nop_thread さんが約2ヶ月前に更新
- ステータス を 新規 から 進行中 に変更
- 前回確認日 を 2026/04/20 にセット
とりあえずサーバはインストールできた。
NO nop_thread さんが約2ヶ月前に更新
- 前回確認日 を 2026/04/20 から 2026/04/21 に変更
Zabbix では警告が扱いやすい (ダッシュボードに勝手に出てくる) のは良い。
まあこれは Zabbix と Grafana の違いというか、単に既成のテンプレートが Zabbix では豊富で助かっているというだけかもしれないが……。
NO nop_thread さんが約1ヶ月前に更新
- 優先度 を 通常 から 低め に変更
NO nop_thread さんが24日前に更新
- 優先度 を 低め から 低:暇なとき に変更
- 一時中断 を いいえ から はい に変更
NO nop_thread さんが約9時間前に更新
監視対象の追加を Zabbix の UI 上からやらないといけないのが面倒。
discovery 的なものもあったはずだが、使っていない。何故だったかな。
Prometheus の場合は scraper の設定を宣言的に管理できたうえ、とりあえず Thanos に溜めるだけ溜めておいて監視項目の選択は Grafana 側で後日設定するということができていた。
セットアップだけ ansible でさらっとやって済ませられるという点では Prometheus 系の方が楽そうな感じがする。
NO nop_thread さんが約9時間前に更新
- 前回確認日 を 2026/04/21 から 2026/06/12 に変更
nop_thread さんは #note-6 で書きました:
監視対象の追加を Zabbix の UI 上からやらないといけないのが面倒。
discovery 的なものもあったはずだが、使っていない。何故だったかな。
同種のサーバアプリを横スケールさせるタイプの運用ではなく、異なる構成のサーバを無数に立てるタイプの運用なので、利用すべきテンプレートがホスト毎に違って discovery があまりうまく使えなそうというのが理由のひとつだった気がする。
あとはサービス用の IP addr range が /16 とかなので、そんなデカい範囲をスキャンさせたくないというのもあったかもしれない。
まあ実用上は数百ホスト程度しかないので、割り当てるアドレスを下手に散らさないようにすれば実質的には /22 程度で済むかもしれないが……。