Actions
機能 #340
open
NO
NO
あらゆるものを †監視† する
機能 #340:
あらゆるものを †監視† する
Start date:
05/19/2024
Due date:
% Done:
33%
一時中断:
Yes
pinned:
No
リマインド予定日:
前回確認日:
10/03/2024
管理外残件あり:
Description
部屋の環境を観測するために VPN に Prometheus サーバを立てたが、いろいろやらかした結果しっかりとサーバやアプリの監視をやっていかねばならんということになった。
†全てを監視する†。
NO Updated by nop_thread over 1 year ago
どうせなので新しい Prometheus サーバを立てるつもりでやっていく。
NO Updated by nop_thread over 1 year ago · Edited
集めたいものメモ:
- CoreDNS のメトリクス
-
metricsplugin で有効化済
-
- Proxmox VE の様子
- PVE 固有のものがあるかわからない。ホストに node_exporter を直接入れるのもそれはそれで若干の躊躇がある。
- かといって各種コンテナに node_exporter を重複して突っ込むのもどうなんだろう。 VM/CT ID とかの紐付けも面倒になるだろうし。
- AdGuard Home
- サードパーティの exporter しかないだろうか?
NO Updated by nop_thread over 1 year ago
ホストが生きたままアプリが死んでいることがちょくちょくあり (原因は様々だろうが)、メトリクス収集だけでなく外形監視の必要も感じている。
VPS とかに uptime-kuma か何かでも立てるか。
自動化に使いやすいものが良いが、調べる必要がありそう。
NO Updated by nop_thread over 1 year ago
- Subtask #345 added
NO Updated by nop_thread over 1 year ago
- Subtask deleted (
#345)
NO Updated by nop_thread over 1 year ago
- Subtask #346 added
NO Updated by nop_thread over 1 year ago
- Subtask #331 added
NO Updated by nop_thread over 1 year ago
- Subtask #343 added
NO Updated by nop_thread over 1 year ago
- Assignee set to nop_thread
NO Updated by nop_thread about 1 year ago
- Subtask #484 added
NO Updated by nop_thread about 1 year ago
- Status changed from 新規 to 進行中
- 一時中断 changed from No to Yes
- 前回確認日 set to 10/03/2024
状況:
- ログの扱い: 機能 #343: systemd-journald のログを各コンテナ内に溜めるのをやめる, 機能 #346: ログ集約サーバの整備
- 外形監視: #484
- Prometheus metrics の扱い: 個々の監視対象に応じてチケットを立てる
NO Updated by nop_thread about 1 year ago
- Subtask #550 added
NO Updated by nop_thread about 1 year ago
- Subtask #551 added
NO Updated by nop_thread about 1 year ago
https://mastodon.cardina1.red/@lo48576/113410804868071115
旧 Redmine インスタンスが死んでると思ったら、 /var/log/redmine/production.log が 704 MiB に達しており disk full になっていた。勘弁してくれ
コンテナの監視が必要!!!
NO Updated by nop_thread 10 months ago
メモ:
- Thanos store:
/-/healthy,/-/ready - CoreDNS:
/readyエンドポイントあり
Actions