操作
機能 #340
未完了あらゆるものを †監視† する
開始日:
2024/05/19
期日:
進捗率:
33%
一時中断:
はい
pinned:
いいえ
リマインド予定日:
前回確認日:
2024/10/03
管理外残件あり:
説明
部屋の環境を観測するために VPN に Prometheus サーバを立てたが、いろいろやらかした結果しっかりとサーバやアプリの監視をやっていかねばならんということになった。
†全てを監視する†。
操作
nop_thread さんが11ヶ月前に追加. 3ヶ月前に更新.
33%
説明
部屋の環境を観測するために VPN に Prometheus サーバを立てたが、いろいろやらかした結果しっかりとサーバやアプリの監視をやっていかねばならんということになった。
†全てを監視する†。
集めたいものメモ:
metrics
plugin で有効化済ホストが生きたままアプリが死んでいることがちょくちょくあり (原因は様々だろうが)、メトリクス収集だけでなく外形監視の必要も感じている。
VPS とかに uptime-kuma か何かでも立てるか。
自動化に使いやすいものが良いが、調べる必要がありそう。
状況:
https://mastodon.cardina1.red/@lo48576/113410804868071115
旧 Redmine インスタンスが死んでると思ったら、 /var/log/redmine/production.log が 704 MiB に達しており disk full になっていた。勘弁してくれ
コンテナの監視が必要!!!
メモ:
/-/healthy
, /-/ready
/ready
エンドポイントあり