Project

General

Profile

Actions

機能 #340

open
NO NO

あらゆるものを †監視† する

機能 #340: あらゆるものを †監視† する

Added by nop_thread over 1 year ago. Updated 10 months ago.

Status:
進行中
Priority:
低め
Assignee:
Start date:
05/19/2024
Due date:
% Done:

33%

一時中断:
Yes
pinned:
No
リマインド予定日:
前回確認日:
10/03/2024
管理外残件あり:

Description

部屋の環境を観測するために VPN に Prometheus サーバを立てたが、いろいろやらかした結果しっかりとサーバやアプリの監視をやっていかねばならんということになった。
†全てを監視する†。


Subtasks 7 (4 open3 closed)

機能 #331: メトリクス監視のセットアップ終了nop_thread05/19/2024

Actions
機能 #345: Prometheus と Thanos のサーバを立てる終了nop_thread05/19/2024

Actions
機能 #343: systemd-journald のログを各コンテナ内に溜めるのをやめる新規nop_thread

Actions
機能 #346: ログ集約サーバの整備新規nop_thread

Actions
機能 #484: 外形監視のセットアップ待機中nop_thread

Actions
機能 #550: Rails アプリのログを systemd-journald に流す終了nop_thread11/02/2024

Actions
機能 #551: Apache2 のログを systemd-journald に流す待機中nop_thread

Actions

NO Updated by nop_thread over 1 year ago Actions #1

どうせなので新しい Prometheus サーバを立てるつもりでやっていく。

NO Updated by nop_thread over 1 year ago · Edited Actions #2

集めたいものメモ:

  • CoreDNS のメトリクス
  • Proxmox VE の様子
    • PVE 固有のものがあるかわからない。ホストに node_exporter を直接入れるのもそれはそれで若干の躊躇がある。
    • かといって各種コンテナに node_exporter を重複して突っ込むのもどうなんだろう。 VM/CT ID とかの紐付けも面倒になるだろうし。
  • AdGuard Home
    • サードパーティの exporter しかないだろうか?

NO Updated by nop_thread over 1 year ago Actions #3

ホストが生きたままアプリが死んでいることがちょくちょくあり (原因は様々だろうが)、メトリクス収集だけでなく外形監視の必要も感じている。
VPS とかに uptime-kuma か何かでも立てるか。
自動化に使いやすいものが良いが、調べる必要がありそう。

NO Updated by nop_thread over 1 year ago Actions #4

  • Subtask #345 added

NO Updated by nop_thread over 1 year ago Actions #5

  • Subtask deleted (#345)

NO Updated by nop_thread over 1 year ago Actions #6

  • Subtask #346 added

NO Updated by nop_thread over 1 year ago Actions #7

  • Subtask #331 added

NO Updated by nop_thread over 1 year ago Actions #8

  • Subtask #343 added

NO Updated by nop_thread over 1 year ago Actions #9

  • Assignee set to nop_thread

NO Updated by nop_thread about 1 year ago Actions #10

  • Subtask #484 added

NO Updated by nop_thread about 1 year ago Actions #11

  • Status changed from 新規 to 進行中
  • 一時中断 changed from No to Yes
  • 前回確認日 set to 10/03/2024

状況:

NO Updated by nop_thread about 1 year ago Actions #12

  • Subtask #550 added

NO Updated by nop_thread about 1 year ago Actions #13

  • Subtask #551 added

NO Updated by nop_thread about 1 year ago Actions #14

https://mastodon.cardina1.red/@lo48576/113410804868071115

旧 Redmine インスタンスが死んでると思ったら、 /var/log/redmine/production.log が 704 MiB に達しており disk full になっていた。勘弁してくれ

コンテナの監視が必要!!!

NO Updated by nop_thread 10 months ago Actions #15

メモ:

Actions

Also available in: PDF Atom