操作
機能 #331
完了機能 #340: あらゆるものを †監視† する
メトリクス監視のセットアップ
開始日:
2024/05/19
期日:
進捗率:
100%
一時中断:
いいえ
pinned:
いいえ
確認予定日:
前回確認日:
2024/05/26
管理外残件あり:
説明
今のところ VPS に立てた Prometheus と Thanos と Grafana で雑にやっているが、 chuable 上のコンテナ等も増えてきたのでいいかげん真面目に管理したい。
nop_thread さんが7ヶ月前に更新
Thanos 用の object storage として、まず 機能 #330: minio サーバのセットアップ をどうにかする必要がある。
nop_thread さんが6ヶ月前に更新 · 編集済み
- ステータス を 新規 から 進行中 に変更
- 前回確認日 を 2024/05/23 にセット
現状:
- オブジェクトストレージを立てた: #330
- Prometheus と Thanos を立てた: #345
- Grafana を (新規で) 立てた: #345
- DB は MariaDB なので SQLite のときのような変な苦労を抱えずスケールさせられるはず。
- CoreDNS, Navidrome, chima (#283, snmp-exporter 経由), PDU (tsumuri), Prometheus/Thanos 自身等の、一部機材やサービスのメトリクスを Prometheus から取得できている。
- ダッシュボードやアラートは未作成。
- alert manager 的な概念についてはそもそも知識がないので未着手。
nop_thread さんが6ヶ月前に更新 · 編集済み
情報を集められそうなデバイスやサービス (面倒そうなもの含む):
- MikroTik の ToR スイッチ (#373)
- Proxmox VE の各物理ノード (#374, #376)
- node-exporter でいけるか? PVE 専用のメトリクスは別途で何かありそうだが。
- toka と kanade の IPMI (#375)
- 両方とも Supermicro の M/B なので共通の exporter が使えそう。
- powermeter (完了: #note-13)
- NOP Thread / house-exporter · GitLab
- chelsea で雑に動かしている電力メーターの情報。 Bluetooth 系のものから隔離して exporter を動かすべきという気持ちはずっとある。
nop_thread さんが6ヶ月前に更新 · 編集済み
- 前回確認日 を 2024/05/23 から 2024/05/26 に変更
powermeter は Bluetooth 系のものから隔離して監視できるようにした。
(cf. Provide dedicated executables for each physical connection protocol (f66d5dc4) · コミット · NOP Thread / house-exporter · GitLab)
nop_thread さんが6ヶ月前に更新
- ステータス を 進行中 から 終了 に変更
ダッシュボード作成はぼちぼちやる。
alert 系はひとまず Grafana に任せておいて良いだろう。
exporter 系の残件は別チケットを立てた。
こちらは完了ということで閉じる。
操作