プロジェクト

全般

プロフィール

braindump #568

未完了

Ceph の運用を考える

nop_thread さんが4日前に追加. 4日前に更新.

ステータス:
新規
優先度:
低:暇なとき
担当者:
開始日:
期日:
進捗率:

0%

一時中断:
いいえ
pinned:
いいえ
確認予定日:
前回確認日:
管理外残件あり:

説明

いいかげんサーバクラスタ用の分散ストレージがほしいが、ヘビーに依存して壊れると面倒なので、運用コストが見合うか感覚をつかみたい。

nop_thread さんが4日前に更新

まずネットワークを飽和させないために専用のネットワークがあった方が良いらしい。
これは各サーバに SFP+ ×2 の NIC を積んでいるので問題ない。
現状だとサーバとスイッチ間を LACP で冗長化しているのはケーブルが抜けたり破損したときの備えでしかなく、帯域自体は 10Gbps で全然問題ない。

nop_thread さんが4日前に更新

微妙に OSD flags まわりの記述に差異があるが、とにかくシャットダウンに一手間かかりそうなのが面倒。

あと「クラスタを利用しているクライアントを全部止めろ」が最初に来ているのも地味に嫌かもしれない。
PVE 上のストレージを PVE 上のコンテナから使うのなら良いが、クラスタ外とかにクライアントを置くのは危険かもしれない。

nop_thread さんが4日前に更新 · 編集済み

どうにも挙動が怪しい?
詳しく読んでいないが、 2024-09 の話なのでかなり心配。

ドキュメントは 3839 – Documentation: Hyper-converged Ceph cluster shutdown and cold start によれば 2024-08-22 リリースの PVE 8.2.2 で更新されているが、実装についてはこれといって Ceph cluster のシャットダウン専用の何かは入っていない様子。

他の形式にエクスポート: Atom PDF