アカウント名:
パスワード:
システムを納入したメーカーが書かれていないのでなんとも言えないが...某社の保守作業者がMirrorの二重障害を「起こした」例を知っている
再現手順:1.自然故障でHDD障害発生(たまにあるよね)2.正常な方のHDDを交換(???)3.急激にエラーレートが上がる(そりゃそうだ)4.二重障害でしたと報告(嘘つき)
その後、日中のHDD交換とrebuildが禁止になったとさ# ACでなきゃ書けないんだよ!
Disk二台逝くのってわりとあるから基幹業務にミラーは怖いね。
予算が無いからといって、ひたすら大量の中古格安サーバーをストライプだけで構成して、壊れたら諦めるという運用してた部署もあった。保守も入れず、壊れたサーバーが溜まったら使える部品で組み直して再生。部長さんが京都の始末屋さんでした。
同時故障って計算上の確率は低いですが実際の構築と運用次第では頻繁に起こりますからね。例えば同じ型番の同じロットのHDDを使い、同じように読み書きが発生するような(単純なミラーとか)場合大体同時期に壊れます
さらに故障によるrebuild時には通常よりもアクセスが集中するので, rebuild中に残っていたディスクも逝くってのは, ある程度常識的なものですよね.
ですから, あらかじめ余分なディスクを用意しておいて, 数カ月感覚で交換してディスクごとの稼働時間を明確にずらすなんてのも運用上の定石ですよね.
あと、rebuild中は生き残ったディスクの全領域を読みながら交換したディスクに書き込むので、普段めったにアクセスしない領域もアクセスすることになり、知らなきゃよかったようなエラーも見つかって(見つけて)しまう、ということも。
それは計算の仮定(HDDの故障は独立事象)がおかしいだけで計算自体に罪はないだろ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
コンピュータは旧約聖書の神に似ている、規則は多く、慈悲は無い -- Joseph Campbell
同時故障は怪しい (スコア:5, 興味深い)
システムを納入したメーカーが書かれていないのでなんとも言えないが...
某社の保守作業者がMirrorの二重障害を「起こした」例を知っている
再現手順:
1.自然故障でHDD障害発生(たまにあるよね)
2.正常な方のHDDを交換(???)
3.急激にエラーレートが上がる(そりゃそうだ)
4.二重障害でしたと報告(嘘つき)
その後、日中のHDD交換とrebuildが禁止になったとさ
# ACでなきゃ書けないんだよ!
Re: (スコア:2)
Disk二台逝くのってわりとあるから基幹業務にミラーは怖いね。
予算が無いからといって、ひたすら大量の中古格安サーバーをストライプだけで構成して、壊れたら諦めるという運用してた部署もあった。
保守も入れず、壊れたサーバーが溜まったら使える部品で組み直して再生。
部長さんが京都の始末屋さんでした。
Re:同時故障は怪しい (スコア:1)
同時故障って計算上の確率は低いですが実際の構築と運用次第では頻繁に起こりますからね。
例えば同じ型番の同じロットのHDDを使い、同じように読み書きが発生するような(単純なミラーとか)場合大体同時期に壊れます
Re:同時故障は怪しい (スコア:2)
さらに故障によるrebuild時には通常よりもアクセスが集中するので, rebuild中に残っていたディスクも逝くってのは, ある程度常識的なものですよね.
ですから, あらかじめ余分なディスクを用意しておいて, 数カ月感覚で交換してディスクごとの稼働時間を明確にずらすなんてのも運用上の定石ですよね.
Re: (スコア:0)
あと、rebuild中は生き残ったディスクの全領域を読みながら交換したディスクに書き込むので、
普段めったにアクセスしない領域もアクセスすることになり、知らなきゃよかったようなエラーも
見つかって(見つけて)しまう、ということも。
Re: (スコア:0)
それは計算の仮定(HDDの故障は独立事象)がおかしいだけで計算自体に罪はないだろ