アカウント名:
パスワード:
つい先日もNTTデータのブログサービスでHDD障害が発生 [srad.jp]したりと,RAIDを組んでいるにもかかわらず復旧できないといったことが多くみられますが,RAIDの信頼性(ストライピングを除いて)はいったいどれくらいなものなのでしょうか?RAID構成なら復旧できて当たり前なので,こういう「事件」だけが表に出てくるのかもしれませんが….
個人的な経験の範囲では、RAID 5 は大きくなるとヤバい感じがします。たとえば 24 個の HDD で組んだ RAID 5 で、HDD が全部同じロットだったばあい、24 個中の 1 個がコケて交換、リビルドしてる間に、残りの 23 個のうちのどれかが死亡、そして RAID 全体が死亡という泣けてくる事態は容易に想像がつきます。ていうか実体験です。へたってきたディスクが 23 個もあって、リビルドみたいな高負荷がかかれば、まぁ 1 個くらい死んでも不思議はない、と思います。
いろんなカラミで RAID 5 にせざるを得なかったのですが、素直にミラーリングとかにしとけばよかったです。
ミラーリングってRAID1って意味じゃなくて、差分バックアップを定期的に取り続けるって意味ですよね?
RAID1ってマスターのファイルがごっそり削除されたら、ミラーの方も一緒に消えちゃうんじゃないか?と前から心配だったんで…
心配も何も、それはそもそもRAIDで何とかなる話ではありません。RAIDはあくまでハードウェアエラーに対応できるだけの機構です。
個人でWin2k、シリコンイメージ(ソフトRAID5のやつ)使ってます。250GB×4の構成で750GB、こんな程度で良かったら参考までに。
1年ぐらい利用していて、ある日、起動時にユーティリティでエラーが上がるようになりました。なにぶん、個人利用なので常に代わりを用意しているわけではなかったのですが、
・何回かの起動に1度、特定のHDDのエラーが起きる。・HDDアクセス頻度が普段と違う。・RAID5は2台壊れたらもうダメぽ。
なので、速攻で買って交換しました。おかげでエラーも出なくなり、そのHDDが壊れてることが立証できました。
ただ、ユーティリティの助けがあったものの、決定打はHDDアクセス頻度であって、ある程度の経験が無ければやはりデータを飛ばしていたと思います。
もしサーバ室内のサーバだったら多分気づかなかったでしょう。RAID5を運用するのだったら、ユーティリティの重要性が高いと思います。それと、出来る限りミラーリングで・・・かな。
レアケースかもしれませんが、こんなことがありました。
RAID 1 で一方の HDD に障害発生 -> RAID コントローラのバグ(故障?) でアラート上がらず -> 気付かずに運用 -> もう一方も障害発生。
RAID コントローラに問題があったら正直どうしようもないですね。バックアップが取れていたから良かった様なものの。
バックアップ・ウィンドウとコストの関係でバックアップせず RAID のみ、みたいなシステムもありそう。絶対運用担当になりたくない・・・。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ナニゲにアレゲなのは、ナニゲなアレゲ -- アレゲ研究家
RAIDの信頼性 (スコア:1)
つい先日もNTTデータのブログサービスでHDD障害が発生 [srad.jp]したりと,RAIDを組んでいるにもかかわらず復旧できないといったことが多くみられますが,
RAIDの信頼性(ストライピングを除いて)はいったいどれくらいなものなのでしょうか?
RAID構成なら復旧できて当たり前なので,こういう「事件」だけが表に出てくるのかもしれませんが….
Re:RAIDの信頼性 (スコア:3, 参考になる)
個人的な経験の範囲では、RAID 5 は大きくなるとヤバい感じがします。
たとえば 24 個の HDD で組んだ RAID 5 で、HDD が全部同じロットだったばあい、24 個中の 1 個がコケて交換、リビルドしてる間に、残りの 23 個のうちのどれかが死亡、そして RAID 全体が死亡という泣けてくる事態は容易に想像がつきます。ていうか実体験です。へたってきたディスクが 23 個もあって、リビルドみたいな高負荷がかかれば、まぁ 1 個くらい死んでも不思議はない、と思います。
いろんなカラミで RAID 5 にせざるを得なかったのですが、素直にミラーリングとかにしとけばよかったです。
Re: (スコア:0)
ミラーリングってRAID1って意味じゃなくて、差分バックアップを定期的に
取り続けるって意味ですよね?
RAID1ってマスターのファイルがごっそり削除されたら、ミラーの方も一緒
に消えちゃうんじゃないか?と前から心配だったんで…
Re: (スコア:0)
心配も何も、それはそもそもRAIDで何とかなる話ではありません。
RAIDはあくまでハードウェアエラーに対応できるだけの機構です。
Re:RAIDの信頼性 (スコア:2, 参考になる)
個人でWin2k、シリコンイメージ(ソフトRAID5のやつ)使ってます。
250GB×4の構成で750GB、こんな程度で良かったら参考までに。
1年ぐらい利用していて、ある日、起動時にユーティリティでエラーが上がるようになりました。
なにぶん、個人利用なので常に代わりを用意しているわけではなかったのですが、
・何回かの起動に1度、特定のHDDのエラーが起きる。
・HDDアクセス頻度が普段と違う。
・RAID5は2台壊れたらもうダメぽ。
なので、速攻で買って交換しました。
おかげでエラーも出なくなり、そのHDDが壊れてることが立証できました。
ただ、ユーティリティの助けがあったものの、決定打はHDDアクセス頻度であって、
ある程度の経験が無ければやはりデータを飛ばしていたと思います。
もしサーバ室内のサーバだったら多分気づかなかったでしょう。
RAID5を運用するのだったら、ユーティリティの重要性が高いと思います。
それと、出来る限りミラーリングで・・・かな。
Re:RAIDの信頼性 (スコア:1, 興味深い)
レアケースかもしれませんが、こんなことがありました。
RAID 1 で一方の HDD に障害発生 -> RAID コントローラのバグ(故障?) でアラート上がらず -> 気付かずに運用 -> もう一方も障害発生。
RAID コントローラに問題があったら正直どうしようもないですね。
バックアップが取れていたから良かった様なものの。
バックアップ・ウィンドウとコストの関係でバックアップせず RAID のみ、みたいなシステムもありそう。
絶対運用担当になりたくない・・・。