アカウント名:
パスワード:
メインがおかしいと誤判断して冗長系に切り替えたら、落ちたという冗談みたいな話に見えるんだけど?ゆうちょのシステムはどうなっているんだ
#ACで矢継ぎ早にコメントしたら「ゆっくりさん」がでてしまったorz
某旧帝大の大型計算機センターで「RAIDですから」と豪語していたディスク装置のドライブが1個壊れたとかね。 壊れた後でわかったけどRAID0だった。
教育用計算機センターで「RAIDのパラメータを改善したいのでテープにフルバックアップを取ってRAIDを再構成します」という作業をしてもらったら「戻そうとしたらバックアップしたテープ読めません」となっちゃったと。
パスワード管理システムをバグフィックスしてもらったら、新たにエンバグしてパスワードファイルを丸ごと吹っ飛ばした。問い詰めてみるとろくにテストもせずに開発した修正をいきなり実機に入れていた。
イントラネットでの負荷分散装置が全然効かないので調べてみたら、クライアントのIPアドレスベースで分散する装置だった。そしてクライアントは全部NATの向こうなのでソースIPアドレスは1種類だった。
> 「RAIDですから」(略)壊れた後でわかったけどRAID0だった。
これって、そもそも「RAID0」って言葉が最大の諸悪の根源な気がする。ただのストライピングでどこにも冗長性がないものを「Redundant」って名乗るな!って感じで。
最初のRAIDの論文には、当然のことながらRAID0なんて言及してなかった覚えがあるのですが…
それが今では普通にRAIDの一種みたいに扱われたりして…いったい誰だよRAID0なんて言葉を使いだしたヤツは
「水銀ゼロ使用」みたいなものでは
> RAID0って冗長性が0(無い)ってコトなのですかね・・・
そのとおりですよ。
10年ちょっと前,某社での出来事.
ネットワーク環境の改善のため,事業所内で使っているハブをスイッチングハブに総入れ替えした.しかし全然変わらないので,管理部門に「ちょっと見せてみろ!」と乗り込んで行ったら,一番根っこのところで全てのスイッチングハブは馬鹿ハブの下にカスケードされていた.
壊れーかけのRAIDー♪って歌有りましたよね?
RAID5だと計算結果の記録に失敗する可能性が高いので使えませんし。
って…、RAIDコントローラーがバグっているのが原因で、計算結果の記録に失敗しているのでは?
書き込みホールってやつです。
だとすると、電源の信頼性を上げ、エラー時の処理を工夫することで、「記録に失敗する可能性が高い」とは言えない状況にできますよ。さらに、一定時間RAID化前のデータをバッテリバックアップしたメモリにも記録しておけば、事実上支障のないレベルに持っていけるでしょう。
現実問題として、RAID1+0より上のものとして、RAID1+5やRAID1+6なんてのもあったりします。電源を含めたほとんどの部品が活線で交換できるクラスのストレージじゃないと、使う意味はありませんが(RAID6+6なんてのもありますが、メガバンクや大規模な証券会社位じゃないとコスト的に採用できないでしょう)。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
吾輩はリファレンスである。名前はまだ無い -- perlの中の人
記事を見る限り……… (スコア:0)
メインがおかしいと誤判断して冗長系に切り替えたら、落ちたという冗談みたいな話に見えるんだけど?
ゆうちょのシステムはどうなっているんだ
#ACで矢継ぎ早にコメントしたら「ゆっくりさん」がでてしまったorz
Re:記事を見る限り……… (スコア:4, 興味深い)
某旧帝大の大型計算機センターで「RAIDですから」と豪語していたディスク装置のドライブが1個壊れたとかね。 壊れた後でわかったけどRAID0だった。
教育用計算機センターで「RAIDのパラメータを改善したいのでテープにフルバックアップを取ってRAIDを再構成します」という作業をしてもらったら「戻そうとしたらバックアップしたテープ読めません」となっちゃったと。
パスワード管理システムをバグフィックスしてもらったら、新たにエンバグしてパスワードファイルを丸ごと吹っ飛ばした。問い詰めてみるとろくにテストもせずに開発した修正をいきなり実機に入れていた。
イントラネットでの負荷分散装置が全然効かないので調べてみたら、クライアントのIPアドレスベースで分散する装置だった。そしてクライアントは全部NATの向こうなのでソースIPアドレスは1種類だった。
Re:記事を見る限り……… (スコア:2, すばらしい洞察)
> 「RAIDですから」(略)壊れた後でわかったけどRAID0だった。
これって、そもそも「RAID0」って言葉が最大の諸悪の根源な気がする。
ただのストライピングでどこにも冗長性がないものを「Redundant」って名乗るな!
って感じで。
最初のRAIDの論文には、当然のことながらRAID0なんて言及してなかった覚えがあるのですが…
それが今では普通にRAIDの一種みたいに扱われたりして…
いったい誰だよRAID0なんて言葉を使いだしたヤツは
Re:記事を見る限り……… (スコア:1)
Re: (スコア:0)
「水銀ゼロ使用」みたいなものでは
Re: (スコア:0)
>ただのストライピングでどこにも冗長性がないものを「Redundant」って名乗るな!
>って感じで。
RAID0って冗長性が0(無い)ってコトなのですかね・・・
Re: (スコア:0)
> RAID0って冗長性が0(無い)ってコトなのですかね・・・
そのとおりですよ。
Re: (スコア:0)
10年ちょっと前,某社での出来事.
ネットワーク環境の改善のため,事業所内で使っているハブをスイッチングハブに総入れ替えした.しかし全然変わらないので,管理部門に「ちょっと見せてみろ!」と乗り込んで行ったら,一番根っこのところで全てのスイッチングハブは馬鹿ハブの下にカスケードされていた.
RAIDの信頼性 (スコア:0)
なんていう似非技術者は少なくないわけですが、そういう外部バックアップまで
ケチるようなところに限って、RAID5でディスクが壊れても、
「RAIDだから大丈夫大丈夫。余裕があるときにゆっくり交換すればいい」
なんて言ってて、他のディスクも壊れてディスクシステム崩壊なんてことが
あったりするんですよね。
壊れかけのRAID5なんて、RAID0と変わらないわけですよ。
HPC用途だと、高速化が目的でRAID0とかしたりすることがあるかもしれないですね。
RAID5だと計算結果の記録に失敗する可能性が高いので使えませんし。
RAID10とかにするのがいいのかなあ。
とにかく、みんなRAID5を信用し過ぎだと思う。
RAID5なんてのは、仕方が無い場合にのみ使うもんだ。
Re: (スコア:0)
壊れーかけのRAIDー♪って歌有りましたよね?
Re: (スコア:0)
って…、RAIDコントローラーがバグっているのが原因で、計算結果の記録に失敗しているのでは?
Re: (スコア:0)
惜しいけど、ちょっと違います。
書き込みホールってやつです。
記録に失敗はあってますが、問題はその発生するタイミング。
Re: (スコア:0)
だとすると、電源の信頼性を上げ、エラー時の処理を工夫することで、「記録に失敗する可能性が高い」とは言えない状況にできますよ。さらに、一定時間RAID化前のデータをバッテリバックアップしたメモリにも記録しておけば、事実上支障のないレベルに持っていけるでしょう。
現実問題として、RAID1+0より上のものとして、RAID1+5やRAID1+6なんてのもあったりします。電源を含めたほとんどの部品が活線で交換できるクラスのストレージじゃないと、使う意味はありませんが(RAID6+6なんてのもありますが、メガバンクや大規模な証券会社位じゃないとコスト的に採用できないでしょう)。