Re:別に鬼門じゃねーよ (#1555274) | NTTデータ、Doblog終了へ。「技術的知見・運営ノウハウの蓄積は達成」と強調

「NTTデータ、Doblog終了へ。「技術的知見・運営ノウハウの蓄積は達成」と強調」記事へのコメント

記事ページを表示すべてのコメント取得

検索149コメント Log In/Create an Account

RAID5 は鬼門 (スコア:5, 興味深い)

by nq (16642)

今まで２回泣きました。一回は、８台で組んだRAIDのHDD１台がクラッシュして、再構築中にもう一台が昇天。もう一回は、定期停電の後の復帰作業中のオペレーターの操作ミスでマウントに失敗後、読めなくなった。
　物理的・地理的に離れたところにバックアップをするのが一番。そのためには、RAID5を組んで大容量ボリュームをつくると、かえって不便、と思うようになりました。
　それにしてもこの開き直り方には、あきれを通り越して、ネット貧民の有象無象は相手にしないという覚悟に清々しさを感じる。
- 別に鬼門じゃねーよ (スコア:2, すばらしい洞察)
  
  by Anonymous Coward
  
  ちゃんとした使い方分かってない奴が設計・構築・運用して痛い目にあってるだけ
  - Re:別に鬼門じゃねーよ (スコア:3, 興味深い)
    
    by funya (14942) on 2009年04月25日 23時12分 (#1555274)
    
    LogicTech のサポートと話した時に「マニュアルに書いてある通り」RAID5の復旧は、書き込み禁止にして読めるうちに、
    
    　「まず、バックアップして」
    
    それから、故障ディスクを入れ換えて rebuild 。
    
    いきなり rebuild なんてありえないです。90年代後半の「ディスク逝かれまくり」を体験した世代では身にしみているとは思うけどね。
    
    シェア
    
    親コメント
    - Re:別に鬼門じゃねーよ (スコア:5, 興味深い)
      
      by kousokubus (37099) on 2009年04月26日 1時55分 (#1555332)
      
      RAIDに限らず、壊れちゃったデータはまず「まるっとコピーを取って」そのコピー相手にいろいろやるのが鉄則ですな。
      RAIDは信頼性がそこそこのディスクを束ねて使うときの気休めなので、理解しないとハマりがち
      1. 複数台のHDDを使うんだから、システム全体としての故障発生率はあがる
      2. どのRAIDを使っても、復旧時は基本的にシステムダウンする
      3. オペレーションミスには対応できない
      4. RAID1以外は基本的に実装依存
      # 何を求めてるか忘れて設計すると悲惨なことになるのはいつものことですが:p
      
      シェア
      
      親コメント
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        一般的にどうやるのかは分からないけど、ホットスペアでリビルドまでは自動化して、そこで問題があればやっと人間のお出ましなんじゃないの。
        消耗品故障くらいで、いちいちシステム止めるなんて許されんのかな？
        社内blogならサービスレベルとしては問題ない様な気もするけど。
        適正にバックアップ取ってれば、ディスクコピー＋リビルドの時間と比較して、どっちがダウンタイムが短いのか明らかじゃない？？
        それにしてもストレージも守れないなんて、システム屋としてはクリティカルだよね。
        その点では、Doblogは知見と交換に失う物は大きかった。
        
        Re:別に鬼門じゃねーよ (スコア:1)
        
        by kousokubus (37099) on 2009年04月26日 14時18分 (#1555464)
        
        一般化できないのでアレですが、RAIDは「止めてはならないシステム」では「ちょっと良いケーブル」程度の扱いだと思います。
        大抵は、ロードバランサ組んでおいて、どこぞが壊れたら「死んだサーバ」扱いして人間がでてって修復します。
        （その中でホットスペアでリビルドまで自動化とか、人間がやるのはHDD入れ替えるだけって話になると思います）
        どの程度止めてよいサービスかにもよりますけど、単一故障点をできるだけ作らないようにシステムを構築するのが原則です。
        （もちろんコストとの兼ね合いになるので、重要視するところを守るように作るわけです）
        システム止めるのが許されない or ダウンタイムを短くするのがキモの場合には、RAID5を選択すること自体が間違っています。
        RAID5は「容量を多く使いたい」時に使うものであって、「ディスクを保護する」時に使うものではありませんしね。
        バックアップやダウンタイムの最小化も、「何を守りたいのか」によって異なります。例えば
        ・前日までのデータに戻ってしまっても、半日で復旧できることを目指す
        ・システムは１日止まるが、１時間前までのデータに戻る
        ・システムは止めずに、応答速度が落ちる
        ・止まらない
        どういう保護を求めるかによって異なりますが、そこそこの看板しょってる場合は「データは最悪でも前々日、復旧まで３日」ってとこでしょう。
        別紙１をみる限りでは、ちょっと詳しい人が内々で進めたプロジェクトって感じなので社内blogなみの扱いじゃないかな。
        痛みを伴う教訓は記憶に残るでしょうし、他山の石にしたいところ。
        
        シェア
        
        親コメント
    - Re:別に鬼門じゃねーよ (スコア:1, 興味深い)
      
      by Anonymous Coward on 2009年04月26日 21時42分 (#1555570)
      
      サーバでは、システムを止めてから再構築なんてことはありません。
      そんなことを許してくれるユーザーさんはいませんね。
      
      そもそもスペアディスクが設定されていれば、自動的に再構築されてしまいます。
      また、アクセスしていない時はディスクのバッドブロックチェックを随時行っています。
      これによりRAID再構築中のディスク障害率を下げるようにしています。
      
      メーカーの中の人
      
      シェア
      
      親コメント
      - Re:別に鬼門じゃねーよ (スコア:1)
        
        by nim (10479) on 2009年04月27日 14時44分 (#1555853)
        
        ＞サーバでは、システムを止めてから再構築なんてことはありません。
        ＞そんなことを許してくれるユーザーさんはいませんね。
        うちの家庭内写真サーバは、別に夜中止めても誰も文句言いませんが。
        私も金融機関向けシステムとかやってたから、言いたいことはわかりますが、
        そういう業界の人は、「この水準があたりまえ、他は存在しない」みたいな
        態度は取らないほうがいいと思います。
        ちょっとしたサーバだってサーバだし、追加空調が必要なくらいのどでかいやつも
        サーバで、その間は連続していて、はっきりした境界があるわけではないのです。
        そして、ブレイクスルーは、おもちゃみたいな世界から現れたりするのです。
        Google のサーバなんて、まさにそんな感じのものでしょう。
        
        シェア
        
        親コメント
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        > そして、ブレイクスルーは、おもちゃみたいな世界から現れたりするのです。
        
        ブレイクしてスルーはしてみたものの
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      どのクラスのRAID5機を使ってたのか知りませんが、
      >いきなり rebuild なんてありえないです。
      
      どこが？　そもそもサポートに聞いてくる時点で技術力が無いという前提ですから
      その対応は現実的で、不思議でも何でもないと思いますが。
      
      #書かれている内容だけで判断するとそう思う。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

NTTデータ、Doblog終了へ。「技術的知見・運営ノウハウの蓄積は達成」と強調 More ログイン

「NTTデータ、Doblog終了へ。「技術的知見・運営ノウハウの蓄積は達成」と強調」記事へのコメント

RAID5 は鬼門 (スコア:5, 興味深い)

別に鬼門じゃねーよ (スコア:2, すばらしい洞察)

Re:別に鬼門じゃねーよ (スコア:3, 興味深い)

Re:別に鬼門じゃねーよ (スコア:5, 興味深い)

Re: (スコア:0)

Re:別に鬼門じゃねーよ (スコア:1)

Re:別に鬼門じゃねーよ (スコア:1, 興味深い)

Re:別に鬼門じゃねーよ (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

スラド