パスワードを忘れた? アカウント作成
11563877 journal
日記

harutin_99の日記: 本当にHDD単体よりRAID1の方が安全か 34

日記 by harutin_99

情報処理技術者試験では、
一台の固定ディスク装置の故障率をα、
RAID1の故障率をβとすると
β=α×αになるとある。

けど、故障の原因が電圧変動、衝撃、気温変動や湿度だったりすると
二台同時にダメージ受けそうなので、それぞれ故障率がαだとしても、
βはαに近くなる。

案外壊れやすいんじゃないかと思ってるのがRAIDコントローラーで、
さらにこの故障率を加味しないといけない。

でもってHDD2個を一つの筐体に押し込めることで、温度面でも不利。

一台の故障率αを超えるんじゃないの?っていう印象。
高い金払って電気代も多くかかってしかも壊れやすいってことないかな?

#背景追記

数人程度の個人事務所でファイルサーバー的にNASを導入するっていう場合にRAID1のタイプの必要が
あるのかという問題提起です。
今までは先生のノートPCの一部を共有化(もちろんPCの電源が落ちていると繋がらなくて不便)するのと、
USBのHDDを必要に応じてPCに繋いで使っていましたが、面倒なのでNASを導入しようというのが発端。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 「故障した時にデーターを復元できるか」といった視点も重要なのでは?でも RAID1 だとデーターの不一致が発生した場合どちらの データーが正しいのかどうやって決めればいいのだろう?
  • 故障率はあくまで正常運用している状態で不具合起こす確率でしょうから、(火災、水害、落雷等の)特殊な事故対策は別途考えるべき問題だと思います。
    それこそ、定期的にバックアップして、金庫なり遠隔地に保存するしかないはずです。

    民生用の RAID は箱代の部分で少なくとも1万円以上割高ですし箱の性能は ARM + RAM 1GB 程度と、結構粗末な構成です。しかも故障時に箱ディスコンになっていると、HDDは生きているのにデータが取り出し不能に成り兼ねません。そういう意味では、ソフトウェア RAID の方が安全性が高いと言えます。

    そこへ行くと、片落ちで叩き売られている HP Proliant MicroServer Gen7 は AMD Turion II NEO N54L (2.2 GHz) と非力ですが ARM に比べれば十分な性能を持っています。これに ECC付き4GB と HotSwap 非対応ながらエアフローも十分考慮されたリムーバブルケージを 4 台分標準装備しているので RAID 用の箱としては結構理想的で、 しかも販売価格が \13,000 を切ってるので完全にバーゲン価格です。
    欲を言うと、SATA が 5 口(SATA2x4, SATA1x1) しかないとか、3.5インチだと6台以上内蔵出来ないとか、不満もないわけではありませんが、価格からすれば十分満足な仕様でしょう。
    あとは、FreeNAS や NAS4Free 辺りと組み合わせて ZFS で mirror なり raidz なりを組めば、ブロック毎にハッシュが付いているのでセルフヒーリングも利きます。

    RAID はダウンタイムをなくすための保険みたいなものなので、ダウンタイムは許容できるのならそもそも RAID は不要なんでしょうけど、NAS 箱としても MicroServer のコスパはバーゲン状態だと思いますけどね。

    --
    uxi
    • これホントのサーバーじゃないですか。なるほど確かに、ありですねこれ。
      でもこれ、OSからインストールして、ソフトウェアRAIDセットアップしてのけっこう道のりが長いです。
      インストール用CDドライブとかDHCP備えたネットワークインストール用サーバとかいった小道具も持ってないし。

      親コメント
      • CDドライブやネットブート用のDHCPサーバーは必須ではないですね。
        FreeNAS なら USB image (xz で展開する必要あり)、NAS4Free なら embedded (拡張子は .img だが中身は .img.gz なので gzip で展開する必要があり) を直接 USB フラッシュメモリに書き込めばインストールは完了します。
        dd コマンドが使えるなら場合、以下のようにすれば書き込めます。
        dd if=imagefile of=/dev/sdX
        ※ sdX の X は、b~z。USB フラッシュメモリの割り当てられたデバイスを指定しなければいけません。
        あとは、BIOS で USB boot を優先させれば NAS になります。

        dd コマンドは UNIX 系 OS には標準で入っていて、Windows でも Cygwin を入れれば使えます。
        gzip, xz が必要という意味では、結局 Cygwin を使うのが一番手っ取り早いんじゃないかと思いますが、
        dd の同等品(dd for Windows [chrysocome.net] 等)も入手可能な他、GUI 版として以下のようなソフトもあるようです。

        --
        uxi
        親コメント
      • こいつ、基板にブート用のUSBコネクタ付いているので、 RAID用のディストリならUSBメモリに掻き込むだけだけで済みます。 汎用ディストリでもUSB部分を/boot にして /ファイルシステム自体をRAIDでマウント出来ます。
        親コメント
  • by jizou (5538) on 2014年09月15日 13時07分 (#2677074) 日記

    故障率というよりは、「2台同時に壊れる確率は、非常に低い」ということかと。
    残りの一台が動いているうちに、別のドライブまたは、新しいドライブにバックアップできること。
    が、いちばん大きいのですよ。

    RAID1で片側が壊れた場合、新しいドライブを2台買ってきて、RAIDのドライブは両方更新する。
    そして、残ったドライブからデータをコピーして、そのドライブはバックアップ用に保存。
    するのがおすすめです。
    中途半端に片側だけ入れ替えると、たいてい苦労します。

    うちは、RAID0 + バックアップ1台で運用してますけど、自宅ならこれで十分かな.....

    • RAID1はHDD容量が半分になるので、RAID組むぐらいなら
      バックアップに回したほうがいいかなと思った次第です。

      最近、2台のストレージがメインの機械(HDDレコーダーと
      Gセンサ付きHDD)がいずれもHDDじゃないところが壊れた
      っていうもあって、RAIDの場合はRAIDコントローラーが
      心配になりました。

      親コメント
      • by jizou (5538) on 2014年09月16日 0時28分 (#2677374) 日記

        HDDに比べると、他のハードの故障率って高いはずなんですけどね.... (^_^;
        あと、最近のNASって、安いのはほとんどソフトウェアRAIDのような。
        # そのあたりも調べてみて下さいな。

        RAID1にするメリットは、1台壊れただけなら、サーバーは止まりませんし、
        データも最新の状態が保持されます。
        1台をメインにして、もう一台をバックアップにする方法だと、
        バックアップを取ってから、壊れるまでの間のデータが無くなります。

        自宅マシンなら、バックアップするかどうかは本人の判断なので、
        まあ、あきらめがつくんですけどね。
        人のデータだったときには、色々、重たい話も出てきたりします。
        # オレの大事な実験データ、どうしてくれるんだ~ とか。

        そのあたりも、コストとの兼ね合いですね.... (^_^;

        親コメント
    • by camelus (41736) on 2014年09月16日 0時27分 (#2677373) 日記

      >故障率というよりは、「2台同時に壊れる確率は、非常に低い」ということかと。

      自分もコレを考えましたが、落ち着いて考えてみると、
      イーサネット経由でLAN内のNASとかに 任意の(短い)間隔でバックアップできるようになった今、
      データが生まれた瞬間にマシン内で複製を取る必要は薄くなったかも。

      # 片肺でもいいから稼働を続けたいとか、データの紛失をゼロにしたいような世界では未だミラーリングは必要と思いますが

      親コメント
  • by Anonymous Coward on 2014年09月15日 8時44分 (#2676977)

    そもそも装置の動作保証環境を超えたところで故障率を考えたいと?

    極端な話、1日1回ラックが必ず倒れる環境とか、1日1回雷の直撃を食らう
    環境とかでβ=α×αが成り立つかなんて話をしたいと??

    RAIDメーカーの人も大変だな(藁)

    • いけね前提の記載忘れた。

      個人用の民生品を想定してます。
      バッファローとか。

      親コメント
      • だとしても、RAIDはHDDの故障率に対してのものなので

        単HDDだろうが複数HDDだろうが、電源、温度他が同じ条件になる元での比較をしないと意味ないでしょう。
        そして温度とかでやばそうなら、そうでないHDD単品/RAIDで別製品(そして別会社)を選べ、というだけであってHDD-RAID比較軸じゃないんじゃ?

        もちろん、電源事情が不安定な環境にいるので、複数HDDはそれ自体がリスクなんだ、という個別事案があってもかまわないし、わかるけど、それはやっぱりRAIDかどうかじゃないし...(JBODするだけの装置とかもあるしね)

        --
        M-FalconSky (暑いか寒い)
        親コメント
        • いろいろ後出しで申し訳ないんですが背景追記しています。

          いままでUSB-HDDを差し替えたり、ネットワーク上のpcのHDDを共有化して使っていたのを、
          前者は抜き差しが、後者はpcが起動していないといけないことが面倒なので、NASにしようっ
          て提案したのです。

          そしたら、どこぞのシステムサポートの担当者が、それなら「RAIDじゃないと意味がないですよ。
          RAIDがないなら、ただの大きなUSB-HDDと変わりません」と言ってきた。

          「いやいや変わるだろ」と思ったのはいいとして、RAID導入する意味があるのかどうかちょっと
          悩んだわけです。ちょうど家で使っている耐衝撃センサつきHDDがディスクは無事なのにセンサの
          異常で使えなくなったこともあって(ネット上で同様の報告多数)、余計な機能がついてない方が
          いいのかもなと。

          電算棟みたいなところならRAID1の恩恵はあるかなと思うんですが、
          普通に無停電電源装置もつけないし、人がいないときはエアコンも入れないような環境(通常の家庭
          レベル)ではどう思いますか?

          親コメント
          • 多少環境が劣悪になったからと言って、RAIDの効果がキャンセルされるわけではないでしょうし、そんな劣悪な環境ならなおのこと冗長性は確保しておくべきと思います。
            RAIDの恩恵がないと判断するとすれば、それは堅牢性の問題じゃなく導入コストの問題と、そのトレードオフで許容可能なダウンタイムの問題でしょう。

            UPSはあった方が良いですが、ジャーナリングが利いているファイルシステムなら影響は停電の瞬間に書き込みをしていたファイルに限定されるはずです。
            これは本当に直近のデータなので、預金のトランザクションのようにデータの消失に対して本当にシビアに考える必要がないところではそこまで大きな問題にはならないはずです。
            RAIDの場合、書き込みホール(write hole)の問題もあるのですが raidz だと対策されているので問題ありません。

            NASとRAIDの恩恵は図にすると以下のような感じで全く別の評価軸なので、NASならRAID必須というわけではありません。

                   NASあり
                   ↑
            RAIDなし-+→RAIDあり
                   |
                   NASなし

            ぶっちゃけると、初期コストをかけたくなくて、障害時に前回のバックアップから障害発生の間のデータをあきらめて良いなら、RAID はなくても困らないんです。
            ですが、それは単にあなたの所ではRAIDを入れないといけない程価値のあるデータは扱っていないと言う話であって、電算棟以外でもRAIDの恩恵があるかどうかとは全く別の話です。消失して困るデータを扱っている所では環境がどうであろうとRAIDの恩恵は確実にあります。

            --
            uxi
            親コメント
        • by Anonymous Coward

          HDDが別会社のものでも、使っている部品は同一メーカだったりするんですよねぇ。
          気がついたら縮退モードで動作していて、慌てて同クラスのHDDを探しているうちにもう一台も故障した経験したはあります。
          故障時の保守機能がちゃんとしていてかつ交換Diskがすみやかに供給されるっていう前提がないと、RAIDの価値って半減するんだと思います。

          • by Anonymous Coward

            交換用のディスクって元から用意しておくもんではないの?
            #そうじゃないと、しばらく片肺運転だから怖くない?

            • by Anonymous Coward

              判ってはいてもローカル用途のサーバだとなかなか予備Diskまでは予算が廻らないんですよ。
              ラインのようなデータ損失が致命的なところだと、大手を振って購入できるんですけど。
              あとは、同時期に調達したDiskだと同じ問題を抱えている場合もあるからずらしたいっていうのと、長期保管していた奴っていうのもイマイチ不安なのでズルズルと購入の機を逃していて、手持ちのものが無くなってるときを狙って壊れる。

              • 昨今は冗長性1では不十分だって風潮だと思ってたんですけど?
                予備ディスクの手配は、とりあえず手に入るもので対応できる構成にしておくのが鉄則かと。

                あと、個人的には冗長性2もちょっと不安なんですが、冗長性3はそれこそ懐事情が辛くて、バックアップで我慢と言った感じですね。

                --
                uxi
                親コメント
      • バッファローなどの民生用は、リカバリに際に高度な介入が出来ないので懸念はごもっとも。個人的にはHP macroserverにHDD四台突っ込んでRAIDカードかbtrfsでRAID10+世代バックアップ外付HDDがお勧めですが。
        親コメント
  • by Anonymous Coward on 2014年09月15日 14時41分 (#2677125)

    > 一台の固定ディスク装置の故障率をα、
    > RAID1の故障率をβとすると
    > β=α×αになるとある。

    故障率とは、単なる予想値です。
    個々のHDDの故障は独立して起こるという前提のうえで、故障が起きる割合を予想しただけです。

    > けど、故障の原因が電圧変動、衝撃、気温変動や湿度だったりすると
    > 二台同時にダメージ受けそうなので、それぞれ故障率がαだとしても、
    > βはαに近くなる。

    これはHDDの故障が連動して起きている例です。上記の前提を満足していません。
    前提が変われば、予想の結果、つまり故障率も変わります。

  • by Anonymous Coward on 2014年09月15日 23時26分 (#2677342)

    こういう場合はどれだけの時間でどれだけのデータをどれだけの手間をかけて戻すか、を第一に考えるんでないかい?
    故障の発生率はリカバリのを行う羽目になる率なわけで。
    目的をちゃんと理解してないから、そんな頓珍漢な発想にいきつく。
    他の人が言うように予想は予想。前提次第なんですよ。
    ただβ=α×αは特殊な前提ではなく、多くの場合に適用できるというだけ。
    RAIDの必要性に”数人程度の個人事務所での使用”なんて前提でもなんでもない。

typodupeerror

吾輩はリファレンスである。名前はまだ無い -- perlの中の人

読み込み中...