アカウント名:
パスワード:
壊れやすさが通常の4倍といった方が正しいだろ。
×: 寿命1/4○: 事故遭遇率x4故に麻薬的魅力があるのよね…
単純に4倍になるかな。たまたま複数が同時に壊れる確率を引く必要があると思う
単純に4倍で合ってます。一台故障だけなら復旧可能なのは、パリティディスクを用意してある構成ですね。4台あればRAID0+1も可能なのですけど、そこはロマンと言うか、やってみたかった。
故障率をpとすると4台のうち最低どれか1台が壊れる確率は1-(1-p)4で、これをまじめに展開すると4p-6p2+4p3-p4。普通はpは非常に小さくp2以降は近似的に無視でき、結果として「単純に4倍」ということになりますが、この6p2以降は、「たまたま複数が同時に壊れる確率を引く」分に相当しますので、厳密に言えば、元コメの言うとおり、それを引いてない、ということになりますね。
ま、実用上は気にする必要はないとは思いますが。
たまたま、きんたまのように同時に2玉以上逝ったとしても壊れる事には変わりはないので4倍ですよ
逆ですよ。単純に4倍するというのは「同時に2個逝った場合は故障2回分とする」ということです。「同時に逝っても、故障としては1回」と数えると、故障率は4倍より下がるんです。
確率が十分小さい場合は気にする必要はありませんが、「故障率p=30%が4台なら、故障率は4倍で120%」は明らかにおかしい。
>故障率p=30%が4台なら
いろいろ無視して余事象の計算だけだと ( 1 - 0.3 )**4 すなわち 76%
最初の1台が壊れた時点で心が折れてRAID0をやめるから、1台目が壊れるまでの確率だけでいいのかも笑
つーか求めたいのは↓なので。×: (いずれかの)HDDが故障する確率○: RAID0がクラッシュする確率
「いずれかのHDDが故障==RAID0がクラッシュ」でしょ? RAID0のコントローラーが故障する可能性を計算に入れていないと言ってる? どっちにしても単純に4倍にはならないはずだけど
「(いずれかの)HDDが故障する確率 == 1台以上のHDDが故障する確率」です。故に「RAID0がクラッシュする確率」を考えるにあたり「たまたま複数が同時に壊れる確率」を引く必要はない→単純に4倍でよい、が論旨です。# コントローラーの故障は元から考慮してません。「単純に4倍にはならない」の論拠は何でしょうか?HDDはアレイを組むと単体で使用するより故障の確率が上がる、なんて話があるのですか?# 駆動電圧や放熱が不利になるのは設置環境に起因する問題であって、アレイが原因ではない。
正確な数式は #4006533に書きましたけど、「4台中1台以上のHDDが故障する確率」≠「1台が故障する確率の4倍」なんですよ。「1台が故障する確率の4倍」だと、「2台同時に故障した場合」をダブって換算してしまってるんです。
分かりやすくHDD2個で考えましょう。HDDが故障する確率が10%だとすると、「10%の確率でHDD1が故障」「10%の確率HDD2が故障」しますが、「1%の確率でHDD1とHDD2の両方が故障」ですので、「HDD1だけ故障する確率は9%」「HDD2だけ故障する確率は9%」です。このとき、1台以上故障する確率=HDD1だけ故障する確率+HDD2だけ故障する確率+HDD1とHDD2が両方故障する確率=9%+9%+1%=19%です。10%+10%=20%ではなく、そこから両方壊れる確率を引いた 19% になるんです。
まあ、確率が小さい時は、近似的に台数倍してもだいたい問題ないのですが、近似せず正確に計算するとどうなるか、という話なんですから、確率4倍なんて言ってたら情報処理試験に落ちますよ。稼働率計算上の常識レベルの問題。
それを言うならこうでしょ。↓○: 10% + 10%×: 9%+9% +1%○: (9 + 1)% + (9 + 1)%「複数台繋げば冗長性がなくても故障率が下がる」そんなトンデモはやはり成立しない、と。
つーかこのツリーでの命題は、冗長性なし == 1台故障すればパーになるRAID0で、複数台故障のケースを考慮する意義はあるのか? なのですが。
だから、正確に「1台故障すればパー」になる確率を計算するためには、「それぞれの故障率の足し算」ではだめだって話なんだよ。10%+10%だと「両方故障するケース」を、「HDD1が故障する場合」「HDD2が故障する場合」それぞれにダブって数えちゃってるの。
例えば、故障率50%の機器を二台RAID0にした場合、故障率は足し算して100%、になったりはしません。「両方大丈夫」「HDD1だけ壊れた」「HDD2だけ壊れた」「両方壊れた」の4択それぞれ25%で、「どっちか片方でも壊れてしまう確率」は75%になります。
それって「総和を100%にしたいがための数学的こじつけ」ではないの?その理論は現実を的確にモデル化できているの?「HDDを複数台接続すれば故障率を下げられる」とはどう説明づけられるの?
はい、現実を的確にモデル化できてますよ。とりあえず、ソースはWikipediaしときますが、RAID0 [wikipedia.org]の説明より
例えば、単位時間あたりのドライブ故障率が1%の場合、2台でRAID 0を構成した場合のアレイの故障率は約2% (1-0.99*0.99=0.0199) と約2倍に上昇する。
と、1%が2台のRAID0は、2倍の2%ではなく、両方同時に故障する確率を引いた1.99%になるんです。情報処理試験なら、稼働率とか平均故障間隔という、定番の問題 [pursue.ne.jp]。
あるいは、高校数学なら、数学Aの確率の問題。サイコロ一個をHDD一個にたとえて、「サイコロの出目が1の場合、HDDは壊れた」とします。故障率1/6=16.7%。そうすると、RAID0の故障率の算出は、「サイコロを2個転がして、どちらかが1になる確率はいくらか」という問題に対応します。
サイコロ2個をA/Bとすると、その出目は「サイコロAが1で、サイコロBが1」「Aが1でBが2」「Aが1でBが3」…「Aが6でBが6」の36通りで、そのうちどちらかが1になるのは「A1,B1」「A1,B2」「A1,B3」「A1,B4」「A1,B5」「A1,B6」「A2,B1」「A3,B1」「A4,B1」「A5,B1」「A6,B1」の11通りです。同様に確からしい36通りのうち11通りですから、その確率は11/36=30.6%になる。16.7%+16.7%の33.3%にはなりません。
これは、別に「故障率を下げられ」てるわけではありません。上記のサイコロの例だと、16.7%+16.7%という計算は、「Aが1でBが1」の場合を、「Aが1の場合」と「Bが1の場合」の両方でリストアップしてしまって、「どちらかが1になるのは全部で12通り」と間違えてしまってる(ダブって数えてる)って状況。でも「運悪く両方同時に壊れた場合も、故障は1回」なので、足し算にはならないんです。
これは、別に「故障率を下げられ」てるわけではありません。でも「運悪く両方同時に壊れた場合も、故障は1回」なので、足し算にはならないんです。
これでようやく得心しました。ありがとうございます。# 違和感の正体は、事故遭遇率と故障率を混同していることでした。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
人生の大半の問題はスルー力で解決する -- スルー力研究専門家
いつ死ぬかわからんというより (スコア:0)
壊れやすさが通常の4倍といった方が正しいだろ。
「壊れやすさ」と言っても (スコア:0)
×: 寿命1/4
○: 事故遭遇率x4
故に麻薬的魅力があるのよね…
Re: (スコア:0)
単純に4倍になるかな。たまたま複数が同時に壊れる確率を引く必要があると思う
Re:「壊れやすさ」と言っても (スコア:1)
単純に4倍で合ってます。一台故障だけなら復旧可能なのは、パリティディスクを用意してある構成ですね。
4台あればRAID0+1も可能なのですけど、そこはロマンと言うか、やってみたかった。
Re:「壊れやすさ」と言っても (スコア:1)
故障率をpとすると4台のうち最低どれか1台が壊れる確率は
1-(1-p)4で、これをまじめに展開すると4p-6p2+4p3-p4。
普通はpは非常に小さくp2以降は近似的に無視でき、結果として「単純に4倍」ということになりますが、
この6p2以降は、「たまたま複数が同時に壊れる確率を引く」分に相当しますので、
厳密に言えば、元コメの言うとおり、それを引いてない、ということになりますね。
ま、実用上は気にする必要はないとは思いますが。
Re: (スコア:0)
たまたま、きんたまのように同時に2玉以上逝ったとしても
壊れる事には変わりはないので4倍ですよ
Re:「壊れやすさ」と言っても (スコア:1)
逆ですよ。
単純に4倍するというのは「同時に2個逝った場合は故障2回分とする」ということです。
「同時に逝っても、故障としては1回」と数えると、故障率は4倍より下がるんです。
確率が十分小さい場合は気にする必要はありませんが、
「故障率p=30%が4台なら、故障率は4倍で120%」は明らかにおかしい。
Re:「壊れやすさ」と言っても (スコア:1)
>故障率p=30%が4台なら
いろいろ無視して余事象の計算だけだと ( 1 - 0.3 )**4 すなわち 76%
Re: (スコア:0)
最初の1台が壊れた時点で心が折れてRAID0をやめるから、1台目が壊れるまでの確率だけでいいのかも笑
Re: (スコア:0)
つーか求めたいのは↓なので。
×: (いずれかの)HDDが故障する確率
○: RAID0がクラッシュする確率
Re: (スコア:0)
「いずれかのHDDが故障==RAID0がクラッシュ」でしょ? RAID0のコントローラーが故障する可能性を計算に入れていないと言ってる? どっちにしても単純に4倍にはならないはずだけど
Re: (スコア:0)
「(いずれかの)HDDが故障する確率 == 1台以上のHDDが故障する確率」です。
故に「RAID0がクラッシュする確率」を考えるにあたり
「たまたま複数が同時に壊れる確率」を引く必要はない→単純に4倍でよい、が論旨です。
# コントローラーの故障は元から考慮してません。
「単純に4倍にはならない」の論拠は何でしょうか?
HDDはアレイを組むと単体で使用するより故障の確率が上がる、なんて話があるのですか?
# 駆動電圧や放熱が不利になるのは設置環境に起因する問題であって、アレイが原因ではない。
Re:「壊れやすさ」と言っても (スコア:1)
正確な数式は #4006533に書きましたけど、「4台中1台以上のHDDが故障する確率」≠「1台が故障する確率の4倍」なんですよ。
「1台が故障する確率の4倍」だと、「2台同時に故障した場合」をダブって換算してしまってるんです。
分かりやすくHDD2個で考えましょう。
HDDが故障する確率が10%だとすると、「10%の確率でHDD1が故障」「10%の確率HDD2が故障」しますが、「1%の確率でHDD1とHDD2の両方が故障」ですので、「HDD1だけ故障する確率は9%」「HDD2だけ故障する確率は9%」です。
このとき、
1台以上故障する確率=HDD1だけ故障する確率+HDD2だけ故障する確率+HDD1とHDD2が両方故障する確率=9%+9%+1%=19%です。
10%+10%=20%ではなく、そこから両方壊れる確率を引いた 19% になるんです。
まあ、確率が小さい時は、近似的に台数倍してもだいたい問題ないのですが、
近似せず正確に計算するとどうなるか、という話なんですから、
確率4倍なんて言ってたら情報処理試験に落ちますよ。
稼働率計算上の常識レベルの問題。
Re: (スコア:0)
それを言うならこうでしょ。↓
○: 10% + 10%
×: 9%+9% +1%
○: (9 + 1)% + (9 + 1)%
「複数台繋げば冗長性がなくても故障率が下がる」
そんなトンデモはやはり成立しない、と。
つーかこのツリーでの命題は、
冗長性なし == 1台故障すればパーになるRAID0で、
複数台故障のケースを考慮する意義はあるのか? なのですが。
Re:「壊れやすさ」と言っても (スコア:1)
だから、正確に「1台故障すればパー」になる確率を計算するためには、「それぞれの故障率の足し算」ではだめだって話なんだよ。
10%+10%だと「両方故障するケース」を、「HDD1が故障する場合」「HDD2が故障する場合」それぞれにダブって数えちゃってるの。
例えば、故障率50%の機器を二台RAID0にした場合、故障率は足し算して100%、になったりはしません。
「両方大丈夫」「HDD1だけ壊れた」「HDD2だけ壊れた」「両方壊れた」の4択それぞれ25%で、「どっちか片方でも壊れてしまう確率」は75%になります。
Re: (スコア:0)
それって「総和を100%にしたいがための数学的こじつけ」ではないの?
その理論は現実を的確にモデル化できているの?
「HDDを複数台接続すれば故障率を下げられる」とはどう説明づけられるの?
Re:「壊れやすさ」と言っても (スコア:1)
はい、現実を的確にモデル化できてますよ。
とりあえず、ソースはWikipediaしときますが、RAID0 [wikipedia.org]の説明より
と、1%が2台のRAID0は、2倍の2%ではなく、両方同時に故障する確率を引いた1.99%になるんです。
情報処理試験なら、稼働率とか平均故障間隔という、定番の問題 [pursue.ne.jp]。
あるいは、高校数学なら、数学Aの確率の問題。
サイコロ一個をHDD一個にたとえて、「サイコロの出目が1の場合、HDDは壊れた」とします。故障率1/6=16.7%。
そうすると、RAID0の故障率の算出は、「サイコロを2個転がして、どちらかが1になる確率はいくらか」という問題に対応します。
サイコロ2個をA/Bとすると、その出目は「サイコロAが1で、サイコロBが1」「Aが1でBが2」「Aが1でBが3」…「Aが6でBが6」の36通りで、
そのうちどちらかが1になるのは「A1,B1」「A1,B2」「A1,B3」「A1,B4」「A1,B5」「A1,B6」「A2,B1」「A3,B1」「A4,B1」「A5,B1」「A6,B1」の11通りです。
同様に確からしい36通りのうち11通りですから、その確率は11/36=30.6%になる。
16.7%+16.7%の33.3%にはなりません。
これは、別に「故障率を下げられ」てるわけではありません。
上記のサイコロの例だと、16.7%+16.7%という計算は、
「Aが1でBが1」の場合を、「Aが1の場合」と「Bが1の場合」の両方でリストアップしてしまって、「どちらかが1になるのは全部で12通り」と間違えてしまってる(ダブって数えてる)って状況。
でも「運悪く両方同時に壊れた場合も、故障は1回」なので、足し算にはならないんです。
Re: (スコア:0)
これは、別に「故障率を下げられ」てるわけではありません。
でも「運悪く両方同時に壊れた場合も、故障は1回」なので、足し算にはならないんです。
これでようやく得心しました。ありがとうございます。
# 違和感の正体は、事故遭遇率と故障率を混同していることでした。