アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
計算機科学者とは、壊れていないものを修理する人々のことである
保険が違う (スコア:1, すばらしい洞察)
うちのネットワークRAIDはほぼライトワンスだからいいけど、最近のエロ動画はサイズがバカでかくて困る。
女優以外はロッシー高圧縮してくれていいよ。
何故にAll or nothing (スコア:1, すばらしい洞察)
のであって、
「バックアップにならない」
のとは違うと思う。
# こういう「紛い物を売りつける商売の人」的な論法は避けたほうがよさげ
Re: (スコア:1)
元々ミラーリングを含めてRAIDはHDDの
ハード障害への対応のものだし。
ソフト的な障害のために設計されてないから
バックアップとして考えるのは駄目。
Re: (スコア:1, すばらしい洞察)
ハード的な障害の場合にも、HDD交換後、テープからリストアとかするんですがね。
まさかと思うけれど、ハード的障害の場合、ミラーリングしか手段がないとか思ってます?
ソフト的な問題だろうがハード的な問題だろうが、データが破損して駄目になったらバックアップから戻すんだよ。ちなみにミラーリングはバックアップじゃないとか言ってる人がいるみたいだけど、あれもバックアップなんです。少なくとも機構的にはね。
ディスクのトラブルで丸ごと死んじゃった時にもう一方から死ぬ直前までのデータを戻すためのものです。交換後、ちゃんとそういう操作を内部的にはしているんです(交換後、データのsyncをしています。CEがやってたのを見たことありませんか?)
実際は片肺でも動いてしまうもんだから表面的には分からないんだろうけどね。
バックアップじゃないとかの問題じゃなくてバックアップとしては不完全ってだけの話だと思うが、違うのか?>アンタラ
#ま、たしかにソフト屋さんにはハードに疎い人も多いのは知ってるけどさ。
Re: (スコア:2, すばらしい洞察)
>バックアップじゃないとかの問題じゃなくてバックアップとしては不完全ってだけの話だと思うが、違うのか?>アンタラ
それってただのミラーリング。ディスクの片割れが死んだらミラーではなくなるのだから
復旧中は単にミラーリングを実行しているだけ。論理的にも物理的にもデータは失われて
いないのだからバックアップからリストアという表現は不適当。
ミラーセットが完全崩壊してほかの媒体から再構築したミラーセットに書き込んだというならリストアといえるが。
Re: (スコア:1)
Re: (スコア:1, 参考になる)
ミラーセットをバックアップと主張して再構築中に生き残ったディスクも死んだら
何のためのバックアップだという話になる。生き残ったディスクだけが唯一の
データ保持媒体ならその瞬間にバックアップが存在しないことになってしまう。
そして冗長化ディスクの冗長性復旧中に生き残りも死ぬってのはない訳じゃない。
バックアップってのは復元できる可能性を上積みして想定の範囲内で
データの保持を行う訳だから、想定の範囲がそんな程度だと復旧の可能性がバクチになってしまう。
Re: (スコア:0)
先日、RAID5のディスクが1台壊れたときがそうだったよ。
残ったディスクもS.M.A.R.Tで見るとリトライが頻発で、リビルドの負荷をかけると壊れる可能性があると診断されたわ。
結局負荷をかけないようにバックアップを取ってからリビルドした。最悪の場合はレストアする覚悟で。
RAIDはデータを守るためには当てにならん。
Re: (スコア:0)
は?
ディスク1台壊れてデータ無事だったんでしょ。
十分に役立ったじゃん。
あてにならんのはむしろキミの方かもね。
Re: (スコア:1)
役に立ったかどうかの話じゃなくて、あてになるかどうかの話をしているように見えるのですが。
Re: (スコア:0)
Re: (スコア:0)
修復に失敗して元データも失っちゃいましたなんてどんだけ博打か考えてみたか?
結果を見て役に立ったと喜ぶことと、過程を振り返って当てにしてはいけないという教訓を得ることの違いがわかるか?
Re: (スコア:0)
それを全部含めて運用だ。いちいちSMARTなんかで確認してヤバそうだからやる、なんて場当たりやってるからあてにならん奴なんだよ。
Re:何故にAll or nothing (スコア:1)
これ許される時間の問題もあるんだ。
静的にデータバックアップ取得するためにサービスの停止を伴うケースがあるわけな。
ここで、「安全に負荷をかけないでバックアップすると5時間よけいに停止させる
必要がある」といった「サービス停止」をどうするかの考えが入るんだ。
でもって、場所によっては「RAID1の復元の場合は、生き残ったデータのバックアップ
の取得をしない」という「決め」がある。
# 10システム程度しか運用設計していないけど、顧客のポリシーなどから、
# そういうサイトが複数あった。
そういった決めがある場合を含めて、SMARTで確認して,RAID1の復元が困難そうだから
止むなく停止時間の延長を呑む場合もあるんだ。
>いちいちSMARTなんかで確認してヤバそうだからやる、なんて場当たりやってるからあてにならん奴なんだよ。
場当たりではなく、状況を検分して判断するということも、考えられるよ。
障害復旧について、「この場合にはこうする」だけの決め打ちではなくて、
「この場合には○○をみて(調べて)判断する」といったことが事前に(もしくは、
その場で)決められる場合もあるからね。
一番まずいのは、君の様に「こうするのは当たり前」という思い込みで仕事を
することな。
安全性もあるけど、ダウンタイム/復旧時間を考えるのは、よくあること。