yosshy曰く、"Linux カーネルの開発に使用されている[編注:BitKeeperのサーバである]bkbitsが数時間前に停電で停止したらしく、現在復旧作業中との事。UPS を繋いでおく、ジャーナリングファイルシステムを用いるなど、色々とサービス停止時間を短くする施策はあったと思うのだが、今となっては後のまつりである。賢明な /.er の諸兄はどのような障害対策を行っておられるだろうか。何度も議論されてきた事ではあろうが、技術の進歩もあるので、これを機に改めて聞いてみたい。"
復旧の予行演習 (スコア:3, 参考になる)
バックアップを取っている人は多いけど、特にシステム領域の リストア手順知らない人がおおい。そういうバックアップは 無意味。 マシンがクラッシュしてオンラインドキュメントが読めない状態で、復旧手順が 頭に入ってないと悲惨。
Re:復旧の予行演習 (スコア:2, 興味深い)
いかに復旧を早くやるかが大事であって、
今回のタレコミも復旧に手間取っているのが問題なのだと思います。
Re:復旧の予行演習 (スコア:1)
代替関係にあるのではなく補完関係にあることを理解すること
から始めないと駄目なのでしょうね。
ファイアウォールがあれば、セキュリティホールのあるソフトウェア
を使っていても大丈夫と考えているようなもんだ。
Re:復旧の予行演習 (スコア:1)
フォルトトレランスとはちょっと違う気がします。
少なくとも RAIDカードの予備をもっておかないと
Availabilityは低下するはずですし。
>バックアップは
>代替関係にあるのではなく補完関係にあることを理解すること
>から始めないと駄目なのでしょうね。
おっしゃるとおりそのものの本質を理解しないと
結局データもお金ももどってこないってことになりそうですね。
Re:復旧の予行演習 (スコア:1)
こういう復旧などの作業しやすさを出来るだけ高める、ってことを
OSを設計する段階から考慮して設計して欲しいな、とは思いますね。
実用(?)OSなら尚更のこと。
Plan9(とかいうんだっけ?)みたいに、ディレクトリツリー構造自体が「仮想化」されているOSなら、
書き換えてしまったらバックアップしない限り復旧が難しい、などという下等な悩みは
かなり軽減されるのかな?と、素人的理解で思ったりします。
#あとはVMWareみたいなやりかたっすかね。というか広い意味でのディスク書き込みのジャーナリングつーかバージョニング。
Re:復旧の予行演習 (スコア:0)
これはApple ROM + システムフォ
Re:復旧の予行演習 (スコア:1)
私はどちらの方法も、リスキーな感じがして試したことがないです。(だからJaguerへのアップデートもクリーンインストールしなかった。)
Re:MacOS の場合 (スコア:0)
これって9.xまではそんな気がするけど、darwin
になってもそんな独自の仕組みを維持しているのだろうか?
我が家のWindows管理術 (スコア:2, おもしろおかしい)
#OS再インストールかよっ
Windowsの場合 (スコア:1)
インストールする順序(アンインストールする順序)も覚えておかないとDLLがぶつかり合ってすぐにHDDの再formatをする羽目に・・・ 特にプリインストールのWindowsに対してアンインストールする順序は大事だったりする。
# 特に 95 / 98 系。Me は知らん :-)
Re:Windowsの場合 (スコア:2, おもしろおかしい)
いやぁ,MeはWin98 Third Editionと見なしているので同じでしょう。
Re:Windowsの場合 (スコア:2, おもしろおかしい)
Re:Windowsの場合 (スコア:0)
# ひねりがないな
# 本当はMost Bugって言いたいのでAC
Re:Windowsの場合 (スコア:1)
>見なしているので同じでしょう。
Win98 Millennium Editionなんでは?
システム管理方法ですがWin98 SEよりもクソかったるくなっています。
メーカ品だとリカバリディスクがあるから簡単なのかな。
PCにECC Registeredメモリの利用を推奨します。
Re:Windowsの場合 (スコア:1)
でも、OSの入ってるドライブはあんまり気にしてません。
むしろたまには壊れてくれた方がディスクとOSのリプレースができて
有益かも、なんて罰当たりなことを言ってみるテスト。
Re:Windowsの場合 (スコア:0)
素のインストールCDから何かインストールする場合にはSP当て直しとか、
Option PackとかIEのインストールする順序とかいろいろ問題があったこと。
出したソフトがそういう順序の狂ったシステム上で動かなくて、
「頼むから別のPCに今から言う通りの順番でインストールして動かしてみてくれ。」
っていうのを何度となくやった。
一
メーカ製RAIDは危険・・・かも (スコア:2, 参考になる)
なので、ロットによる障害があった場合はみんな一斉に壊れます(^^;
実際、そういう目にあったという話は数人のCEさんに聞きました。
HDDが一台飛んだので、新しいディスクでsync中に別のHDDが死んだとかいう悲惨な場合もあったらしい。
sync中はアクセスがかなり多くなるので、死にかけたHDDにとどめを刺しちゃったようです(^^;
同一容量のHDDを使った製品を時期をずらして購入して、HDDを入れ替えるとかすればちょっとは安心かもしれません。
# まぁ、死ぬ時は死ぬんだが :-)
Re:メーカ製RAIDは危険・・・かも (スコア:1)
(しかも、以前の職場の同僚から聞いた(爆死))
というか、それってAS/400じゃないんですか?(^^;
さらに言えば、ロードソースがミラーリングの相手を含めて、同時に亡くなったのも経験あります(苦笑)
(何のためのバックアップなんだか....)
(_ _)ZZZZzzzzz...... I'm sleepy
Re:メーカ製RAIDは危険・・・かも (スコア:1)
やっぱりメーカ問わず良くある話のようですね(^^;
バージョン管理システムの場合 (スコア:2, 参考になる)
障害復旧といってもいろいろなレベルでの障害を考えなければキチンとした対策にはなりません。BitKeeperのようなバージョン管理システムの場合、たとえ計算機のhardwareやOSに問題がなくても、誤操作によりdatabaseがめちゃくちゃ(databaseそのものの破壊、あるいは誤ったfileの変更)になってしまう恐れがあります。
そういう意味ではRAIDだけじゃなくて、きちんと磁気tapeなども併用しておくべきでしょうね。
# FreeBSDでは少なくとも1回cvs repoが誤ったimportで使いものにならなくなったことがある
復旧するまでが障害管理では (スコア:1)
作ったりして、それに応じた対応をするでしょうが
もし、ダウンしている時間を短くする手法を
投稿主が尋ねているのであれば
「予めダウンの復旧対策を手順書にして事前確認する事が
商用ではやる事もあります。」というのが回答かな
でも、趣味のサーバは、例えば復旧対策として予備を
用意してあってもついつい他に流用するのでは
(本音)
うちのメインマシン (スコア:1)
まず、全パーティションext3fsで
40GBのRAID1 ミラーリング構成
定期的バックアップもかかさずに。
自分でコンパイルかける時は、
debにしてからインストールするので
もしもの場合、復旧時間は少ない。
電気代かかるのでUPSはないけども。
# 部屋のマシンですよ。
PCにECC Registeredメモリの利用を推奨します。
使うのをやめた、じゃないのか (スコア:1)
#あるいはこのまま復旧しなかったりなんかしちゃったりして?
やめさせられない腹いせに落としたんだったりして(w (スコア:0, 荒らし)
Re:やめさせられない腹いせに落としたんだったりして( (スコア:0)
Re:やめさせられない腹いせに落としたんだったりして( (スコア:0, フレームのもと)
いや、理由を「理解(正確には推測だが)」するのは簡単です。
問題はそれが「賛同」し難いものである場合であって…
「少しでも」煽り風味があると速攻でマイナスモデする急進派が
Re:やめさせられない腹いせに落としたんだったりして( (スコア:0)
「フレームの元」ならともかく「オフトピック」だからなあ。
自宅のサーバーと作業用マシンは~ (スコア:0)
作業中にディスクが飛んで泣きながら復旧した経緯があるので(T-T)
でも、買った当時はUPS高かったので...お財布が~
そういえば、会社の作業用マシンとかをUPSorディスク二重化出来てる
裕福な会社ってどれぐらいあるんでしょう?(^^;;
まぁ~今の会社はCVS使ってるから最悪ソースは飛ばないんですけどねぇ(笑)
Re:自宅のサーバーと作業用マシンは~ (スコア:1)
リポジトリがぶっ飛ぶ罠
いや。先日、バックアップジョブが走ってない事に気が付いて青くなったので。。。
# /etc も突っ込んであるけど、これって復帰できるものなのだろうか。。。 ←やった事ない人
しかし、個人でUPSはうらやましい。。。
wild wild computing
Re:自宅のサーバーと作業用マシンは~ (スコア:0)
>>リポジトリがぶっ飛ぶ罠
ははは(^^;;アセ
それがあるので職場のCVSサーバは(RAIDでは無い)ソフトバックアップで三重化&何世代か残してます。
一応最悪数分前までは戻れる状態。
>しかし、個人でUPSはうらやましい。。。
私が4年
Re:自宅のサーバーと作業用マシンは~ (スコア:0)
# というかみんなバックアップしてない…。
学校の卒論で使ってる作業用マシンはなぜかRAID1(SCSI)です。
かつて何かのサーバに使っていたマシンだった模様。
家のファイルサーバはSoftWare RAID5(IDE)です。快適。
# RAID0 が AID なら SCSI RAID は RAD なのでAC
Re:自宅のサーバーと作業用マシンは~ (スコア:0)
> 裕福な会社ってどれぐらいあるんでしょう?(^^;;
会社の作業マシンは8割方UPS実装されてます。
#ノートってオチなんですけどね。
一番重要なサーバー類がUPSもないし二重化もされてなかったりする。
True distributed system (スコア:0)
を見ると。BitKeeperにしておけばこのような時でも安心で、
BitKeeperを使うことこそが対策と言っとるように見えます。
#リポジトリ一個なんてoldtypeだね!