dancemanの日記: 20TBのデータ、どうやってバックアップをとる? 160
日記 by
danceman
本家/.記事「How Do You Backup 20TB of Data?」より
私の友達が最近、ホームサーバ上のRAIDアレーを消去してしまい音楽と映画のコレクションを全て失ってしまった。家のラックには20TB分のデータが保存されており、過去に発生した数々のドライブ障害にも耐え抜いてきた。だがこれほどの大量のデータをバックアップする良い方法が見つからず、そのまま一度もバックアップをとることはなかった。そして今、彼はバックアップすれば良かったと後悔している。
周囲のテクノロジーに詳しい友人らに尋ねたが、「あなただったら20TB分のデータをどうやってバックアップする?」という問いに対する良い回答は得られなかった。外部ドライブに接続すればいいというものでもなく、クラウドサービスを使えば途方もなくお金がかかってしまう。ブルーレイディスクは大量のデータを保存することができるが、実際にほとんど使うこともないようなディスクを焼くのに膨大な時間(とお金)がかかってしまう。もう一つの方法としてテープドライブがあるが、このような問題を解決するのに適しているのだろうか?私は分からない。他の方法があるのかもしれないが、私は未だに実行可能な解決策を見つけられないでいる。
そこで皆さんにお尋ねしたい。ホームユーザーの場合、どのようにして20TB分のデータのバックアップをとればいいだろうか。
6TBのハードディスク4台でバックアップ可 (スコア:5, すばらしい洞察)
外付けのリムーバブルメディア感覚で扱えば良い。
でもRAIDアレイの消費電力や飛んだ時のダメージを考えるとホームサーバで20TBを常時使用するスタイルを見直した方が良いと思う。
Re:6TBのハードディスク4台でバックアップ可 (スコア:5, 参考になる)
ハードディスクをそのまま脱着して使える外付けユニットやベイアダプタがあり、ホットスワップにも対応していてまるで大容量のメディアみたいに使いたくなりますがそうやって保存するべきではありません。
# と気づくまでに数十のドライブを溜め込んだアカウントが以下略
販売時のドライブは乾燥剤を封入した袋に密閉されています。一般的なドライブは密閉構造になっていないので、稼動状態から電源を落とすと内部の空気が冷却されつつ収縮してわずかながら外気を吸入することになります。毎日起動するなら作動熱で再び乾燥することでしょうが、このまま保管すると(購入時よりは)内部湿度の高い状態が保持されることになります。この条件の違いにより一度開封使用したドライブはデータ保存に向かないのだと思います。
ハードディスクをバックアップに使うなら、別のコメントにある通り、NASを二つに分けてミラーする方法が正解だと思います。
Re:6TBのハードディスク4台でバックアップ可 (スコア:4, 参考になる)
だとすると、元コメの6TBのやつを使うってのが正しいんだね(ヘリウム入りで密閉されてるはず)
Re:6TBのハードディスク4台でバックアップ可 (スコア:3, 参考になる)
活性挿抜可能なHDDバックアップ装置として、imation RDX [imation.co.jp]って専用機が出てるんだよね。
使ったことは無いんだけど、どうなんだろうね?
Re:6TBのハードディスク4台でバックアップ可 (スコア:3)
Re:6TBのハードディスク4台でバックアップ可 (スコア:1)
普通に防湿庫使えばいいんじゃないの?
# と言いつつ, ディスク用ジュラルミンケースに乾燥剤入れておくぐらいで運用してますが
それより, 実際問題としてはバックアップにかかる時間の方が問題ですね. 通常のSATAディスクだと, 実質的な転送速度は100MB/sec+α程度. 内外周の速度差や各種処理のオーバーヘッドも考慮すると60〜80MB/sec. 1TBをバックアップするのに3〜4時間. 20TBであれば3ないし4日ぐらい連続で行なうことになります.
複数台のディスクに並列でバックアップすれば速度を上げることができるかもしれませんが, そのためにはあらかじめバックアップ対象を論理的に分割しておく必要があります. それに書き出し側の速度が上がっても, バックアップ対象のRAIDコントローラの処理速度やシステムのバス帯域がネックになって, 思うように速度が上がらない可能性もあります.
ですから, 数TB以上のデータストレージを運用するのであれば, 当初からバックアップ計画を設計して, それに合わせてストレージを構成しないと回らないでしょう.
Re:6TBのハードディスク4台でバックアップ可 (スコア:1, 参考になる)
Googleが大量に使用しているHDDの故障率の分析 [srad.jp]
「アクセス頻度と故障率に有意な関連性はなかった」そうです。
Re:6TBのハードディスク4台でバックアップ可 (スコア:2)
ここで言っているのは通電頻度のことです。
回り始めが一番故障しやすい。回りっぱなしなら何年でも耐える、はよくあること。
アレイにしない。 (スコア:5, すばらしい洞察)
何も1本のデータが20TBあるわけじゃないんでしょ。
アレイにしなければHDD1本死んだら1本分のデータが失われるだけ。全滅はしない。
下手にアレイにするから全滅する。
で、データに優先順位つけて重要なのだけバックアップ。
どーせ生きている間に全部見れないよ。
Re:アレイにしない。 (スコア:2, すばらしい洞察)
コレクターの心理に目を向けて下さい。
食べれない茶碗を集めることが楽しいのです。
食べれない茶碗でも手元においてある安心感がいいのです。
Re:アレイにしない。 (スコア:1)
Re:アレイにしない。 (スコア:1)
LVMでRAID 1/5/6が可能。
ZFSでもいいね。
目を閉じて (スコア:5, おもしろおかしい)
思い出せば今でも鮮明に思い出せ・・・ない・・・
20TB分のデータを見聞きする時間があるのか (スコア:4, すばらしい洞察)
いつか見ようと録画ビデオを100本ほど採っておいたんですが、
いつの間にかデジタル、DVDの時代になり、再生されることもなく、全て廃却になりました。
最近は、残りの人生でもう一度見る機会があるかどうかを考えてBDに焼いています。
ほとんどはHDDに録画して、一期一会という事で、一回見たら消去です。
Re:20TB分のデータを見聞きする時間があるのか (スコア:1)
容量が足りなりそうになったら使わない順にファイルが消されて容量が再利用されるファイルシステムとかがあったら楽ちんだな。
まず整理するべき (スコア:4, すばらしい洞察)
20TB音楽や映像なら、ジャンル分けすれば1ジャンル3TBにもなるかどうか。
ジャンルごとにHDDなりBDなりにバックアップすればいいだけだとおもうのですが。
20TBまるごとであることにこだわる意味はあるのでしょうか?
ψアレゲな事を真面目にやることこそアレゲだと思う。
Re:まず整理するべき (スコア:1)
おっしゃることはもっともだけど、
分類しても、各ジャンルそれぞれが増えていくのであるタイミングでトータルバックアップを採らなければならず、
要は分類の手間が増えるだけなんだよね。20TBにもなってしまったら人力で分類するのはほぼ不可能だと思う。
自分はまぁ20TBも持ってないけど、分類する几帳面さもないので、オリジナルも(物理的に圧縮して)保存していて、
オリジナルがないものは壊れたら諦めるという戦略をとっている。
LTO-6で盛り上がる本家 (スコア:3)
テープドライブ高い…
Re:LTO-6で盛り上がる本家 (スコア:3)
定期的な巻き直しが必要とか湿度管理とか、オートローダみたいなのはさらに高いし。
保存しといて死ぬ確率が低いというのは気になるんですけどねー…
# SCSI/SASばっかりで困る、というコメントに「SATAのコマンドセットにREWINDとかないだろ」ってのがあって吹く
日数だけ決めてドライブを買って行く (スコア:2)
バックアップ用に、定期的にHDDを購入するだけでいいんじゃないかな?
たとえば、毎年一回、その年に保存したいだけのHDDを購入。
少しずつコピーして行く。
それは、2014年のバックアップとして保存。以下、同様
毎年、5台ずつぐらいドライブが増えても、たいした場所は食わないと思う。
10年ぐらいしたら、古いのから捨てていけばいい。
かけられるお金とデータの大事さで、サイクルは決めればいいです。
寝た子を起こすな (スコア:2, 参考になる)
本文にも書かれているけど、ドライブ障害は耐えてきたわけで。
明言されてないけど操作を間違って消しちゃったんだよね?
問題はバックアップではなくて、動いてるシステムを触るなってことじゃないかと。
SEやCEで15年の経験から考えても、データロストの比率が一番大きいのは操作系。次がドライブ。アレイコントローラ異常で吹っ飛んだのは1回しかないし、それは復旧できた。
そして操作系でもっとも比率が高いのは、バックアップや整理で元データを確認せずに消しちゃった、というもの。
触らないですむなら触らないことが一番だと思うし、触るならもっとも単純な方法を選ぶべきじゃないかな。
予算があるなら,新しいマシンにコピー運用,元のシステムは動態保存が間違いない。 (スコア:3)
経理のPCの移行作業をしたが,まさにそれに尽きる。マジで大切なデータは弄らないこと。
昔似た様なのがあったような。 (スコア:1)
http://srad.jp/poll/562 [srad.jp]
Re:昔似た様なのがあったような。 (スコア:1)
冗長化 (スコア:1)
違法じゃないなら原本もあるんでしょ?
ならそもそも消えたデータというのがバックアップであって、
それをさらにバックアップを取ろうというのはちょっとおかしくない?
#マジレスすると「同じシステムを2個用意する」以上に良い方法は無いよ
Re:冗長化 (スコア:1)
アナログテレビ放送のノンリニア録画では?
2000年頃にATIのテレビチューナーカード積んだWindows98SEマシンでテレビCMとか録画して喜んでたけど、当時アナログ放送をデジタル録画することには何のお咎めも制限も無かったし。
…もっとも当時のデータはZipドライブでバックアップとってたらドライブが腐ってディスクを次々に破壊してくれたのでCD-Rに保存していた一部しか残ってないけどさ。
# 爆言のち漏電中… :D
Re:冗長化 (スコア:2, すばらしい洞察)
本家ならアナログ放送に限定する必要はないよ。無料放送にまでコピープロテクトかけてるどっかの国と一緒にすんな。
山のような… (スコア:1)
はい、βとかVHSとかFDとかMDとかMOとかCR/DVD/-Rとか
メディアの入ったダンボールが…(走召糸色木亥火暴)
古い~ぃ ダンボールを開けるとぉ~♪
かぁくれてぇ~ おもいでがぁいぃっぱぁい~♪
#知人達にMadMadTapeと呼ばれています
"castigat ridendo mores" "Saxum volutum non obducitur musco"
Re:冗長化 (スコア:1)
レンタルなら返却したらバックアップは破棄しないと…
仕分けしろ (スコア:1)
2chなどで見かけるダウンロードしたエロ動画を捨てられない人と同じだな。
俺の親しい友達にも一人いて、レンタルDVDなどのイメージデータが毎月1TBずつ増えて、毎月1台ずつ外付けハードディスクが増えていってた。
しかし、ある時、ふと思い立ってDVDに焼き直す作業をするようになったが、この作業が彼の価値観と生活を変えた。
つまらない内容のものはタイトルと感想だけをメモってデータとDVDを削除、少し気に入ったものはDVDだけ残す、お気に入りは複数のHDDとDVDに厳重に保管するようになった。
本人によると、部屋も心もすっきりしたらしい。
Re:仕分けしろ (スコア:1)
てか、エロ画像に限らず、二度見ることがほとんどないケースも多かろう。
…と考えると、
とかでいいんじゃなかろうか。
そんな時こそ『復旧』 (スコア:1)
日本データテクノロジー(OGID 株式会社) をよろしく!
1秒でも早く、1つでも多くのデータを最も安全に復旧します!!
2006年~2013年 8年連続復旧実績No.1 (第三者調査機関調べ)
日本最大級のデータ復旧センター
20TBだと、料金は200万円超は確実かな~
でも、1台1~2万もするHDDを何台も買ってきて、2~3日かけてHDDを取り替えながらコピーするのは面倒くさいから、合理的だよね!
Re:そんな時こそ『復旧』 (スコア:1)
日本データテクノロジー(OGID 株式会社) 最高!! #お金ください #振込待ってます
データ用のアレイを割る (スコア:1)
パーティション切って片方を普段使い。もう一方にバックアップ。
アレイ自体のの可用性はRAID6あたりにして確保。
ドライブを放置することもないからそれが原因の故障も防げる。
使われてるOSがかかれてないけど (スコア:1)
しょうがないから、GNU/LinuxもしくはBSD系のOSだろうと仮定します。
Dar [linux.free.fr]と言うバックアップツールがあります。
使い方とか:http://www.miloweb.net/dar.html [miloweb.net]
動画とか音楽が中心なら専ら無圧縮モードを使って、
・数カ月に一回程度フルバックアップ
・毎日・もしくは三日おき程度に差分バックアップ
・フルバックアップと前後して以前のフルバックアップと差分を消去する
こういう感じでcrontabでスケジュールを組んでやれば…勿論バックアップを取る時のディレクトリの分割の仕方とか大事ですが…、いざ吹っ飛んだ時にフルバックアップの結果と差分データが生きていれば、最後にバックアップ取った程度まで巻き戻せる。
このケースならばアクセス頻度が低くて通信速度も低速で良いHDDが、多分総計で45TB位必要になりますが(lvmの類を使えば別にRaidにしなくてもよい)、一個のアーカイブファイルのサイズを適切に設定すれば、BD-Rなどに効率よく書き込むことも可能ですので、ここまでフルバックアップの頻度を上げる必要がないかも知れない(でも、二層のディスクで200枚って地獄ではありますが)。
しかし、20TB…フルバックアップに何日かかるのやら(;´Д`)
SnapRAIDに注目 (スコア:1)
最近では大量の動画データ等、比較的低頻度に更新される家庭データのバックアップ方法としてSnapRAIDに注目しています。
あれこれ試してから実戦投入しようと思っていますが、既に利用されている方おられますかね?
論点がずれるけど (スコア:1)
バックアップよりも二重化 (スコア:1)
うちの10TBのホームサーバーでは、 (スコア:1)
うちには10TBの共有フォルダを持ったホームサーバがあります。
バックアップ先がないので、結局コピー先としてもう一台ホームサーバを用意し、
共有フォルダの差分コピーをしています。
うちの10TBのホームサーバーでは (スコア:1)
うちの10TBのWindowsホームサーバーでも、バックアップの問題にぶち当たりました。
・リムーバルメディア
・USBハードディスク
上記への分割バックアップは、つきの理由で選択しませんでした。
・自動化できない。
・一共有フォルダで3TBを越えるものがあるため、単純コピーなら、細分化が必要。
・分割バックアップソフトで次の媒体を要求されるまでの時間が長く手間が多い。
結局、バックアップ先として、もう一台のホームサーバーを用意して、単純に共有フォルダ間のファイルコピーや同期を行うようにしました。
データを整理して量を減らすのがよいですが、整理にかける時間のわりに容量が減らないので、
ちまちま時間をみて不要データの削除はしつつ
バックアップはこんなかたちに落ち着きました。
自分の失敗談 (スコア:1)
自分の場合、OS入替の際にバックアップをとってからフォーマットしたつもりだったのが、
他のHDDに用意したバックアップフォルダ内にファイルは存在せずもぬけの空、
気づいた時には元データ入りのHDDはフォーマット済みだった……てなことがありました。
あの時はかなりへこんだ……10年くらい前の話。
Re:Amazon Glacier 使えば? (スコア:2)
容量は一応それでいいのかもしれませんが、転送時間の問題が。
Flet's光の上り最大速度100Mbpsで換算すると、20TB転送するのに19.4日かかるみたい。
最大速度なんてなかなか出ませんから、まぁ…… がまんしますかね。
人生は七転び八起き、一日は早寝早起き
Re:Amazon Glacier 使えば? (スコア:1)
別に毎回バックアップする必要もないですし、最初の書き込みにのんびり数カ月かけてその後は数日に一回くらい差分バックアップ→年に一回程度リフレッシュ
と言うのが王道な考え方の気がしますけどね。
まぁ、向こうを仮想の物理ドライブだということにして、その上に書き込みしたら追記されて、特定のコマンド以外ではファイル実体が消されないようなファイルシステムを構築し、更にそのファイルシステムを(SAMBAやNFSのように)こちら側にマウントして、こちら側とミラーリングが出来ると楽だし完璧なんですが…
# nilfs [sourceforge.net]とかそういう使い方出来た気がする。
Re:ミラーリング&HDD交換 (スコア:1)
片方外してから替えの同期が完了するまでは単発ドライブになっちまう。
3台以上でRAID1したとしても、外した瞬間の状態がわからんから外したドライブのファイルシステムがまともな状態かどうかもわからん。
そもそもそれはRAID1前提だが20TをRAID1でか?
Re:ミラーリング&HDD交換 (スコア:1)
二台だとシャットダウン状態では交換が完了しないけどね。
Re:ミラーリング&HDD交換 (スコア:1)
予約録画の時間帯による、ってことじゃないですかね。このストーリーの場合。
リモートドライブ化+ローカルでの暗号化(Re:36Tまで無料のクラウドサービス (スコア:1)
出来るかどうかわからないですが、このクラウドへの読書きがFuse(WindowsやMacならば相当品)のようなもの経由で仮想のドライブとして設定できるなら、
#2563868で書いたdar [srad.jp]で作ったバックアップデータを、自分の側での暗号化パイプや暗号化ファイルシステムを通して、クラウド上に構築した仮想のファイルシステムを読み書きすると言う方法がありそうですね。
これならば、著作権法上のリスクをかなり排除できます。
暗号の秘密鍵自体は、専用のSDカードとかUSBメモリにいれておいてリードオンリーでマウントしておくとか、別個にバックアップを取っておけば完璧。(秘密鍵にそんな真似するなというのは正論だけど野暮チック)
Re:放流すれば良い (スコア:1)
欲しい物をすぐに手に入れられないのなら意味ないよね。
残る問題は、欲しくなるかどうか、だよね。
一度は観るだろうけど、二度目があるかどうか。
所有している気分になるだけで良ければ、Winnyに放流&ハッシュのみを保存で十分な気がするね。
Re:再入手可能ならバックアップなど不要 (スコア:1)
>際に視聴したくなった時にまた買えばいいだけ
マイナーなモノなら特に、また手に入る保証もない。
メジャーなモノでも、デジタルリマスター版と称して彩度あげて色遣いがサイケデリックになり声優も変わってしまったりする。
#DVD版ガンダム見て「こりゃひでぇ」としか思えなかった。
Re:ポータブルHDDへのバックアップ (スコア:1)