500ギガ記録媒体新規格を開発 24
ストーリー by wakatono
2年後に陳腐化してないことを祈ろう 部門より
2年後に陳腐化してないことを祈ろう 部門より
strawberry 曰く,"ソニーが”テープストリーマー”という名の新規格を開発したとの記事を発見。高性能のデータ記録用テープで、非圧縮時で500ギガバイトの容量とのこと。 2003年までに生産を始める予定だそうだ。速度とか気になるところだけど、こりゃすごい。"
確かにすごいわ。こうなると懸念事項はコストと時期。コストはまだわからないけど、時期が2003年からってのは…チト遅くないかい?
ストリーマ =~ 磁気テープ、使い方によっては... (スコア:4, 参考になる)
一瞬びっくりしてしまったが、元記事を読んで納得。ストリーマとは磁気テープ一般の別の呼び名です(確か小学生のころにそう聞いた)。磁気テープの下位概念ではありませんので。
で、大容量にできることが単純にうれしいかというとよく分かりません。逆にsingle point of failureになってしまっては、バックアップメディアとしては失格ですよね。これを避けるにはマガジンなどにメディアを複数放り込んでマルチトラックもどきにする手でしょう(今と変わらん)。
ちなみに、とある大規模システム(お金を扱うところ)を見学しに行った時に知ったのですが、なにせ相手がお金なので、バックアップを毎日とった後、全国3か所程度に分散保管するそうです。内容が内容ですから、ガードマンつきの輸送車は必須。こういうところで使うことを考えると、テープの容量が大きくなってデータ量あたりの容積が小さくなっても直接御利益にはならなさそうです。
本当の問題は (スコア:3, 興味深い)
データ転送速度です. 実際このストリーマを使うようなシステムでは容易にサービスを停止することは出来ないでしょうから, たとえディスクを三重化してあったとしても, 一回のバックアップにかけることのできる時間は1~2時間程度になるのではないかと思われます. この場合, 例えばSCSI160の最高速度160MB/secが出せたとしても500GBをセーブするには1時間弱かかる計算になります.
現在の運用ではこの様な速度を得ることは難しいので, バックアップ対象をうまく分割して複数のストリーマで平行してバックアップしたり, 更新分のみが分割して取り扱えるようにディスク上の配置を工夫したりするのですが, 十分な速度が得られれば, こういった部分の設計の手間がかなり少なくなるはずです.
Re:本当の問題は (スコア:2)
NAS装置自体が安いし、スピードも出るので、通常バックアップはNASにしておいて、NASのローカルでフルバックアップをとるという流れが出てくるのかな?
Re:本当の問題は (スコア:1)
+1セット予備のを用意しておいて、日に一回、使ってたディスクを予備と交換してバックアップする、とかいう面倒なことはダメなのかなあ。
あと、質問。
ジャーナリングのログとか、ログ専門にテープに取るとかいうことは、できないのかなあ。
磁気テープでないとできないこと (スコア:3, 興味深い)
HDDによるバックアップでは不可能なこととして、データのレプリカ(複製)を輸送することがあります。レプリカの輸送は、例えば地域分散させる必要があるバックアップや、オリジナルのデータベースへのアクセスが難しい場合に行います。輸送中の振動などを考えると、可動部分があるメディアは真っ先に対象外になりますね。
前者はお金が絡むデータなど、後者は例えばNACSIS(現NII)が持っている大学図書館の目録データを各大学等に配布するために行っていました(今は一部についてはオンラインでもできるようになったけど)。
journaling (スコア:2, 興味深い)
logだけをそのまま記録していくとあまりにも冗長すぎるようになっていくのでリストアに手間取るようになっていく事は想像に難くありません。
復旧時間の見積もり (スコア:2, 参考になる)
>ジャーナリングのログとか、ログ専門にテープに取るとかいうことは、できないのかなあ
もちろんそれが普通なんですが, あるレベルを超えるとですね... 以前1TByte程度のデータベースを設計したとき, 半年に1回のフルバックアップと月一の部分バックアップ, それに日に3回のログバックアップで最悪ケースの傷害が発生した場合の復旧時間を見積もったら, データの戻しとログの適応で1週間かかる計算になったなんてことが有りました.
この時は部分バックアップの周期を短くしたり, バックアップ装置に当時最速だったDLTチェンジャを複数台導入するとかで半日で復旧できるような設計に変更して切り抜けましたが. いずれにせよ実際のシステムでは, 最悪どの程度までシステムが止まっていていいのかを考慮しないと構成は決まらないですね.
Re:本当の問題は (スコア:1)
full dump -> (更新時刻を見ての)差分 -> 差分 -> 差分 -> full dump -> 差分 ・・・
なんて感じで、保存するデータ量を削減するもんですがね。
#それに、データが頻繁に更新される時間にバックアップとっても
#あんまり意味ないし・・・。
#通常の会社なら、夜中に自動で流すでしょうね。
>+1セット予備のを用意しておいて、日に一回、使ってたディスクを
>予備と交換してバックアップする、とかいう面倒なことはダメなのかなあ。
うーん・・・、予算によってはそれもありでしょうけど、
1Tbyteのディスク(ホットスワップ可能なディスク10台とか?)
総入れ換え、なんてのの手間自体を考えてみれば
異種媒体へのバックアップの方が安上がりで危険が少なくないですかね?
それでなくても、モータや機械部分の多いディスクデバイスってのは
動態保存に気を使いますし・・・。
バックアップって事であれば、効率的な差分を特定のディスクに
吐き出すにしても、大元を保管しておくのにシステム全体と
同じだけのディスク機器がシステム以外にもう一組必要ですよね?
それ以外に差分データを保管して・・・って、そんなら
その分のディスクをシステムに追加した方がずっといいような気がしません(苦笑)?
#バックアップは大変だけど、使えるディスク容量、確実に倍以上だし(笑)。
それに、テープのような取り外しのきくデバイスなら、
コストにもよりますが、とっておいたバックアップを数世代くらい
保管して、そのものズバリの過去データをとっておくことも
可能ですよね。
#・・・システムクラッシュして、しかも一世代前のバックアップ失敗で、
#古くても仕方ないからニ世代前のデータから必要なものをとってくるとか、
#操作ミスで必要なファイルを消したとき、至近のバックアップから書き戻し、
#なんてこともできますし・・・。
ディスク一組の使い回しでは、バックアップ内容は一回一回書き直しですよね?
・・・あ、+1組じゃローテーション出来ねぇな(汗)。
#後、頻繁に読み書きされるバックアップ用ディスクの寿命も怖いな・・・。
差分バックアップはちょっと気の利いたシステムなら標準搭載ですが、
ジャーナリングという言葉がなにについてのなにを指しているか
分かりませんでした(汗)、のでノーコメント。
---- redbrick
Re:本当の問題は (スコア:2, 興味深い)
フルバックアップしか考えてなかったです.
(差分でもいけるかも)
アホ話を続けます.(今度はもうちょっと分かりやすく)
ディスク(セット),A, B, C と予備 D を用意します.
バックアップの時間がきました.
A と D を入れ替えます.(B, C, D で運用)
A をテープにバックアップします.
また,バックアップの時間です.
B と A を入れ替えます.(C, D, A で運用)
B をテープにバックアップします.
あとは繰り返しです.
気付けば,運用の話でした.
ソフト的に出来たらいいかなーなんて.
# 金持ち仕様には変わりない.
それから,
ジャーナリングのログというヤツです.
これは,ジャーナリングファイルシステムのログの意味で使用しました.
ログなんて,復旧時にしか使わないのだから(暴言か?),保存先がテープでもいいのかと思いました.
RAID のパリティの保存先とか.
#11 で SAY さんが書いてあるとおり,リストアに手間ばかりかかってダメかも.
うーん,あと一工夫(ホントか?).
バックアップ運用体制? (スコア:1)
わたし理解してませんでした(汗)。
で、下記の説明ではっきり分かりました、が
ちょっとだけ分からない点が・・(汗)、
>アホ話を続けます.(今度はもうちょっと分かりやすく)
>ディスク(セット),A, B, C と予備 D を用意します.
>バックアップの時間がきました.
>A と D を入れ替えます.(B, C, D で運用)
>A をテープにバックアップします.
>また,バックアップの時間です.
>B と A を入れ替えます.(C, D, A で運用)
>B をテープにバックアップします.
>あとは繰り返しです.
これって、本体以外の場所にミラーディスクを作って、
同期を一日一回だけって限って、ミラー側で一日かけてバックアップ、
って運用で現時点でも実現できませんかね?
#この時点で、本体の冗長化は適宜行う前提で考えてます。
ディスクの差し替えなんて危険度の高いことしなくても、
もっと安全な、ネットワーク経由などでミラーした方が
いいんではないですかね?
#専用のバックアップ用ネットワーク環境を組んでもいいくらいの
#予算があれば、もっと贅沢だけど、帯域全部を使えるので
#より安全ですけどね(苦笑)。
---- redbrick
Re:バックアップ運用体制? (スコア:1)
というかとあるところでやったことあります。
それでもやっぱりバックアップ速度は重要ですね。
SCSI規格自体は160MB/sくらい出るかもしれませんが
テープの書き込みはまだそこまでは行っていませんよね。
この方法でもバックアップ時間が24時間越えたらアウトですからね。
Re:バックアップ運用体制? (スコア:1)
できるのはミラーディスクを一日一回同期って方法です。
ストリーマをRAID0 (スコア:0)
Re:ストリーマをRAID0 (スコア:2)
バックアップってのは、基本的には取るだけでレストアしないものであるべきで、バックアップからレストアするというのは、異常事態に確実にデータが取り戻せる事が要求される。
ストライピングしちゃうと、そのバックアップ媒体の信頼性は、単純計算でストリーマ単体の半分に落ちちゃう。
元々ストリーマとかの接触型の媒体は、HDDや光系などの非接触型の媒体よりも信頼性を上げ難い。
昔のテープなんかは、記録密度も低かったので、それだけエラー率も低かったけど、500Gとか記録密度が上がってくると、それだけ信頼性の確保と言うのは難しくなってくる。
そういう事を考え合わせると、信頼性を下げるストライピングという手法をバックアップ媒体に使用するというのはかなり気持ち悪いなぁ...
500Gかぁ (スコア:2)
Re:500Gかぁ (スコア:2, 興味深い)
現状で、小型RAID(コンシューマ向けのではないですが)でも1台500Gとか存在するので。
個人で買えるように (スコア:1)
装置が 10万円、メディアが 1万円くらいにならないかなあ。
少なくとも、装置が 20万円台じゃないと、私の勤め先では買わない(買えない)です。
# うちの会社って、バックアップはどうしてるのだろう?
Re:個人で買えるように (スコア:2)
非圧縮50GBのテープ1本が1万円くらいです。
定価じゃなくて市場価格。
オートローダーつけると、値段跳ね上がります。
圧縮すれば130GBくらいです。
ちなみに100GBバックアップするのに2時間掛かります。
Re:個人で買えるように (スコア:2)
ま、読み出すデータベースの種類によっても、バックアップ時間はかわるようですが。
AITってDLTに比べて信頼性ってどうなんでしょうかね。DLTのライブラリはメカを一度壊したことがあるし、DLTテープをかましてしまい装置の交換をやったこともある!
テープがひところの16000円が1万円ぐらいに下がっているようだけど、寿命を考えると、高い!でも、入っているデータを考えれば、安いもんだけどね。
故障原因 (スコア:1)
一般的に、DLTはメカの故障、AITやDDSはヘッドの摩耗が多いようです。
ほこりが原因(っぽい)というのは、テープデバイス全般に多いようです。
テラバイトの次の単位か... (スコア:1)
すずきひろのぶ
Re:テラバイトの次の単位か... (スコア:2)
Re:テラバイトの次の単位か... (スコア:1)
すずきひろのぶ
Re:テラバイトの次の単位か... (スコア:2)
最大11.2PB
フル実装のヤツを一台と言っても良いものかどうか謎ですが