dancemanの日記: Vinton Cerf氏が懸念、今あるデータが将来読めなくなってしまう 90
日記 by
danceman
「インターネットの父」の1人として知られるVinton Cerf氏が、今日作成されたデジタル・データが将来読めなくなると警告している(本家/.、Computer World生地より)。
Cerf氏は、MacintoshでMicorosoft Office 2011を使っているのだそうだが、PowerPoint 97のファイルが読めないのだという。「Microsoftを責めているのではない」と前置きしたうえで、「過去に遡って互換性を非常に長い期間保ち続けることはとても難しい」と述べている。ディスクが手元に残っていたとしても、ディスクを理解できなくなっているかもしれないとのこと。
氏は、書写のために動物の皮を加工してつくられ1000年以上も保存されてきたベラム紙の名前をとり「デジタル・ベラム」を提唱している。データを断片的に保存するだけでなく、解釈も保存できるデジタルベラムが必要なのだという。
エミュレータの提供 (スコア:3)
古いコンピュータのエミュレータがクラウドサービスで提供されるといいですね。
昔書いたIRIX用のコードを動かしてみたいけど環境がありません。
ソフトウェアの著作権も50年で切れるのでしょうか。
ライセンス契約だとダメなのかな。
Re:エミュレータの提供 (スコア:1)
機能はエミュレート可能でも、記憶媒体の読み込みは無理なんじゃないかなあ・・・
と思ったら媒体が紙(手打ち)なのですね。
やっぱり紙最強か。
Re:エミュレータの提供 (スコア:2)
媒体が 紙(手打ち)
「パンチカード」が思い浮かぶ化石脳
なんというか・・・ (スコア:2, 興味深い)
そんなことは昔から言われてますよ
そろそろFD資産は物理的に不可能なものも多いでしょうし、IDEなにそれおいしいの?とかももう出てきてるんじゃないですかね。
そもそも初期のHFSに保存されているデータは読みだしたらファイル壊れる可能性もあるんじゃないかな・・・
#2000年問題とかw
結局のところ、(中身が)Text(Only)以外の文書は読みだすのが難しいと思いますよ。
#万が一のために設計書をつけといても、それを(物理的に)読めるかも問題なんですよね~
#現在の磁気ディスクが生き残っているとは限らないし、SSDとかも違うものになってるかもしれないしね
Re:なんというか・・・ (スコア:2, すばらしい洞察)
全く同感。ビデオテープ全盛期に、
"「コピー防止」という理由でアナログAV端子が廃止される"ということを誰が一人でも想像したのだろうか。
Re:なんというか・・・ (スコア:1)
コピーガード信号入れてたビデオテープとかってどないなったんやろ。
#捨てるだけ?
Re: (スコア:0)
テキストオンリーだとしても、文字コードも変わる可能性もあればフォーマットもメディアも変わってしまう事は有り得る訳で。
結局は、「常に最新環境にコンバートし続ける」しかないのじゃないかな。
Re: (スコア:0)
MFSは知らんがHFSはHFS+と同様に2040年までは大丈夫なはず。
あと「2000年問題」はデータを処理する際の(データ間、データ内の)整合性がとれなくなるっていう論理的な話であって、すでにあるファイルが壊れるとかの物理的な問題ではないと思うのだが。もちろん問題が出たあとに書き込まれたファイルは(論理的に)壊れるかもしれんが。(プログラム的には壊れているが、ファイルシステム的には正常なファイル)
ファイルを読み出す程度ならタイムスタンプがおかしくなる程度で、ファイルの内容には影響しないでしょ。
ドライバが腐ってでもいない限り。
Re: (スコア:0)
IDEと言っている時点で既に会話が通用していない可能性もある。
# なんで開発基盤が関係あるの~って人とか
Re: (スコア:0)
IDEはSATAとかSCSIみたいな接続の規格ですよ・・・
こうやってデータは読めなくなるんですね・・・
科学的楽観主義 (スコア:2)
そこまで技術が進歩しないのであれば、そっちの方が大問題だから何とかしないといかん。過去のデータを頑張って読もうとかしてる場合じゃない。
Re:科学的楽観主義 (スコア:1)
『翠星のガルガンティア』の9話でチェインバーがやってたな。
Re:科学的楽観主義 (スコア:2)
つまり、杉田智和をファンガイア化させるか、サイボーグ化させるか、長門の部屋で寝かせて保存するか、ボーカロイドで商品化する必要があるということですね。
ボーカロイドが動作するOSがなくなったらどうしよう…
フォントも問題 (スコア:2)
昔つくったPSファイルで今でも持ってる(読める)けど、MacSEで生成したPSファイルでOsakaフォントを使ってたりするので、果たしてこれはもうゴミかも?と思ったりします。
逆に (スコア:1, 興味深い)
昔のデータって、あまり暗号化とかパスワードに気を使ってなくて、力技で読めちゃうわけです。
(ファイルシステムが違ってるなんてのはどうしようもないですが)
今は誰でも暗号化やパスワードかけますから、そういうデータを将来復元できないのはもう仕方ないのでは。
気になるのはDRMですよね。 読めなくするのが目的の機能だから、出した側がサポートやめればもう尋常な方法では読み出せない。
文化は企業とともに消え去る運命。
Re: (スコア:0)
いや、そっちよりもメディアの風化の問題ではないかと?
Re: (スコア:0)
なんか話題の趣旨からだいぶ脱線したところを走ってるね、君
ODFなら大丈夫? (スコア:1)
XMLをZIPで固めたようなもんだから、そういう点では安心かもしれない。
まあ、ハード的に読めないとか、暗号化されてるとかだったらどうしようもないですが。
Re:ODFなら大丈夫? (スコア:1)
まあOffice XMLもEPUBもそこらへん含めた(のかもしれない?)
ZIP+XML(テキスト)なんですよねぇ
# でも7zipも規格に含まれてたらよかったのに、とは思ったりするが、中の画像とかも圧縮されてるし、場合によって無圧縮もあるから、然程問題ないか
M-FalconSky (暑いか寒い)
Re: (スコア:0)
いろいろや役所が、古い文書が読めないからOpenOfficeやLibreOfficeに移行していますが
例えオープンソースでも、いつか読めなくなるのは同じなんですね
Re: (スコア:0)
とはいえ、現実的な運用としては、定期的なファイル変換でしょうね。
膨大な量をバッチ変換するだけの作業って労力の割りに報われない。
そのうち古美術品を保存するように、古ファイルを扱う職業がでてくるのかな。
Re: (スコア:0)
サイバー空間のサルベージ屋か。胸熱だな。
Re:ODFなら大丈夫? (スコア:1)
ニコ動ですまんが、
http://www.nicovideo.jp/watch/sm9298582 [nicovideo.jp]
考古学に近いな、と思ってしまった。
Re: (スコア:0)
1000年後ぐらい 「いい仕事してますねぇ」 とか言われるような仕事がしたいよw
Re: (スコア:0)
2007以降のOffice(xdocx/xlsx etc...)もXMLとzipですけど?
一方国会図書館では (スコア:1)
ちゃんと収集を始めていた。当面、無償かつDRM無しだけだけど
ちゃんと考えて、将来にわたって読めるように保存するはず
オンライン資料収集制度
http://www.ndl.go.jp/jp/aboutus/online_data.html [ndl.go.jp]
Q. なぜオンライン資料を収集するのですか?
A. 従来、出版物として発行されていたものや、従来であれば印刷して発行されたであろうものが、インターネット等で提供される場合が増えています。出版物については納本制度により当館が収集し、保存してきましたが、インターネット等で提供される情報についてはこのまま散逸してしまうおそれがあります。
そこで、上記のような今般の状況においても、「文化財の蓄積及びその利用に資する」という納本制度の目的を達成するために、インターネット等で提供される民間の電子書籍、電子雑誌等を、収集・保存・提供することとしました。
そうかな (スコア:0)
ある程度古い環境はネットのことを気にしなくていいから、
エミュレータで適当にやれば読むのだけはそんなに大した問題じゃなさそうだ。
データ形式に合わせて新しくプログラム書くより、そのほうがずっと楽で確実だし。
ただ最近の商用OSはインターネットにつなげて使うのが前提になっている感じだから、
仮想環境でとっておいても、将来ちゃんと動いてくれるかどうか心配だ。
インターネット上のサービスまで仮想化して保存しないといかんのだろうか。
Re:そうかな (スコア:3, 興味深い)
少し前に同僚から「大昔にMac の EG word で書いた卒論のファイル、いまどうやったら開けるかな?」と相談されました。
もしかしたら VMware かなんかで少し前の Mac OS X をインストールして、EG word のメディアかなんかがあれば再インストールできるかも…とか思いましたが、結局「物書堂 [wikipedia.org]に相談してみたらどうだろう?」としか答えられませんでした。
いい方法、なんかありませんかね…
Re: (スコア:0)
ググってみると、テキストだけならエディタで読めるってコメントがありました。
罫線や図や装飾は全滅だろうけど。数式とかあると読めても意味ないかも?
他には、パッケージ形式らしいので、開いてSummaryってのをエディタに放り込めばXML文書として開けるとか。
商用でもいいなら「コンバートスター17 [systemport.co.jp]」ってのもあるみたい。
Re: (スコア:0)
そのうち、エミュレータ自身も新しい環境で動かなくなるから、エミュレータのエミュレータ上でうごかすことに
さらに・・・
既にエミュレーターでは動かないんですよね (スコア:0)
XP世代の古いノートとかのバンドルソフトで作ったデータ等をP2V(Physical2Virtual)でまるごと新しいマシンに持って行って廃棄したいんですけどね。
P2Vは /dev/sda 辺りを単純に dd するだけで意外と簡単に出来ちゃうんですが、OEM版の Windows XP Home とかアクティベーションが邪魔するので手詰まりになるんです。
来年でサポート打切るんなら、切実にアクティベーション開放してほしいんですけど。
氏が言ってる「解釈」って (スコア:0)
各社フォーマット作るのはいい、その解読方法、そして表現方法まで公開しろ、と。
例えばMicrosoftがドキュメントフォーマットを作るなら、その解釈方法を詳細に示して、他者でも正確に再現出来ようにしろと。それが後世の人類のためだと。
でもそれって、MicrosoftがOfficeに対してガンとしてしなかったことでしょう。他者がドキュメント互換のOfficeを作ると、互換性のないフォーマットを作ってきた。 MS-Officeでないと再現できないを売りにしてきた。
それをしろと言ってるわけで、要はMicrosoft批判ですねw
Re:氏が言ってる「解釈」って (スコア:2)
ドキュメントフォーマットが変遷して、過去のものが読めなくなってるというのは、
別にMicrosoftに限ったことじゃないですよ。
むしろユーザーが多いし、基本的に昔からインテルベースのハードでWindowsが動いている分、
Microsoft系の方がなんとなることが多いです。
例えば、マックライトの文書ファイルとかは、最初はクラリスワークスでも読めたんで油断してたんですが、
そのうちクラリスワークスがApple Worksになったら、もうマックライトのファイルなど読めなくなってしまい、
しかたなく古いMacを探し出してきて、古いファイルを読み出した記憶があります。
Re: (スコア:0)
Officeフォーマットは大体公開してるだろ。
一部非公開情報は残してあるが、それこそ独自仕様として、各社自由に使って構わないという形になっている。
Re:氏が言ってる「解釈」って (スコア:1)
Re: (スコア:0)
それ以前にディスクフォーマットすら公開していない。
MSを征服した悪の帝王が、ある日突然世界中の膨大なデーターを人質に取ることすら、やられかねない。
まあ大体解析された様だが。
暗号化して前述のリスクやトラブル時のリスクを上げ、盗難・漏洩のリスクを下げるのは、各ユーザーの判断ではある。
Re: (スコア:0)
FATは公開してなかったっけ?あれ?
Re:氏が言ってる「解釈」って (スコア:1)
Re: (スコア:0)
それってAdobeのことじゃねーの
インターネットはお父さんがいっぱい (スコア:0)
Son of a bitchか!
Re: (スコア:0)
孫はくそ?
Re: (スコア:0)
いつからインターネットが一人だと錯覚していた
読むのにかかるコストの問題 (スコア:0)
石油枯渇問題と似てるけど結局はコストでしょ
「読めなくなる」というと反論が山盛りだけど「読むのにかかるコストは年々増大していく」って言えば当たり前の話になる
長期保管が予定されている記録はできるだけ低コストで読める形式にしましょうっていうのが対策になるのがわかるしね
Re: (スコア:0)
そしてDRMによってコストをかけても読めなくなるわけですね。
Re:読むのにかかるコストの問題 (スコア:2)
国家機密レベルの重要な情報だと考えられるなら、力技で何とかする連中もいるでしょうけどね。
将来どうなるかを考えれば「現状では事実上無理」という程度で「読めなくなる」とは言えない。
プロテクトをかけて読めなくなるのは今だけで、将来的に解読へ今よりはるかに大きなパワーを
投入できるようになれば、コストをかけることで読める状態になるでしょう。
問題は、そうするだけの価値があると考える人がいるかどうかなんだけど。
「デジタルベラム」でも無理なものは無理 (スコア:0)
作成者の意図や意味を正しく伝えるための情報であれば、読めりゃそれでいいって話じゃない。
たかが数十年前の大戦のことでさえ、その歴史の解釈には諸説紛々の論争が巻き起こってもいる。
記録さえ残っていれば正しく意味が伝えられるというわけではないことはわかる。
そもそも、意味を精密に伝える技術なんて確立されているのだろうか。
Re: (スコア:0)
たかが数十年前の大戦のことでさえ、その歴史の解釈には諸説紛々の論争が巻き起こってもいる。記録さえ残っていれば正しく意味が伝えられるというわけではないことはわかる。
記録さえ残っていれば、後年歴史の解釈には諸説紛々の論争する土台になる。
ウィキペディアの方針は別として、歴史解釈の正当性を担保するのは常に一次史料だ。
一次史料に反することを、願望で捏造する特定アジア人は別として。
それはあまり心配してないんだ (スコア:0)
だって、古いMS OfficeファイルだってGoogleドキュメントに放り込めばある程度は読めるじゃん。
で、今のMS OfficeファイルはXMLへ移行したから、将来的にも読めなくなるリスクはほとんど無いでしょ。
# むしろ、Google依存度が上がり過ぎてる事がリスク。
Computer World生地 (スコア:0)
ベラムと生地は一応関係あるみたいですが、ひょっとして高度なネタなんでしょうか・・・?
http://sei-hon.jp/glossary/words/%83x%83%89%83%80%92%B2.html [sei-hon.jp]
マイコー!! (スコア:0)
> Cerf氏は、MacintoshでMicorsoft Office 2011を使っているのだそうだが