パスワードを忘れた? アカウント作成
9100655 journal
日記

dancemanの日記: Vinton Cerf氏が懸念、今あるデータが将来読めなくなってしまう 90

日記 by danceman

「インターネットの父」の1人として知られるVinton Cerf氏が、今日作成されたデジタル・データが将来読めなくなると警告している(本家/.Computer World生地より)。

Cerf氏は、MacintoshでMicorosoft Office 2011を使っているのだそうだが、PowerPoint 97のファイルが読めないのだという。「Microsoftを責めているのではない」と前置きしたうえで、「過去に遡って互換性を非常に長い期間保ち続けることはとても難しい」と述べている。ディスクが手元に残っていたとしても、ディスクを理解できなくなっているかもしれないとのこと。

氏は、書写のために動物の皮を加工してつくられ1000年以上も保存されてきたベラム紙の名前をとり「デジタル・ベラム」を提唱している。データを断片的に保存するだけでなく、解釈も保存できるデジタルベラムが必要なのだという。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 古いコンピュータのエミュレータがクラウドサービスで提供されるといいですね。
    昔書いたIRIX用のコードを動かしてみたいけど環境がありません。

    ソフトウェアの著作権も50年で切れるのでしょうか。
    ライセンス契約だとダメなのかな。

  • by Anonymous Coward on 2013年06月06日 15時53分 (#2395717)

     そんなことは昔から言われてますよ
     そろそろFD資産は物理的に不可能なものも多いでしょうし、IDEなにそれおいしいの?とかももう出てきてるんじゃないですかね。
     そもそも初期のHFSに保存されているデータは読みだしたらファイル壊れる可能性もあるんじゃないかな・・・
    #2000年問題とかw

     結局のところ、(中身が)Text(Only)以外の文書は読みだすのが難しいと思いますよ。

    #万が一のために設計書をつけといても、それを(物理的に)読めるかも問題なんですよね~
    #現在の磁気ディスクが生き残っているとは限らないし、SSDとかも違うものになってるかもしれないしね

    • Re:なんというか・・・ (スコア:2, すばらしい洞察)

      by Anonymous Coward on 2013年06月07日 14時03分 (#2396433)

      全く同感。ビデオテープ全盛期に、

      "「コピー防止」という理由でアナログAV端子が廃止される"ということを誰が一人でも想像したのだろうか。

      親コメント
    • by Anonymous Coward

      テキストオンリーだとしても、文字コードも変わる可能性もあればフォーマットもメディアも変わってしまう事は有り得る訳で。

      結局は、「常に最新環境にコンバートし続ける」しかないのじゃないかな。

    • by Anonymous Coward

      MFSは知らんがHFSはHFS+と同様に2040年までは大丈夫なはず。

      あと「2000年問題」はデータを処理する際の(データ間、データ内の)整合性がとれなくなるっていう論理的な話であって、すでにあるファイルが壊れるとかの物理的な問題ではないと思うのだが。もちろん問題が出たあとに書き込まれたファイルは(論理的に)壊れるかもしれんが。(プログラム的には壊れているが、ファイルシステム的には正常なファイル)

      ファイルを読み出す程度ならタイムスタンプがおかしくなる程度で、ファイルの内容には影響しないでしょ。
      ドライバが腐ってでもいない限り。

    • by Anonymous Coward

      IDEと言っている時点で既に会話が通用していない可能性もある。

      # なんで開発基盤が関係あるの~って人とか

      • by Anonymous Coward

        IDEはSATAとかSCSIみたいな接続の規格ですよ・・・
        こうやってデータは読めなくなるんですね・・・

  • by s02222 (20350) on 2013年06月07日 13時54分 (#2396420)
    多分、どうやっても消えっこないぐらい安定したストレージに、その時点で集められる限りのあらゆる過去のデジタルデータを放り込んでるような時代が来て、 どんな形式であれ、「ファイルのプレビュー」を命じると当時のやり方を見つけて来て何とかしてくれるぐらいまでAIが進化してるだろうから大丈夫。

    そこまで技術が進歩しないのであれば、そっちの方が大問題だから何とかしないといかん。過去のデータを頑張って読もうとかしてる場合じゃない。
  • by saitoh (10803) on 2013年06月07日 16時30分 (#2396585)
    昔のファイルフォーマットが解釈出来るかどうかだけでなく、文書ファイルだと、それが依存しているフォントが残っているかどうかも問題になりますね。

    昔つくったPSファイルで今でも持ってる(読める)けど、MacSEで生成したPSファイルでOsakaフォントを使ってたりするので、果たしてこれはもうゴミかも?と思ったりします。

  • 逆に (スコア:1, 興味深い)

    by Anonymous Coward on 2013年06月06日 18時04分 (#2395820)

    昔のデータって、あまり暗号化とかパスワードに気を使ってなくて、力技で読めちゃうわけです。
    (ファイルシステムが違ってるなんてのはどうしようもないですが)
    今は誰でも暗号化やパスワードかけますから、そういうデータを将来復元できないのはもう仕方ないのでは。

    気になるのはDRMですよね。 読めなくするのが目的の機能だから、出した側がサポートやめればもう尋常な方法では読み出せない。
    文化は企業とともに消え去る運命。

    • by Anonymous Coward

      いや、そっちよりもメディアの風化の問題ではないかと?

    • by Anonymous Coward

      なんか話題の趣旨からだいぶ脱線したところを走ってるね、君

  • by hahahash (41409) on 2013年06月06日 20時51分 (#2395924) 日記

    XMLをZIPで固めたようなもんだから、そういう点では安心かもしれない。

    まあ、ハード的に読めないとか、暗号化されてるとかだったらどうしようもないですが。

    • まあOffice XMLもEPUBもそこらへん含めた(のかもしれない?)

      ZIP+XML(テキスト)なんですよねぇ

      # でも7zipも規格に含まれてたらよかったのに、とは思ったりするが、中の画像とかも圧縮されてるし、場合によって無圧縮もあるから、然程問題ないか

      --
      M-FalconSky (暑いか寒い)
      親コメント
    • by Anonymous Coward

      いろいろや役所が、古い文書が読めないからOpenOfficeやLibreOfficeに移行していますが
      例えオープンソースでも、いつか読めなくなるのは同じなんですね

      • by Anonymous Coward
        オープンソースであれば、ファイルフォーマットぐらいは探せば見つかると思いますので、金をかければ何とかなりそう。
        とはいえ、現実的な運用としては、定期的なファイル変換でしょうね。
        膨大な量をバッチ変換するだけの作業って労力の割りに報われない。
        そのうち古美術品を保存するように、古ファイルを扱う職業がでてくるのかな。
    • by Anonymous Coward

      2007以降のOffice(xdocx/xlsx etc...)もXMLとzipですけど?

  • by northern (38088) on 2013年06月08日 14時49分 (#2397096)

    ちゃんと収集を始めていた。当面、無償かつDRM無しだけだけど
    ちゃんと考えて、将来にわたって読めるように保存するはず

    オンライン資料収集制度
    http://www.ndl.go.jp/jp/aboutus/online_data.html [ndl.go.jp]

    Q. なぜオンライン資料を収集するのですか?
    A. 従来、出版物として発行されていたものや、従来であれば印刷して発行されたであろうものが、インターネット等で提供される場合が増えています。出版物については納本制度により当館が収集し、保存してきましたが、インターネット等で提供される情報についてはこのまま散逸してしまうおそれがあります。
    そこで、上記のような今般の状況においても、「文化財の蓄積及びその利用に資する」という納本制度の目的を達成するために、インターネット等で提供される民間の電子書籍、電子雑誌等を、収集・保存・提供することとしました。

  • by Anonymous Coward on 2013年06月06日 23時22分 (#2396013)

    ある程度古い環境はネットのことを気にしなくていいから、
    エミュレータで適当にやれば読むのだけはそんなに大した問題じゃなさそうだ。
    データ形式に合わせて新しくプログラム書くより、そのほうがずっと楽で確実だし。

    ただ最近の商用OSはインターネットにつなげて使うのが前提になっている感じだから、
    仮想環境でとっておいても、将来ちゃんと動いてくれるかどうか心配だ。
    インターネット上のサービスまで仮想化して保存しないといかんのだろうか。

    • Re:そうかな (スコア:3, 興味深い)

      by flutist (16098) on 2013年06月07日 15時41分 (#2396542)

      少し前に同僚から「大昔にMac の EG word で書いた卒論のファイル、いまどうやったら開けるかな?」と相談されました。

      もしかしたら VMware かなんかで少し前の Mac OS X をインストールして、EG word のメディアかなんかがあれば再インストールできるかも…とか思いましたが、結局「物書堂 [wikipedia.org]に相談してみたらどうだろう?」としか答えられませんでした。

      いい方法、なんかありませんかね…

      親コメント
      • by Anonymous Coward

        ググってみると、テキストだけならエディタで読めるってコメントがありました。
        罫線や図や装飾は全滅だろうけど。数式とかあると読めても意味ないかも?

        他には、パッケージ形式らしいので、開いてSummaryってのをエディタに放り込めばXML文書として開けるとか。

        商用でもいいなら「コンバートスター17 [systemport.co.jp]」ってのもあるみたい。

    • by Anonymous Coward

      そのうち、エミュレータ自身も新しい環境で動かなくなるから、エミュレータのエミュレータ上でうごかすことに
      さらに・・・

    • XP世代の古いノートとかのバンドルソフトで作ったデータ等をP2V(Physical2Virtual)でまるごと新しいマシンに持って行って廃棄したいんですけどね。
      P2Vは /dev/sda 辺りを単純に dd するだけで意外と簡単に出来ちゃうんですが、OEM版の Windows XP Home とかアクティベーションが邪魔するので手詰まりになるんです。

      来年でサポート打切るんなら、切実にアクティベーション開放してほしいんですけど。

  • by Anonymous Coward on 2013年06月07日 13時52分 (#2396417)

    各社フォーマット作るのはいい、その解読方法、そして表現方法まで公開しろ、と。
    例えばMicrosoftがドキュメントフォーマットを作るなら、その解釈方法を詳細に示して、他者でも正確に再現出来ようにしろと。それが後世の人類のためだと。

    でもそれって、MicrosoftがOfficeに対してガンとしてしなかったことでしょう。他者がドキュメント互換のOfficeを作ると、互換性のないフォーマットを作ってきた。 MS-Officeでないと再現できないを売りにしてきた。
    それをしろと言ってるわけで、要はMicrosoft批判ですねw

  • by Anonymous Coward on 2013年06月07日 14時01分 (#2396429)

    Son of a bitchか!

    • by Anonymous Coward

      孫はくそ?

    • by Anonymous Coward

      いつからインターネットが一人だと錯覚していた

  • by Anonymous Coward on 2013年06月07日 14時44分 (#2396481)

    石油枯渇問題と似てるけど結局はコストでしょ
    「読めなくなる」というと反論が山盛りだけど「読むのにかかるコストは年々増大していく」って言えば当たり前の話になる
    長期保管が予定されている記録はできるだけ低コストで読める形式にしましょうっていうのが対策になるのがわかるしね

    • by Anonymous Coward

      そしてDRMによってコストをかけても読めなくなるわけですね。

      • 国家機密レベルの重要な情報だと考えられるなら、力技で何とかする連中もいるでしょうけどね。
        将来どうなるかを考えれば「現状では事実上無理」という程度で「読めなくなる」とは言えない。
        プロテクトをかけて読めなくなるのは今だけで、将来的に解読へ今よりはるかに大きなパワーを
        投入できるようになれば、コストをかけることで読める状態になるでしょう。
        問題は、そうするだけの価値があると考える人がいるかどうかなんだけど。

        親コメント
  • by Anonymous Coward on 2013年06月07日 14時52分 (#2396490)
    <a href="http://ja.wikipedia.org/wiki/%E6%9C%AA%E8%A7%A3%E8%AA%AD%E6%96%87%E5%AD%97">未解読文字</a>とかね。
    作成者の意図や意味を正しく伝えるための情報であれば、読めりゃそれでいいって話じゃない。

    たかが数十年前の大戦のことでさえ、その歴史の解釈には諸説紛々の論争が巻き起こってもいる。
    記録さえ残っていれば正しく意味が伝えられるというわけではないことはわかる。

    そもそも、意味を精密に伝える技術なんて確立されているのだろうか。
    • by Anonymous Coward

      たかが数十年前の大戦のことでさえ、その歴史の解釈には諸説紛々の論争が巻き起こってもいる。記録さえ残っていれば正しく意味が伝えられるというわけではないことはわかる。

      記録さえ残っていれば、後年歴史の解釈には諸説紛々の論争する土台になる。
      ウィキペディアの方針は別として、歴史解釈の正当性を担保するのは常に一次史料だ。
      一次史料に反することを、願望で捏造する特定アジア人は別として。

  • by Anonymous Coward on 2013年06月07日 15時06分 (#2396501)

    だって、古いMS OfficeファイルだってGoogleドキュメントに放り込めばある程度は読めるじゃん。
    で、今のMS OfficeファイルはXMLへ移行したから、将来的にも読めなくなるリスクはほとんど無いでしょ。

    # むしろ、Google依存度が上がり過ぎてる事がリスク。

  • by Anonymous Coward on 2013年06月07日 16時45分 (#2396599)

    ベラムと生地は一応関係あるみたいですが、ひょっとして高度なネタなんでしょうか・・・?

    http://sei-hon.jp/glossary/words/%83x%83%89%83%80%92%B2.html [sei-hon.jp]

  • by Anonymous Coward on 2013年06月07日 16時45分 (#2396602)

    > Cerf氏は、MacintoshでMicorsoft Office 2011を使っているのだそうだが

typodupeerror

「毎々お世話になっております。仕様書を頂きたく。」「拝承」 -- ある会社の日常

読み込み中...