パスワードを忘れた? アカウント作成
6216 story

"Internet Archive 日本版"? 平成国立ネット図書館計画発表 46

ストーリー by Oliver
そして歴史の一部に 部門より

strayDuck 曰く、 "産経新聞 7/27付朝刊によると、総務省国立国会図書館が共同で「平成国立インターネット図書館」を構築することが明らかになった。短時間で更新、削除されてしまうウェブページを"知の資産"としてきめ細かく保存、一般に公開するのが目的という。計画は来年度から始動、総務省は平成18年の実用化を目指すとしている。
ちょうどInternet Archiveがやっているようなことを国がやるということでいいんでしょうか(記事ではここを例に挙げて紹介している)。しかし資料収集のための 300 億円というのは妥当なところでしょうか。あと、集める対象が HTML ファイルのみか、その他のファイルも収集するかどうかも気になるところ。"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 前ストーリー (スコア:2, 参考になる)

    by hayami (8883) on 2003年07月27日 15時39分 (#366341) ホームページ 日記
    国会図書館が.jpなウェブを全部保存する計画 [srad.jp]

    今回ストーリーは、それに進捗があって、具体化してきたという話なのかしら…

    • by daiten (7074) on 2003年07月27日 18時01分 (#366469)
      多分そうなんだ思います。

      でも、jpドメインだけなんですよね……。

      せめて「日本語テキスト」とかにならないのでしょうか?

      どこかのポータルサイトを買い取った方が早い気がします。

      親コメント
      • by strayDuck (10387) on 2003年07月27日 19時08分 (#366526)

        タレコミ主です。前ストーリーの存在を投稿後に思い出しました;-(。
        ですが、.jp 以下ってのは当面の話なんですよね?
        # "当面"がいつ終わるのかは(略

        あくまで "自前で" "(落書きだろうと)何でも" "保存しておく" のが最終目標なんでしょうから、まぁ頑張ってねーとしか言えない気もまたします。

        親コメント
        • by ababincho (14851) on 2003年07月27日 19時47分 (#366560)
          あくまで "自前で" "(落書きだろうと)何でも" "保存しておく" のが最終目標なんでしょうから

          それだったら期待できないなあ。総務省だしなあ。

          俺は、産経の記事の「保存方法の標準化」っていうのにちょっと期待したんだけど。検索しやすい保存方法の標準化をして、それを W3C などにフィードバックをするなんていうことを期待してはいけないのだろうか。

          「平成国立インターネット図書館」 という名称は予算とれたら速攻で替えて欲しいです。
          # なんか、平成天才パカボンを思いだした、いや、どうでも良いのですが。
          親コメント
          • by strayDuck (10387) on 2003年07月27日 21時24分 (#366631)
            >「平成国立インターネット図書館」 という名称は予算とれたら速攻で替えて欲しいです。
            > # なんか、平成天才パカボンを思いだした、いや、どうでも良いのですが。

            やはり:-)


            「保存方法の標準化」は依然魅力的ですね。そこからのデータの利用もしやすくなるわけですごくいい。しかし、(また記事から憶測ですが)そのような目的を持っているとは読めないように思います。

            けれども国会図書館にはぜひ、「とりあえず集めときゃいいだろう」ではなく1歩先 -- その有効な利用法 -- まで考えていてもらえるといいと思うのですが。

            親コメント
    • by Anonymous Coward
      産経新聞 [sankei.co.jp]の記事も移動しましたので参考までに、ここにぶら下げてみる。
  • 次のステップは (スコア:2, おもしろおかしい)

    by Anonymous Coward on 2003年07月27日 17時31分 (#366437)
    警視庁がこの成り行きに興味を持たれたようです。
  • by ababincho (14851) on 2003年07月27日 19時20分 (#366529)

    COLLECTIONS POLICY STATEMENT [loc.gov] をざっと読んだのですが、これと産経の記事を読むと 米や豪みたいに選択的な収集をしようとしていたけど、もっと範囲を広げないとだめだっていうことになったのかな、と思います。

    様々なところで研究されていることだとは思いますが、文脈やハイパーテキストから自動的に分析して情報の断片から容易に一次情報に辿りつけるようなシステムを作ってくれると本当に電子図書館という気がして嬉しいのですが。
  • by Anonymous Coward on 2003年07月27日 21時11分 (#366622)
    特許についてはあまり詳しくないんですけど、確か「新規性」がないと特許としては認められないんですよね?

    逆に、申請された特許に異議を申し立てたければ、申請内容が既に存在するものであることを証明すればいいわけです。今までは、それを証明したくても証拠を見つけるのが難しかったけど、これがあれば「この申請内容は○年○月○日(申請日以前)にhttp://????.co.jp/に公開された内容と同じなので却下して下さい」と言う事が可能になったわけです。

    もちろん、今まででもInternet Archiveのアーカイブで同じ事が出来たわけですが、役所がやってるサービスの方が、証拠としては認められ易そう。
  • by saiyasu (17021) on 2003年07月27日 21時49分 (#366652)
    産経の記事によると"保存して一般に公開する"ことが目的だそうですけど、オンラインで参照できなかったら嫌だな…。

    わざわざ某大型掲示板の過去ログ見るために出かけていったりして。

    #オンラインで公開してくれても、たぶん最初はアクセス集中でサーバダウンに一票。
  • by Anonymous Coward on 2003年07月27日 15時40分 (#366342)
    dat落ちするスレをその前に保存して公開するといいな

    # ちょっと油断するといつの間にdat落ちする
    # 漏貧スレを追っかけてるのでAC
    • by Anonymous Coward
      ●の商売敵とみなしてキックしちゃったりするんじゃないかなぁ。
  • by Anonymous Coward on 2003年07月27日 15時42分 (#366343)
    産経新聞の記事の末尾に

    >保存するウェブページの選択が問題になるが、総務省では、「書き込みなどの“落書き情報”が歴史資料として重要な意味を持つこともある」としており、保存対象はできるだけ幅広くしていく考えだ。

    とあるのだが、それを集めだしたらとんでもない量になるような気がするが大丈夫か?

    2chあたりが真っ先にアーカイブに使い出しそうだ。
    • by Anonymous Coward
      かの Internet Archive の方は、1996年以降に発生した
      100億ページを 100テラバイト収集し、毎月10テラバイト
      増えていると 2001年に発表 [impress.co.jp] しました。

      収集対象であるWebはこの数年でも更に増えつづけていますので
      いまはもっと凄いことになっているでしょう。

      もっとも、大変なのはディスク容量だけでなくその膨大な
      Webサイトデー
  • by Anonymous Coward on 2003年07月27日 15時58分 (#366347)
    便利になるだろうから個人的にはどうでもいいけど、日本特有の著作隣接権『送信可能化権』とかの絡みはどうするつもりでしょう?

    送信可能化権を廃止してくれると嬉しいんだけどな~
    特例法でも設けるんでしょうね~
  • by Anonymous Coward on 2003年07月27日 16時40分 (#366380)
    ウェブページが本物であることを証明する原本性認証技術
    どうやってやるんだろう?
    できっこないように思えるが。

    総務省がやるってだけでろくなもんでない予感。

    • 信頼されたドメインから配信するとか、電子署名を付けるとか?

      そのようない技術自体は色々有るでしょうけど、ブラウザがついてくるのか。。

      # というか、httpサーバーからのヘッダくらい簡単に確認する手段を付けてくれ。。
      # Lite [jah.ne.jp]みたく。
      親コメント
      • by Anonymous Coward
        > 信頼されたドメインから配信するとか、電子署名を付けるとか?

        そういう話ではなくて、本当にそのデータが、元あった場所にあった内容なのかを証明する話ですよ。どう考えても無理ですよね。元のサイト自身がコンテンツに電子署名してない限り。
    • by Anonymous Coward
      「改ざん防止のため、認証技術は公開しません」の一言で、技術がなくてもすべておっけー。
  • by Anonymous Coward on 2003年07月27日 17時09分 (#366415)
    時系列表示? だとしたら、時間単位?分単位?秒単位?
  • by Anonymous Coward on 2003年07月27日 20時41分 (#366598)
    GoogleがNetNewsのアーカイブを公開しはじめるとき、
    いったん公開されたものが永遠に残ってしまうことについて議論百出だったと思うんですが。
    取り消す手段とか、あるんでしょうか。

    うっかり個人情報が漏れてたらそれも保存されちゃうの?
    弾くとしたらチェックはどうやる?

    署名されたページの電子公証としての機能は期待できると思うけどなぁ。

    #ロボットのプロトコル教えてくんろ。蹴るから。
    • by Anonymous Coward on 2003年07月28日 9時08分 (#366877)
      永遠に残ってしまうなんてのは物理的な本でも同じでしょう
      (材質の劣化がどうのとかいうのはおいといて)

      一度出したものを、「やっぱ完全になかったことに」ってこと自体
      無理があることです。
      親コメント
    • 国立国会図書館の長(おさ)が、ひろゆき化するということで。
      • by Anonymous Coward on 2003年07月28日 0時50分 (#366769)
        3 年後 館長呟く...
        「10 TB のストレージは 4 台目だ。物理的な容量の問題は無い。 計画は 1PB だからな...ここに溜まった情報が問題だ。 個人情報、事件、版権物、グロ、わいせつ、手口、遺伝情報、 寝ている犬の動画... 分類可能ならよい。暗号化された zip、 意味不明なバイナリもある。
        当然公開は問題だ。誰が分類し、法的な解釈を加えるのだ。 300 億円?何人でチェックするつもりだ?とても見切れない。 自動分類はとっくの昔に無力だ。特に Under Ground はそうだ。 だからいまは公開停止中だ。だが、保存はこの瞬間も続いている。
        マスコミは箱を作って運用が無いと批判する。ここで 1 日 1 万枚の 画像ショット(それとも音声)を浴びせてやいたりものだ。」

        [20060728.024549] STORE: http://tsubo.go.[●]/kanchou/blog/20060728.htm.

        親コメント
    • インターネットは常に無保証の世界だしなぁ。
      署名が、盗まれたものでないなんて保障はどこにもないな。
      その場合は公文書偽造か?:(
  • by Anonymous Coward on 2003年07月28日 3時12分 (#366827)
    「平成国立インターネット図書館」とのことだけど、
    平成ももう15年になるというのに、
    なぜいまどき名前に「平成」を付けるのかな。
    • by ababincho (14851) on 2003年07月28日 4時11分 (#366835)
      それでは「インターネット図書館21」っていうのはどうかな。
      いや、仮称だから変えてくれるもんだと信じたい。

      パンドラや、ミネルバに対抗する良いプロジェクト名をつけてほしい。
      やはり学問の神様である天神様にご出馬願うしかないか、それとも智慧のということで、

      もんじゅ。
      親コメント
    • 明治製菓や大正製薬は、平成の現在もそのまま営業してますが。
      平成に始めるんだから「平成」を冠してても良いのでは?
typodupeerror

犯人は巨人ファンでA型で眼鏡をかけている -- あるハッカー

読み込み中...