パスワードを忘れた? アカウント作成
9309 story

日本版Internet Archiveは2006年から 32

ストーリー by Acanthopanax
まだ始まっていなかった 部門より

mew曰く、"NIKKEI NETの記事より。2006年から国立国会図書館がウェブサイトの収集を始めるそうです。収集対象となるサイトは当面はjpドメインのみで、一般利用者の閲覧も将来(前掲記事では「2008年をメドに」)認める方針とのこと。
この国会図書館主導の「日本版Internet Archive計画」につきましては、ここ/.-jpでも2002年9月の時点で既報(ストーリー:「国会図書館が .jpなウェブを全部保存する計画」)です。ですのでもうとっくに始まっているもんだと思っていたのですが、まだ始まっていなかったんですね。しかも実際の着手は、記事によればまだ一年以上先とのこと。このままずるずる延びていつの間にかうやむや、とは流石にならないと思いますが……。
なおタレコミ時点では、この件についての国立国会図書館のウェブサイトでの公式発表はまだ確認できていません。"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2004年12月07日 21時46分 (#662928)
    ホームページ収集許諾だかなんだかで、 書類が送られてきて、判子を押して返事したのが、 2年前の事だったと思います。
  • 収録されたくないとか (スコア:2, すばらしい洞察)

    by Xegnyph (9041) on 2004年12月08日 0時17分 (#663011)
    言う人も出てくるんだろうな。
    Webページを公開しているという時点で、どっかの誰かが勝手に記録することに対しては文句を言えないんじゃないかと思うけど。
    それでもやっぱり「収録拒否」とか言う人も出てくるんだろうなぁ。

    #収録するのは勝手にすりゃいいと思うけど、それを第三者に公開するのは、どうなんだろう?
    #微妙なの?よくわからん。

    私なんぞはろくなページも作っていないので、収録されるもされないもほとんどどうでも良いのですけどね。
    • 本家でも (スコア:2, 興味深い)

      by GruenerSalon (25255) on 2004年12月08日 2時43分 (#663081)

      オリジナル(?)の The Wayback Machine [archive.org] では、
      最近、アーカイヴされていたサイトのページが裁判の際に有効な
      証拠として認定されたそうで、これを機に、企業を中心に 
      The Wayback Machine に収録されたサイトの削除をもとめる
      動きがでるのではないか、と懸念されてます。
      (これってタレコまれてたっけ? 念のため、参考記事 [stanford.edu]。)

      アーカイブの信頼性が認められることによって、ミッションの遂行が
      困難になるという逆説。

      親コメント
      • by njt (4968) on 2004年12月08日 16時34分 (#663431) 日記
        国の場合、削除ではなく、非公開処分というのが妥当なところでしゃないでしょうか。削除してしまったら、後から必要になっても戻せませんし、名誉毀損にかかわるようなものであれば、死後50年も経てば場合によっては研究対象になってもおかしくないでしょう。--~~~~
        親コメント
      • by Anonymous Coward
        それは元々、Webで後ろめたい情報を発信している企業って前提ですか?
        もしかしたら、SCOがUNIXの権利を有していて、IBMやLinuxが特許を侵害している
        といったような企業に有効な証拠だってあるかも知れない!

        #なわけねー

        むしろ、日本では「挑発的な物言いをしている!」と個人を企業がツブすのに
        有効活用しそうな気がしなくもない。
    • まあ、公開する”自由”と、個人的範囲で保管する”自由”は折り合いついても
      国が出てくると「徴収される”義務”」と変換する人はいるでしょうね。
      でもバカじゃなければ、普通にrobot.txtとか、メタタグで回避できるクローラー、
      万が一
    • .toとか.nuとか.npで公開すればよいのです :-p
  • 全部保存 (スコア:2, すばらしい洞察)

    by lunatic_sparc (15416) on 2004年12月08日 0時56分 (#663038)
    こないだのNTT西の個人情報丸見え、ってのも保存対象になってたら楽しそう。♪
    • by Anonymous Coward
      企業サイトなどでは、しばしば都合の悪い情報が発覚すると
      該当記事を削除して証拠隠滅を図ることがありますが、そういった
      記事をしっかりアーカイブしてくれるのなら「意味がある」と
      言えるのではないかと。
  • タレコミ文のNIKKEIの記事によれば、データベースの更新は一年に一回みたいですね。

    > 随時更新などによりデータが消滅していることを懸念

    してるにも関わらず、

    > 毎年1月から3カ月程度かけて、その時点の内容を読み取る

    ことしかしない、というのは、矛盾してる気がするなぁ。
    特にコンピュータ系の、技術文書(とか解説サイト)は、
    年に何度もバージョンアップなどに応じて更新されると
    思われるので、一年前のページを閲覧できたからって
    得るものは少ないような。

    # 一年前は、それはひどいHTMLを書いていたのでID。
    # そして収集され始める頃にはもう学校にはいない…ハズ。
    --
    Your 金銭的 potential. Our passion - Micro$oft

    Tsukitomo(月友)
  • by aquaforest (17246) on 2004年12月07日 23時53分 (#662993)
    日本語サイト全般まで範囲を広めて欲しいですね

    でないと、全然意味のないタダの税金の無駄遣いにしか思えないかも。
    でも、*.jpって言うことは、下層まできっちり保存するのかな?
    ウェブアーカイブと差別化を図って欲しいところです。
    --


    #きっと、可能性っていうのはその辺に落ちているんだけど
    #気がつかない物じゃないかなと思う。
    • 国の機関、しかも立法機関がやることですから、およそ国内法が及ぶ範囲しか収集できないのだと思いますが、そもそもウェブスペースで日本の国内法が及ぶ範囲ってどうやってきめられるんだろう。

      1)IP アドレス的に日本にあるサーバから発信されている
      2)JPNIC(というか JPRC ?)にレジストしている
      3)日本国席を持つ個人もしくは日本に法人登記のある法人が「管理」しているコンテンツは全て

      3)といったって、その「管理」ってのが何を指すのかあいまいなんだよな。
      --
      屍体メモ [windy.cx]
      親コメント
      • おもなコレクション [ndl.go.jp]というページにもありますが、国外で発行された書物であっても日本に関係するものは積極的に収集しているようです。
        ですから、「およそ国内法が及ぶ範囲しか収集できない」という事はありません。

        日本の国内法が及ぶ範囲は、日本国内からアクセスできる相手方全てと、日本国籍を持つ者が海外で行った事象全てですが、実際に執行できる範囲とは一致しません。
        外国人が日本に入国して犯罪を犯し、拘束されずに海外へ逃亡した場合と一緒です。
        相手国との間に犯罪者引渡し

  • by junnno (19418) on 2004年12月08日 1時54分 (#663065)
    google並みのロボット検索エンジンをひとつ作っておいて、
    キャッシュのスナップショットを保存すれば良いのではないかな。

    それとも、納本制度にする?

    民間のWebページがアップロードされたときは、文化財の蓄積及びその利用に資するため、公開者は、アップロードの日から30日以内に、最良版の完全なもの1ページを国立国会図書館に納入しなければならない…
  • 日本語も含むどんなドメインでも探せるし,通常の用途ではそれで 十分かと。
  • 「本字業の紹介(WARP)」 [ndl.go.jp]には、登録までの仕組みが推薦(自薦・他薦)->収集許諾依頼文書->自動収集ソフトウェア(ロボット)にて 収集なんて書いてありますね。
  • by Anonymous Coward on 2004年12月08日 10時33分 (#663177)
    何も考えずにgoogleに業務委託すればいいのに
    • by urabe (14966) on 2004年12月08日 10時54分 (#663192)
      ヤフージャパンに委託してみても良いのではと思います。

      ヤフージャパンに登録されているサイト対象にすればの話ですが、
      ・サイトのトップページに関しては晒すことが前提のはず
      ・ビジネスエクスプレスと言うのがあるにせよ、有用性とか独創性とかが審査されている
      ・登録されているのだからjp以外のドメインでも拾える

      おまけの効能として
      ・明らかに有用性がないサイトは最初っからアーカイブの対象外
      ・ヤフーに登録してあってもサイトが無くなっている場合のチェックもできる
      ・ついでにアダルトサイトとかに変身しているサイトのチェックもできる

      弊害は
      ・1つの企業の方針で登録されているサイトのアーカイブになってしまう
      ・有用でも登録されていないサイトはアーカイブされない
      ・金払えば、アーカイブされるような錯覚を起こす
      ・ヤフーの経営者が嫌いな人には良い顔されない


      他にも色々ありそう。
      親コメント
      • by Anonymous Coward
        >明らかに有用性がないサイトは最初っからアーカイブの対象外

        有用性があるかどうかは、現在の視点からのみ量れるものではありません。
        例えば、民俗学の観点から見れば、その時点において「保存する価値など無い」と思われていたようなものにこそ価値があります。
        • > 例えば、民俗学の観点から見れば、その時点において「保存する価値など無い」と思われていたようなものにこそ価値があります。

          WinnyやWinMX上に流れている雑多なファイルも全て保存しておくような、
          P2Pファイル交換版のInternet Archiveも有ればいいのになぁ。
typodupeerror

「科学者は100%安全だと保証できないものは動かしてはならない」、科学者「えっ」、プログラマ「えっ」

読み込み中...