日本版Internet Archiveは2006年から 32
ストーリー by Acanthopanax
まだ始まっていなかった 部門より
まだ始まっていなかった 部門より
mew曰く、"NIKKEI NETの記事より。2006年から国立国会図書館がウェブサイトの収集を始めるそうです。収集対象となるサイトは当面はjpドメインのみで、一般利用者の閲覧も将来(前掲記事では「2008年をメドに」)認める方針とのこと。
この国会図書館主導の「日本版Internet Archive計画」につきましては、ここ/.-jpでも2002年9月の時点で既報(ストーリー:「国会図書館が .jpなウェブを全部保存する計画」)です。ですのでもうとっくに始まっているもんだと思っていたのですが、まだ始まっていなかったんですね。しかも実際の着手は、記事によればまだ一年以上先とのこと。このままずるずる延びていつの間にかうやむや、とは流石にならないと思いますが……。
なおタレコミ時点では、この件についての国立国会図書館のウェブサイトでの公式発表はまだ確認できていません。"
2年前に承諾書を送ったのですが・・・ (スコア:3, 参考になる)
Re:2年前に承諾書を送ったのですが・・・ (スコア:3, 参考になる)
国会図書館のサイトより、この件に多少なりとも関係すると思われる情報です(「国立国会図書館電子図書館中期計画2004 [ndl.go.jp]」)。
#662928にある「2年前の『ホームページ収集許諾』」というのは、前掲資料の「2.(2)ウェブ・アーカイビングと提供」にある“実験”に関わることのように読めます。
Re:2年前に承諾書を送ったのですが・・・ (スコア:2, おもしろおかしい)
個人情報のフィッシング?
# ネタでなければ・・・
# いや、ネタならフィッシング(釣り)?
Re:2年前に承諾書を送ったのですが・・・ (スコア:0)
サイトの許諾ていどの用件で、それ以上の個人情報の収集が
可能とは考えにくいです。
判子もどうせ三文判でしょうし。
Re:2年前に承諾書を送ったのですが・・・ (スコア:1)
許諾は書面のみで、電子メールやサイトに設置されたBBSなどでは不可と
いった内部規定があるとしたら、実際に書類を送れるのは企業とか
大学のような住所等がはっきり書いてあるところだけです。
国会図書館の思惑としては、管理人の住所が書いていないような個人サイトは
最初から収集する気など無いのでしょうか?
Re:2年前に承諾書を送ったのですが・・・ (スコア:0)
収録されたくないとか (スコア:2, すばらしい洞察)
Webページを公開しているという時点で、どっかの誰かが勝手に記録することに対しては文句を言えないんじゃないかと思うけど。
それでもやっぱり「収録拒否」とか言う人も出てくるんだろうなぁ。
#収録するのは勝手にすりゃいいと思うけど、それを第三者に公開するのは、どうなんだろう?
#微妙なの?よくわからん。
私なんぞはろくなページも作っていないので、収録されるもされないもほとんどどうでも良いのですけどね。
本家でも (スコア:2, 興味深い)
オリジナル(?)の The Wayback Machine [archive.org] では、
最近、アーカイヴされていたサイトのページが裁判の際に有効な
証拠として認定されたそうで、これを機に、企業を中心に
The Wayback Machine に収録されたサイトの削除をもとめる
動きがでるのではないか、と懸念されてます。
(これってタレコまれてたっけ? 念のため、参考記事 [stanford.edu]。)
アーカイブの信頼性が認められることによって、ミッションの遂行が
困難になるという逆説。
Re:本家でも (スコア:1)
Re:本家でも (スコア:0)
もしかしたら、SCOがUNIXの権利を有していて、IBMやLinuxが特許を侵害している
といったような企業に有効な証拠だってあるかも知れない!
#なわけねー
むしろ、日本では「挑発的な物言いをしている!」と個人を企業がツブすのに
有効活用しそうな気がしなくもない。
Re:収録されたくないとか (スコア:0)
国が出てくると「徴収される”義務”」と変換する人はいるでしょうね。
でもバカじゃなければ、普通にrobot.txtとか、メタタグで回避できるクローラー、
万が一
Re:収録されたくないとか (スコア:0)
Re:収録されたくないとか (スコア:1)
ああ、そうそう。アンダーグラウンドの略じゃなくて、ウガンダのドメインですからね。お間違えなく。
--- ほしみ
全部保存 (スコア:2, すばらしい洞察)
Re:全部保存 (スコア:0)
該当記事を削除して証拠隠滅を図ることがありますが、そういった
記事をしっかりアーカイブしてくれるのなら「意味がある」と
言えるのではないかと。
一年前じゃ過去の遺物 (スコア:1)
> 随時更新などによりデータが消滅していることを懸念
してるにも関わらず、
> 毎年1月から3カ月程度かけて、その時点の内容を読み取る
ことしかしない、というのは、矛盾してる気がするなぁ。
特にコンピュータ系の、技術文書(とか解説サイト)は、
年に何度もバージョンアップなどに応じて更新されると
思われるので、一年前のページを閲覧できたからって
得るものは少ないような。
# 一年前は、それはひどいHTMLを書いていたのでID。
# そして収集され始める頃にはもう学校にはいない…ハズ。
Your 金銭的 potential. Our passion - Micro$oft
Tsukitomo(月友)
Re:一年前じゃ過去の遺物 (スコア:1)
一応,jpドメインも収集してるみたいだし・・・って
試しにチェックしたが slashdot.jp は 2004年2月までしか保存してないな。
そもそも,その内容も 2003年11月30日って一体?
Re:一年前じゃ過去の遺物 (スコア:1)
以下、「遠く過ぎ去ったあの日々に……Wayback Machine [seo-ch.jp]」より
このあたり(FAQ) [archive.org]もご参照を。
"Make Love, Not War"
Re:一年前じゃ過去の遺物 (スコア:0)
せめて (スコア:1)
でないと、全然意味のないタダの税金の無駄遣いにしか思えないかも。
でも、*.jpって言うことは、下層まできっちり保存するのかな?
ウェブアーカイブと差別化を図って欲しいところです。
#きっと、可能性っていうのはその辺に落ちているんだけど
#気がつかない物じゃないかなと思う。
国内法ってどこまで及ぶんだろう (スコア:1)
1)IP アドレス的に日本にあるサーバから発信されている
2)JPNIC(というか JPRC ?)にレジストしている
3)日本国席を持つ個人もしくは日本に法人登記のある法人が「管理」しているコンテンツは全て
3)といったって、その「管理」ってのが何を指すのかあいまいなんだよな。
屍体メモ [windy.cx]
Re:国内法ってどこまで及ぶんだろう (スコア:0)
ですから、「およそ国内法が及ぶ範囲しか収集できない」という事はありません。
日本の国内法が及ぶ範囲は、日本国内からアクセスできる相手方全てと、日本国籍を持つ者が海外で行った事象全てですが、実際に執行できる範囲とは一致しません。
外国人が日本に入国して犯罪を犯し、拘束されずに海外へ逃亡した場合と一緒です。
相手国との間に犯罪者引渡し
ことさら集めなくても (スコア:1)
キャッシュのスナップショットを保存すれば良いのではないかな。
それとも、納本制度にする?
民間のWebページがアップロードされたときは、文化財の蓄積及びその利用に資するため、公開者は、アップロードの日から30日以内に、最良版の完全なもの1ページを国立国会図書館に納入しなければならない…
てかInternet Archiveで十分じゃ? (スコア:1)
インターネット資源選択的蓄積実験事業 (スコア:1)
民間活用 (スコア:0)
Re:民間活用 (スコア:1)
ヤフージャパンに登録されているサイト対象にすればの話ですが、
・サイトのトップページに関しては晒すことが前提のはず
・ビジネスエクスプレスと言うのがあるにせよ、有用性とか独創性とかが審査されている
・登録されているのだからjp以外のドメインでも拾える
おまけの効能として
・明らかに有用性がないサイトは最初っからアーカイブの対象外
・ヤフーに登録してあってもサイトが無くなっている場合のチェックもできる
・ついでにアダルトサイトとかに変身しているサイトのチェックもできる
弊害は
・1つの企業の方針で登録されているサイトのアーカイブになってしまう
・有用でも登録されていないサイトはアーカイブされない
・金払えば、アーカイブされるような錯覚を起こす
・ヤフーの経営者が嫌いな人には良い顔されない
他にも色々ありそう。
Re:民間活用 (スコア:0)
有用性があるかどうかは、現在の視点からのみ量れるものではありません。
例えば、民俗学の観点から見れば、その時点において「保存する価値など無い」と思われていたようなものにこそ価値があります。
Re:民間活用 (スコア:0)
WinnyやWinMX上に流れている雑多なファイルも全て保存しておくような、
P2Pファイル交換版のInternet Archiveも有ればいいのになぁ。
Re:jpドメインだけかよ! (スコア:0)