"Internet Archive 日本版"? 平成国立ネット図書館計画発表 46
ストーリー by Oliver
そして歴史の一部に 部門より
そして歴史の一部に 部門より
strayDuck 曰く、 "産経新聞 7/27付朝刊によると、総務省と国立国会図書館が共同で「平成国立インターネット図書館」を構築することが明らかになった。短時間で更新、削除されてしまうウェブページを"知の資産"としてきめ細かく保存、一般に公開するのが目的という。計画は来年度から始動、総務省は平成18年の実用化を目指すとしている。
ちょうどInternet Archiveがやっているようなことを国がやるということでいいんでしょうか(記事ではここを例に挙げて紹介している)。しかし資料収集のための 300 億円というのは妥当なところでしょうか。あと、集める対象が HTML ファイルのみか、その他のファイルも収集するかどうかも気になるところ。"
前ストーリー (スコア:2, 参考になる)
今回ストーリーは、それに進捗があって、具体化してきたという話なのかしら…
Re:前ストーリー (スコア:1)
でも、jpドメインだけなんですよね……。
せめて「日本語テキスト」とかにならないのでしょうか?
どこかのポータルサイトを買い取った方が早い気がします。
Re:前ストーリー (スコア:1)
タレコミ主です。前ストーリーの存在を投稿後に思い出しました;-(。
ですが、.jp 以下ってのは当面の話なんですよね?
# "当面"がいつ終わるのかは(略
あくまで "自前で" "(落書きだろうと)何でも" "保存しておく" のが最終目標なんでしょうから、まぁ頑張ってねーとしか言えない気もまたします。
Re:前ストーリー (スコア:2, 興味深い)
それだったら期待できないなあ。総務省だしなあ。
俺は、産経の記事の「保存方法の標準化」っていうのにちょっと期待したんだけど。検索しやすい保存方法の標準化をして、それを W3C などにフィードバックをするなんていうことを期待してはいけないのだろうか。
「平成国立インターネット図書館」 という名称は予算とれたら速攻で替えて欲しいです。
# なんか、平成天才パカボンを思いだした、いや、どうでも良いのですが。
Re:前ストーリー (スコア:1)
やはり:-)
「保存方法の標準化」は依然魅力的ですね。そこからのデータの利用もしやすくなるわけですごくいい。しかし、(また記事から憶測ですが)そのような目的を持っているとは読めないように思います。
けれども国会図書館にはぜひ、「とりあえず集めときゃいいだろう」ではなく1歩先 -- その有効な利用法 -- まで考えていてもらえるといいと思うのですが。
カレントウェアネス (スコア:2, 参考になる)
ざっと見ただけですが、
あたりを読んでみましたがとても面白かったです。
Re:前ストーリー (スコア:1)
標準化することにより同じような世界のウェブ図書館とリソースの分散も可能になるかもしれないし。
Re:前ストーリー (スコア:0)
次のステップは (スコア:2, おもしろおかしい)
MINERVA, PANDORA, Kulturarw3 (スコア:2, 参考になる)
COLLECTIONS POLICY STATEMENT [loc.gov] をざっと読んだのですが、これと産経の記事を読むと 米や豪みたいに選択的な収集をしようとしていたけど、もっと範囲を広げないとだめだっていうことになったのかな、と思います。
様々なところで研究されていることだとは思いますが、文脈やハイパーテキストから自動的に分析して情報の断片から容易に一次情報に辿りつけるようなシステムを作ってくれると本当に電子図書館という気がして嬉しいのですが。
安易な特許の歯止めになるかも (スコア:1, すばらしい洞察)
逆に、申請された特許に異議を申し立てたければ、申請内容が既に存在するものであることを証明すればいいわけです。今までは、それを証明したくても証拠を見つけるのが難しかったけど、これがあれば「この申請内容は○年○月○日(申請日以前)にhttp://????.co.jp/に公開された内容と同じなので却下して下さい」と言う事が可能になったわけです。
もちろん、今まででもInternet Archiveのアーカイブで同じ事が出来たわけですが、役所がやってるサービスの方が、証拠としては認められ易そう。
Re:安易な特許の歯止めになるかも (スコア:1)
もちろん証拠のひとつであり、そこになければ存在しないわけではないでしょうが。
Re:安易な特許の歯止めになるかも (スコア:0)
これって (スコア:1)
わざわざ某大型掲示板の過去ログ見るために出かけていったりして。
#オンラインで公開してくれても、たぶん最初はアクセス集中でサーバダウンに一票。
某巨大掲示板の (スコア:0)
# ちょっと油断するといつの間にdat落ちする
# 漏貧スレを追っかけてるのでAC
● (スコア:0)
落書きも対象ですか? (スコア:0)
>保存するウェブページの選択が問題になるが、総務省では、「書き込みなどの“落書き情報”が歴史資料として重要な意味を持つこともある」としており、保存対象はできるだけ幅広くしていく考えだ。
とあるのだが、それを集めだしたらとんでもない量になるような気がするが大丈夫か?
2chあたりが真っ先にアーカイブに使い出しそうだ。
とんでもない量 (スコア:0)
100億ページを 100テラバイト収集し、毎月10テラバイト
増えていると 2001年に発表 [impress.co.jp] しました。
収集対象であるWebはこの数年でも更に増えつづけていますので
いまはもっと凄いことになっているでしょう。
もっとも、大変なのはディスク容量だけでなくその膨大な
Webサイトデー
著作権問題は? (スコア:0)
送信可能化権を廃止してくれると嬉しいんだけどな~
特例法でも設けるんでしょうね~
Re:著作権問題は? (スコア:1)
にしても、廃止ってのはやはり考えにくいですよね。
Re:著作権問題は? (スコア:1)
どうしたらよかんべなあ。という感じですが。
原本性認証? (スコア:0)
できっこないように思えるが。
総務省がやるってだけでろくなもんでない予感。
Re:原本性認証? (スコア:1)
そのようない技術自体は色々有るでしょうけど、ブラウザがついてくるのか。。
# というか、httpサーバーからのヘッダくらい簡単に確認する手段を付けてくれ。。
# Lite [jah.ne.jp]みたく。
Re:原本性認証? (スコア:0)
そういう話ではなくて、本当にそのデータが、元あった場所にあった内容なのかを証明する話ですよ。どう考えても無理ですよね。元のサイト自身がコンテンツに電子署名してない限り。
だいじょうぶ☆ (スコア:0)
表示方法は? (スコア:0)
保存されたくないものはどうなる? (スコア:0)
いったん公開されたものが永遠に残ってしまうことについて議論百出だったと思うんですが。
取り消す手段とか、あるんでしょうか。
うっかり個人情報が漏れてたらそれも保存されちゃうの?
弾くとしたらチェックはどうやる?
署名されたページの電子公証としての機能は期待できると思うけどなぁ。
#ロボットのプロトコル教えてくんろ。蹴るから。
Re:保存されたくないものはどうなる? (スコア:1, すばらしい洞察)
(材質の劣化がどうのとかいうのはおいといて)
一度出したものを、「やっぱ完全になかったことに」ってこと自体
無理があることです。
Re:保存されたくないものはどうなる? (スコア:0)
メディアの特性を無視した議論に意味があるの?
Re:保存されたくないものはどうなる? (スコア:0)
この際電波も全部保存しる。
Re:保存されたくないものはどうなる? (スコア:0)
Re:保存されたくないものはどうなる? (スコア:0)
Re:保存されたくないものはどうなる? (スコア:0)
Re:保存されたくないものはどうなる? (スコア:0)
ネット上の情報の場合、10人/日程度、500人/年程度のページでも、googleさんなどがキャッシュしてたりします。
また引用・ミラーが容易なため、例えば複数のアーカイブサイトから削除できたとしても、まったく安心できません。
ところが。
通常の書籍として販売する場合、初期コストが高い上に絶版後はほとんどモノを入手できず、内容を照会することもできなく
Re:保存されたくないものはどうなる? (スコア:0)
Re:保存されたくないものはどうなる? (スコア:1, おもしろおかしい)
「10 TB のストレージは 4 台目だ。物理的な容量の問題は無い。 計画は 1PB だからな...ここに溜まった情報が問題だ。 個人情報、事件、版権物、グロ、わいせつ、手口、遺伝情報、 寝ている犬の動画... 分類可能ならよい。暗号化された zip、 意味不明なバイナリもある。
当然公開は問題だ。誰が分類し、法的な解釈を加えるのだ。 300 億円?何人でチェックするつもりだ?とても見切れない。 自動分類はとっくの昔に無力だ。特に Under Ground はそうだ。 だからいまは公開停止中だ。だが、保存はこの瞬間も続いている。
マスコミは箱を作って運用が無いと批判する。ここで 1 日 1 万枚の 画像ショット(それとも音声)を浴びせてやいたりものだ。」
[20060728.024549] STORE: http://tsubo.go.[●]/kanchou/blog/20060728.htm.
Re:保存されたくないものはどうなる? (スコア:0)
そんな少なくていいのかなぁ? うちの個人のストレージさえすでに1TBを越えているのだが...
Re:保存されたくないものはどうなる? (スコア:1)
# 自分で作ったものなぞ0.01%もあるもんかい。
マラソンで二位を抜いたら何位?
Re:保存されたくないものはどうなる? (スコア:0)
Re:保存されたくないものはどうなる? (スコア:0)
署名が、盗まれたものでないなんて保障はどこにもないな。
その場合は公文書偽造か?:(
なぜに「平成」? (スコア:0)
平成ももう15年になるというのに、
なぜいまどき名前に「平成」を付けるのかな。
Re:なぜに「平成」? (スコア:1)
いや、仮称だから変えてくれるもんだと信じたい。
パンドラや、ミネルバに対抗する良いプロジェクト名をつけてほしい。
やはり学問の神様である天神様にご出馬願うしかないか、それとも智慧のということで、
もんじゅ。
Re:なぜに「平成」? (スコア:0)
#「平成」なのは、じきに終わるから記念とか?
Re:なぜに「平成」? (スコア:0)
平成に始めるんだから「平成」を冠してても良いのでは?
Re:総務省のやることは (スコア:0)
総括的にはいいベクトルだと思うけどな。
こういう公共的な事業を理由に、認証やら検索やらアーカイブやらの
オープンな技術に国として支援する理由ができるんじゃない?
総務省の名前がでるだけでダサいのは否めんが。