パスワードを忘れた? アカウント作成
6315 story

Googleキャッシュで鳥取県個人情報流出の2次被害 122

ストーリー by Oliver
一度でたらもう引っ込まない 部門より

jbeef曰く、"毎日新聞DIGITALトゥデイに8月8日付で「鳥取県HPから個人情報が“2次流出”」という記事が出ている。これは、8月1日の新聞報道「鳥取県HPから個人情報流出、 最長9カ月間」(朝日新聞の同事件の記事)の続報のようだ。1日の事件では、県行事「全国創作和人形コンクール」の応募者89人の住所や電話番号を誤ってWebで公開していたのを「2ちゃんねる」掲示板で指摘されて、削除したというもの。しかし、報道発表後も、Googleキャッシュで閲覧可能な状態が続き、5日夜に削除されたという。県広報課は、

外部からの指摘もあり1日の時点で検索サイトの運営者に削除依頼を出した。[...]
個人情報が流出してしまった後の対応については、マニュアルなどはなく、手探りでの対応で、検索サイトにまで思い至らなかった

と説明しているそうだ。いろいろ突っ込みどころのある事件だ。まず第1に、1日に削除依頼を出したのに5日まで削除されないというGoogleの体制はどうなのか。第2に、個人情報を誤って公開しかねない業務に携わる者の全員が、Googleキャッシュの存在を知っていなくてはならないのか。第3に、そもそもGoogleのそれは、技術的に「キャッシュ」ではなく「ミラー」と呼ぶべきものではないのか、など。"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by marl (12874) on 2003年08月11日 17時11分 (#376860)
    > 検索サイトにまで思い至らなかった

    InternetArchive [archive.org]の対応はどうなっているのでしょう。
    こっちも残っている可能性があるのでは。

    > 第2に、個人情報を誤って公開しかねない業務に携わる者の全員が、
    > Googleキャッシュの存在を知っていなくてはならないのか。

    平成国立インターネット図書館 [srad.jp]なるものもそのうちできるらしいですし、
    そういったものを全て把握するなんて不可能でしょう。
    同ストーリーで#366598のAC氏 [srad.jp]が危惧していた
    「うっかり個人情報が漏れてたらそれも保存されちゃう」
    が本当に起こってしまいましたね。
  • 本質 (スコア:3, 参考になる)

    by Anonymous Coward on 2003年08月11日 18時22分 (#376899)
    >応募者89人の住所や電話番号を誤ってWebで公開していた

    いったん流出した情報を制御することはできないのだから、
    個人情報のようなものの一次流出こそが対処すべき防問題だと
    本質であると教えてやってください。

    目立ったとしても、Google や Web Archive 経由の流出は
    派生事例に過ぎないのだし。robot 除けなんざあっさり
    無視する躾のなってない覗き屋を飼ってるところもあるしね。
    • by kiyotan (3912) on 2003年08月11日 19時17分 (#376952) 日記
      どんな形で流出したのか、よくわからんのですね。
      とりあえず、「内部向け」と称するものを
      外部に公開してるサイトに置いた時点で敗北なんだろうなぁ。

      #記事を鵜呑みにすると、該当ページを作った人は
      #できた結果を自分の端末で表示して確認ってことを
      #やってないんだろうか?と思ってしまう。
      #「掲載」の意味が微妙ですが...
      --
      Kiyotan
      親コメント
  • ビジネスの予感 (スコア:3, すばらしい洞察)

    by mizuho (7378) on 2003年08月11日 20時50分 (#377003)
    任意のサイトをキャッシュするエンジンが複数個存在する以上、
    素人にはこういった問題に対処するのが難しいと思われます。

    そこで、この問題を解決するビジネスってのもアリかも。
    問題が発生した際、片っ端からキャッシュされた内容を
    削除してもらうようお願いして周るというお仕事。

    著作権の問題は今後のwebでも依然問題となるだろうから、
    そこそこ稼げるかもね。
  • by tsuya (14020) on 2003年08月11日 17時03分 (#376851) 日記

    いけない情報を公開してしまっていた管理者は、単なる削除じゃなくて、別のファイルを置いておいて、そちらへのキャッシュの変更が一刻も早く行われるのを待つのが正解、ということでしょうかね。もちろん、Googleへの削除依頼も合わせて行うべきでしょうが。

    ところで、Googleのようなキャッシュサイトって他にないのかな?

    • by Anonymous Coward on 2003年08月11日 17時55分 (#376884)
      世の中にはgoogle以外にキャッシュやアーカイブしてくれるところが
      幾つも有りますし、今後増えないという保証はありませんので
      robots.txt やその他アクセスコントロールを一通り準備しておいて
      その上でコンテンツを乗せていくというのを
      とりあえずおまじない的手順にしてしまえば、
      うっかり漏洩事故があったとしてもそれがキャッシュされてしまう
      二次災害までは防げるように思えます。

      個々のアーカイバーの存在を気にするのではなく、
      アーカイバーは沢山あるけど robots.txt でまとめてコントロールできる
      という考えになれば各地のサイトの動向を気にする必要はないでしょう。
      親コメント
    • ダウト (スコア:1, 参考になる)

      by Anonymous Coward on 2003年08月11日 17時24分 (#376863)
      googlebot のクローリングは月1くらいが多いのです. 2~3日毎に廻ってくるようなら、それは更新頻度の高い人気サイトの証
      親コメント
      • Re:ダウト (スコア:1, 参考になる)

        by Anonymous Coward on 2003年08月11日 17時50分 (#376881)
        一応、手動でクローリング先登録をしとけば1~2日で更新されるようです

        前に爆弾ヲタが「家庭用品で作る爆発物」だかって厨サイトを掲示板spam行為で宣伝しまくりしていて、間髪入れずにサイト閉鎖に追い込んだ後に、グーグルキャッシュを宣伝しまくりを始めたので追加攻撃でクローリング先登録をしたらソレ位で消えてましたから…

        別の理由で消えたのかもしれないけど…
        親コメント
        • by Anonymous Coward
          何と書いてあるのか判らないのですが。(主語が無いせい?) 元ACさんか意味が判る方、詳しいご解説をお願いします。
          • Re:ダウト (スコア:1, おもしろおかしい)

            by Anonymous Coward on 2003年08月11日 18時27分 (#376908)
            じゃ、私が読みとれた内容を追加して、書いてみます、

            (Gooleについてですが、)一応、(だれかが)手動でクローリング先登録をしとけば1~2日で(キャッシュが)更新されるようです
             
            (実例として、)前に
            ・爆弾ヲタが(作った)「家庭用品で作る爆発物」だかって厨サイトを (だれかが、)(色々な?)掲示板(に)(削除:spam行為で)宣伝(を)しまく(s/りして/って/)いた
            ・(その宣伝をみた私が)(サーバ管理者に連絡して)間髪入れずに(その)サイト(を)閉鎖に追い込んだ
            ・(宣伝していただれかは)グーグルキャッシュ(s/を/の/)宣伝しまくりを始めた
            ・追加攻撃で(私がGoogleの)クローリング先(としてそのページの)登録をしたらソレ位(1~2日)で((404 Not Foundを検出して)googleキャッシュから)消えてました
            から…
            親コメント
      • Re:ダウト (スコア:1, 参考になる)

        by Anonymous Coward on 2003年08月11日 18時12分 (#376893)
        うち、そんなに人気が高くない(ページランクが低い:バーが半分くらい)個人サイトですが、ほとんど毎日来ます>Googlebot

        概ね翌日から翌々日にはキャッシュと検索結果に反映されます。時々1週間とかかかりますけど..。どういうアルゴリズムでぐるぐる回って更新しているんだろう。

        Googleを検索していると「速報」登録とじっくり計算してから登録する「確定」登録があるようだ、というところまではわかっているのですが。

        親コメント
  • by Anonymous Coward on 2003年08月11日 17時10分 (#376858)
    2日と3日が土日という事も考慮して、県の担当者が1日の何時頃要望をGoogleのどの窓口に出し、間にどの程度のやり取りがあって最終的に5日の何時頃対策されたのか知りたい。常識で考えてもmailで「このページを消してね」というだけでは(mail address詐称などを考慮すると) Google側も本当に抹消すべきか判断出来かねるだろうし。
    Googleからの問い合わせで県の担当者が外出中で連絡が取れなかったなんて話だとまた別の問題を考えなきゃならんだろう。
    • by Anonymous Coward on 2003年08月11日 17時14分 (#376861)
      Googleのページの削除 [google.co.jp]の通りにやれば、すぐに対応してくれると思うし、これまではすぐに対応していたように記憶している。新聞報道を見た限り、Google側の対応が遅れたという記載はないようなのですけど。
      親コメント
    • by marl (12874) on 2003年08月11日 17時30分 (#376866)
      記事を読んでみたけど、

      > 県行事の応募者分については、外部からの指摘もあり
      > 1日の時点で検索サイトの運営者に削除依頼を出した

      でいったん文が切れていて、

      > 韓国人訪日団員分については「検索サイトでの掲載を全く知らなかった

      というふうに文が続いているから、
      ・応募者分は1日に削除依頼を送った → すぐ削除された
      ・韓国人訪日団員分は5日夜に削除依頼を送った → すぐ削除された
      なのではないでしょうか。
      親コメント
      • ただ、その直前の段落に、
        県は、ホームページ上からこれらの情報を削除し、1日に発表した。しかし、大手検索サイト「Google」には、過去のホームページの内容を保存、表示する機能があったため、いずれの個人情報も公開されている状態が続き、5日夜の県側の処置で削除された。
        と、わざわざ「いずれの個人情報も」と書いてあります。
        これを素直に読むと、両方の情報が5日夜まで見えたようにも感じます。

        #ま、わたしはmarlさんの意見に賛成なんですが
        #すぐに削除されたかどうかは別として
        親コメント
  • by Anonymous Coward on 2003年08月11日 18時15分 (#376896)
    個人情報が流出してしまった後の対応については、マニュアルなどはなく、手探りでの対応で、検索サイトにまで思い至らなかった
    これ [tottori.jp]は何ですか?
  • by s_mkk (14567) on 2003年08月11日 18時30分 (#376910) 日記
    >技術的に「キャッシュ」ではなく「ミラー」と呼ぶべきものではないのか

    技術的にはINDEXING(INDEX)だと思うのですが、
    索引を作る過程でデーターを「キャッシュ」してしまう。

    もしrobots.txtが禁止制でなく許可制であれば今回の様な事は
    起きないのではないでしょうか。
    たとえば、
    Disallow: /
    ではなく
    Allow: /
    のような事です。
    またrobots.txtが存在しない際の挙動が禁止制であれば。

    とは言ってもあくまで紳士協定の域をでないのも問題ですかね
    • by Anonymous Coward on 2003年08月11日 20時23分 (#376989)
      >もしrobots.txtが禁止制でなく許可制であれば今回の様な事は
      >起きないのではないでしょうか。
      つまり許可したやつ以外はくるな、と。
      それってリンクするのに許可がいるのかという(以下フレームの源)。

      そもそもどれだけの人がrobots.txtを知っているのでしょうか。
      /.Jを見る人は知ってるでしょうが、今や子供や老人もページを持つ時代ですからね。
      だから仮に許可制にしたら、引っかかるのがほとんどがエロページになったり。

      >とは言ってもあくまで紳士協定の域をでないのも問題ですかね
      そもそも普通のユーザアクセスとボットの巡回とを紳士協定以外で
      見分ける方法はないでしょ?
      親コメント
  • 住基ネットですか?
  • …はまだ無いみたいですね。みんな日頃お世話になってるから?
    こうした個人情報流出なんて事件はこれからも続くでしょうし、
    キャッシュの消去はその都度必要になるでしょうから、これから
    そうした時、googleには素早い対応を求めたいですね。

    「あったものをキャッシュしただけでgoogleは悪くないじゃん」
    と言う意見は間違ってないと思いますけど、そこは一企業の誠意
    として。
    • by Anonymous Coward on 2003年08月11日 20時07分 (#376984)
      googleキャッシュと称されるミラーファイルの無断公開は著作権侵害だ、
      という視点に立てばgoogleがそもそも悪いという議論だってあり得ますわな。
      (検索エンジンのキャッシュは著作権侵害か? [srad.jp]
      |GoogleがDMCA的削除要求を公開 [srad.jp]
      |Wayback Machineが著作権関連でトラブル [srad.jp])
      私としても日頃お世話になってるんであんまり考えたくないことだが、
      キャッシュ削除依頼を重ねるよりもむしろ著作人格権侵害で民事裁判
      起こしてgoogleから金を取ろうと本気で考える輩が出る可能性はあるかも。
      親コメント
      • by Anonymous Coward on 2003年08月11日 20時52分 (#377005)
        キャッシュを望まないならrobots.txtで制御せよ、 で良いでしょう。

        robots.txtは1995年頃から既に仕様が安定し、 webサイトを運営する者にとっては常識的な話になっていましたので、 その後からwebサイトの運営を始める者は「郷に入っては郷に従え」になることでしょう。 元々のworld-wide webの精神から考えると、 「拒否を明記しない限りデフォルトキャッシュ許可」 というgoogleの方針は技術的にも歴史的にも根拠があるように思えます。

        親コメント
    • いざというときには (スコア:1, おもしろおかしい)

      by Anonymous Coward on 2003年08月12日 1時38分 (#377130)
      「Webサ-バのデ-タが飛んだ! バックアップとってなかった! そうだGoogleのキャッシュに残ってるぞ!」
      こういうこともあるので続けてもらわないと困ります。

      #ホントにあった話なのでAC
      親コメント
  • by Anonymous Coward on 2003年08月12日 0時18分 (#377091)
    >技術的に「キャッシュ」ではなく「ミラー」と呼ぶべきものではないのか

    「キャッシュ」かどうかはさておき、少なくとも「ミラー」と呼ぶのは違うでしょう。内部的にはともかく、ユーザーにはミラーページとして見えてるわけでも、そう意図して提供されているわけでもないから。

    「キャッシュ」でないとも言い難い。元サイトより軽い場合が少なくないので、手早く内容を確認する目的でよく使うし。

    なので、私的には「キャッシュ」。
    • by take0m (4948) on 2003年08月12日 10時37分 (#377259) 日記
      むかしサーチエンジンを作ったことがあるのですけど、

      サーチエンジンのインデクサがクローラと連動して、あるいはクローラに含まれていてリアルタイムにインデキシングせずに、クローラで取得したデータをファイル化してサーチエンジン内に保存し、後でまとめてインデキシングするというパターンの場合の、一時保存されたファイルがキャッシュですかね。

      それを外部に公開するからもめているんだと思います。

      それをキャッシュと記述しているからさらにもめるんだと思います。

      GoogleはPageRankを付ける必要上ページ間の依存関係が必要となりますから、全ページをキャッシュした後にインデキシングしないといけないのだとも思います。

      サーチエンジンにとって収集したWebページの使用目的はサーチエンジンのためのインデキシング用途であって、Googleのように大公開するのは二次利用と言えなくもないですよね。
      親コメント
    • by pmon (17095) on 2003年08月12日 0時28分 (#377096)
      うちの職場でフィルタリングかかってるサイトを
      どうしても見たいときはキャッシュを見て何とか
      頑張ってます。
      親コメント
  • by Anonymous Coward on 2003年08月11日 17時35分 (#376869)
    県広報課によると、県行事の応募者分については、外部からの指摘もあり1日の時点で検索サイトの運営者に削除依頼を出したが、韓国人訪日団員分については「検索サイトでの掲載を全く知らなかった」と説明している。
    応募者分の指摘を受け、対応までしてるのに、韓国人訪日団員分に関しては「全く知らなかった」というのはどうかと思うが。個別に指摘してやらないといけないのだろうか?
typodupeerror

アレゲはアレゲを呼ぶ -- ある傍観者

読み込み中...