パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

4件のクレジットカードの利用情報があれば、90%の個人は特定できるという研究結果」記事へのコメント

  • 3ヶ月以内の4件のクレジットカード利用の「店舗」と「日付時刻」のデータから、個人を特定するという事でしょうか?
    だとすれば、クレジットカード以外に個人の行動データが既にどこかで記録されていて、それと照合をかけると言うこと?
    クレジットカードのデータよりも、そちらの方がよほど怖い気が……

    私の過去一年のクレジットカード利用履歴は全て通信販売ですが、それでも特定されたらかなり怖い……。

    #余談ですが、記事の「個人を一位に特定できた」の「一位」はリンク先では「一意」となってるようです。
    • by Anonymous Coward on 2015年02月02日 15時27分 (#2754243)

      原文読まないと分かりづらいですね。

      ・100万人、3ヶ月分の匿名化されたクレジットカード履歴がある
      ・ここで、(カード履歴とは別に)「エヌ氏は何月何日にこの店に行った」という情報をp個知っているとする
      ・先のカード履歴からエヌ氏の履歴を特定するために最小のpはいくつか?
      という調査を行ったところ、
      ・p=4、つまり4個の情報を知っていればカード履歴の山から個人の履歴が特定できる という結論が得られた、ということのようです。

      この結果から、筆者らは、カード履歴をビッグデータとして扱う際に名前や住所を伏せただけでは十分な匿名化ができたとは言えないのではないか、という問題提起をしているようです。

      親コメント
      • by Anonymous Coward

        p個ってのが単一グループ企業のものだった場合でも成功するのであればかなりの脅威ですね
        でもp個の情報が偏っているという前提があると精度が90%から大きく下がるだろうという気もする

        しかし名前や住所以外に何を伏せれば有効なのかって言うとうーん・・・

    • 原文ですか……。
      英語苦手なんですよねぇ……orz
      親コメント
    • >#余談ですが、記事の「個人を一位に特定できた」の「一位」はリンク先では「一意」となってるようです。
      ストーリー by hylom

    • by Anonymous Coward
      個人を特定するということではなくて

      ・A氏のカード利用履歴から4件
      ・B氏のカード利用履歴から4件

      を比較すれば、A氏とB氏が同一人物か否かを高い精度で判定できる、ということ。

      逆に言うと、特定人物Aの買い物履歴(少なくとも4件)さえあれば、膨大なビッグデータの中から”同一人物と思われるデータ”を抽出することができそうだ、ということ。
    • by Anonymous Coward

      日本語訳が悪いのかもしれない。原文はこれかな
      http://www.sciencemag.org/content/347/6221/536.full?sid=9e230948-955e-... [sciencemag.org]
      あとで読んでみよう。

      自分も圧倒的に通販利用が多い。だいたい同じようなサイト・商品ジャンルを繰り返すことになるから、これはこれで絞りやすそう。

      # Amazonでよく買い、楽天では一切買わず、海外のデジタルコンテンツをPaypalでよく買うのは、たぶんこいつです。

    • by Anonymous Coward

      論文をちょろっと読んだ感じでは
      店舗からの情報で構築されたクレジットカードの利用履歴データベースがある。ユーザはIDで記録されていて名前はわからない。
      ある人(たとえばScottさん)のカード利用行動(何月何日にどこで買い物をした)の情報をいくつか入手できれば
      上記のDBからその行動に当てはまる人を検索するここで、DB上での彼のIDがわかる。
      という話のようですよ

      特に珍しい話でもないのではなかと

      • > 特に珍しい話でもないのではなかと

        100万人の利用履歴が3ヶ月分ある場合は
        たかだか4件の追加情報があれば,100万人から1人を特定できることを
        具体的に数値で示した点は新しいと思います.

        意味的には,単純な統計の話で,確率を計算しただけですが,
        それを珍しくない,というのは後出しジャンケンと一緒です.

        親コメント
    • by Anonymous Coward

      バカッターだって似たようなものだし、ちょっと本気出せば個人なんてのは簡単に特定できるものなのでしょう。

ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ

処理中...