アカウント名:
パスワード:
武雄市長のコメントは?
もちろん、「閲覧履歴は、カルチュア・コンビニエンス・クラブ(CCC)には、統計情報として利用され、特定個人には結びつかないので、個人情報ではありません。」でしょ。野暮なことは聞かない。
ところで、この手の、どんな情報でも統計情報として処理されると個人情報ではないという神話の最初はどのWebページなんでしょうかねぇ。
コレ [meti.go.jp]のp.3、2-1-1の
【個人情報に該当しない事例】事例3)特定の個人を識別することができない統計情報
ではないかと。というかそんな神話、聞いたことないけどどこにあるの?
経産省がやってる企業統計などでは、母数が極端に少なくて会社が特定されかねない場合、統計はとっているけど公表しません、見たいなことしてる。企業からすれば統計データを元に国税庁とかから睨まれたら敵わないし、正確な統計が得られなければ経産省も困るので、経産省なりに配慮している。
葛飾区のTSUTAYA○○店の23歳男性会員数が1-2名だったとしたら、「TSUTAYA○○店の23歳男性のレンタル記録」は個人情報になりうる。でも該当者が10名位いて、その集団のレンタル履歴を曝すのはOKとかありうる。
ビッグデータ舐めんな。「趣味嗜好含めたアンケート回答」なんぞよりもよっぽど詳細な分析が可能です、ってのがウリなんだぞあの業界は。
ちなみにマーケティングの成果分析とかには実際統計情報として使用するだけだろうけど、クーポンやDM発送の類の用途だと最終的には個人と購買記録がバッチリ結びついた形で利用可能だからな。今やってなくも(不可能な規約だったとしても)将来的にはそれを視野に入れてるってのがビッグデータ商売。
つうか統計データの解釈を根本的に間違えてる。
10人の購買履歴をマージしたものではなく、10人に10個のIDを振って「IDxxxがyy/mm/dd hh:mm:ss に店舗XXのPOS端末YYでAAAとBBBとCCCを借り、yy/mm/dd hh:mm:ss に店舗XXのPOS端末YYで返却した」的な情報の形で使う。で、これにyy/mm/dd hh:mm:ssの気温だの天気だの交通網の状況だの付近の学校・企業の営業時間だの同じIDxxxを使った別種の店舗の情報を加えて分析する。んで、購入時間や他の店舗の類似性などからIDxxxとIDxxyは似た傾向の人間(例えば「~高校1年生」「男子」「帰宅部」など)としてクラスタリングして、クラスタに対してよく売れる・売れそう・売れた商品等の情報を使って新製品だのキャンペーンだのを展開する。特定のクラスタで流行した製品が別のクラスタでの流行を生むようなアーリーアダプタの特定なんかもする。アーリーアダプタを多く含む集団に対して広告を打つことなんかもする。例えばアーリーアダプタとクラスタリングされた集団の行動分析の結果よく通ると推測される場所や店舗でビラ配りや広告やキャンペーンを展開するとか、アーリーアダプタが多く参加しているDMがあったらそこにクーポンを送るとか、そういう事をする。DMの規約によってはIDxxxに対してクーポン発行とかも可能(クーポンを出す側はIDxxxしか分からない…がDM送れる時点で個人特定済みも同然)
アプローチ掛ける側からしたら統計情報だけど実際アプローチ掛けられる側からしたらクラスタのラベル名がヤバいことになっている。
そういう商売がビッグデータ(データマイニングて言い方する場合もある)。
で、この情報がある程度蓄積されていれば、IDが降られて無くて属性情報だけでも、あるいは同一人物が2つ以上のIDを持っていても同一人物だって検出できるんですよね。武雄のゆかいなおじさんは個別IDがふってなけれや個人情報じゃねえと言っていましたがもはや時代は進みすぎている。
ここら辺が先に発生していたのがWebのアクセス解析から始まるWebマーケティング界隈だけれども、ここら辺は警戒され始めていて、Googleは検索をhttpsにするわ、Twitterもhttpsにするわけでキーワードやリファラがとれないし、Facebookなんてクローズドなサービスが出てくるといった事で対策が行われてきています。(まぁ囲い込みの意図もあるんだろうが)
いろいろセキュリティが固くなってて最近マーケティングができないぞむむむ…そうだ!スパイウエアを組み込めばいいんじゃね?うわw俺天才wwすげえ頭いいwww → jbeef先生どころかセキュリティ専門家がみんな怒るやら呆れるやら… と言うのが今回の話ですね。
個人情報の再定義を行うべき時が来ているのかも。
これは既にやられていることであってビッグデータでもなんでもない。ビッグデータはその一歩先だよ。
なんか勘違いして無い?
残念ながらこの程度(どころかコレ以下)のデータマイニングですらビッグデータ言う輩がうようよ居るのが現状だよ。
つか一歩先とか言うけど、延々と情報を付け加えていくだけの話で基本の発想は一緒じゃなかったか?文法解析等による話題の抽出とかそー云うの含めて、付け加えて分析に使うデータの一種なわけだし。
たしかにバズワード化してますよね。とりあえずビッグデータいうとけ見たいな。
既存の分析だけだと、結局顕在化してないだけで元々存在してた要素を掘り起こしてるだけなので、全然関係ないデータぶつけて、潜在的にも存在していなかった要素を新たに生み出すようなことをやってる連中がいます。当然、そうそううまくいくはずもありませんがw #それすら、潜在的要素なんじゃね?という気もしますし
*カルチュア・コンビニエンス・クラブ株式会社は、お客様の同意を得て、株式会社オプトへWEB閲覧履歴、性別・生年月日、郵便番号などの属性データを匿名で提供します。
これも致命的なほど個人情報なんですよね。何が匿名で提供だ。CCCは人をバカにするのも程がある。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike
武雄市長のコメントは? (スコア:2, おもしろおかしい)
武雄市長のコメントは?
Re: (スコア:0)
もちろん、
「閲覧履歴は、カルチュア・コンビニエンス・クラブ(CCC)には、統計情報として利用され、特定個人には結びつかないので、個人情報ではありません。」
でしょ。野暮なことは聞かない。
ところで、この手の、どんな情報でも統計情報として処理されると個人情報ではないという神話の最初はどのWebページなんでしょうかねぇ。
Re: (スコア:0)
コレ [meti.go.jp]のp.3、2-1-1の
ではないかと。
というかそんな神話、聞いたことないけどどこにあるの?
Re: (スコア:0)
Re:武雄市長のコメントは? (スコア:2, 興味深い)
経産省がやってる企業統計などでは、母数が極端に少なくて会社が特定されかねない場合、統計はとっているけど公表しません、見たいなことしてる。
企業からすれば統計データを元に国税庁とかから睨まれたら敵わないし、正確な統計が得られなければ経産省も困るので、経産省なりに配慮している。
葛飾区のTSUTAYA○○店の23歳男性会員数が1-2名だったとしたら、「TSUTAYA○○店の23歳男性のレンタル記録」は個人情報になりうる。
でも該当者が10名位いて、その集団のレンタル履歴を曝すのはOKとかありうる。
Re:武雄市長のコメントは? (スコア:3, 参考になる)
ビッグデータ舐めんな。
「趣味嗜好含めたアンケート回答」なんぞよりもよっぽど詳細な分析が可能です、ってのがウリなんだぞあの業界は。
ちなみにマーケティングの成果分析とかには実際統計情報として使用するだけだろうけど、クーポンやDM発送の類の用途だと最終的には個人と購買記録がバッチリ結びついた形で利用可能だからな。
今やってなくも(不可能な規約だったとしても)将来的にはそれを視野に入れてるってのがビッグデータ商売。
つうか統計データの解釈を根本的に間違えてる。
10人の購買履歴をマージしたものではなく、10人に10個のIDを振って「IDxxxがyy/mm/dd hh:mm:ss に店舗XXのPOS端末YYでAAAとBBBとCCCを借り、yy/mm/dd hh:mm:ss に店舗XXのPOS端末YYで返却した」的な情報の形で使う。
で、これにyy/mm/dd hh:mm:ssの気温だの天気だの交通網の状況だの付近の学校・企業の営業時間だの同じIDxxxを使った別種の店舗の情報を加えて分析する。
んで、購入時間や他の店舗の類似性などからIDxxxとIDxxyは似た傾向の人間(例えば「~高校1年生」「男子」「帰宅部」など)としてクラスタリングして、クラスタに対してよく売れる・売れそう・売れた商品等の情報を使って新製品だのキャンペーンだのを展開する。
特定のクラスタで流行した製品が別のクラスタでの流行を生むようなアーリーアダプタの特定なんかもする。
アーリーアダプタを多く含む集団に対して広告を打つことなんかもする。例えばアーリーアダプタとクラスタリングされた集団の行動分析の結果よく通ると推測される場所や店舗でビラ配りや広告やキャンペーンを展開するとか、アーリーアダプタが多く参加しているDMがあったらそこにクーポンを送るとか、そういう事をする。
DMの規約によってはIDxxxに対してクーポン発行とかも可能(クーポンを出す側はIDxxxしか分からない…がDM送れる時点で個人特定済みも同然)
アプローチ掛ける側からしたら統計情報だけど実際アプローチ掛けられる側からしたらクラスタのラベル名がヤバいことになっている。
そういう商売がビッグデータ(データマイニングて言い方する場合もある)。
Re:武雄市長のコメントは? (スコア:1)
で、この情報がある程度蓄積されていれば、IDが降られて無くて属性情報だけでも、あるいは同一人物が2つ以上のIDを持っていても同一人物だって検出できるんですよね。武雄のゆかいなおじさんは個別IDがふってなけれや個人情報じゃねえと言っていましたがもはや時代は進みすぎている。
ここら辺が先に発生していたのがWebのアクセス解析から始まるWebマーケティング界隈だけれども、ここら辺は警戒され始めていて、Googleは検索をhttpsにするわ、Twitterもhttpsにするわけでキーワードやリファラがとれないし、Facebookなんてクローズドなサービスが出てくるといった事で対策が行われてきています。(まぁ囲い込みの意図もあるんだろうが)
いろいろセキュリティが固くなってて最近マーケティングができないぞむむむ…そうだ!スパイウエアを組み込めばいいんじゃね?うわw俺天才wwすげえ頭いいwww → jbeef先生どころかセキュリティ専門家がみんな怒るやら呆れるやら… と言うのが今回の話ですね。
個人情報の再定義を行うべき時が来ているのかも。
Re: (スコア:0)
これは既にやられていることであってビッグデータでもなんでもない。
ビッグデータはその一歩先だよ。
Re: (スコア:0)
なんか勘違いして無い?
Re: (スコア:0)
残念ながらこの程度(どころかコレ以下)のデータマイニングですらビッグデータ言う輩がうようよ居るのが現状だよ。
つか一歩先とか言うけど、延々と情報を付け加えていくだけの話で基本の発想は一緒じゃなかったか?
文法解析等による話題の抽出とかそー云うの含めて、付け加えて分析に使うデータの一種なわけだし。
Re: (スコア:0)
たしかにバズワード化してますよね。
とりあえずビッグデータいうとけ見たいな。
既存の分析だけだと、結局顕在化してないだけで元々存在してた要素を掘り起こしてるだけなので、
全然関係ないデータぶつけて、潜在的にも存在していなかった要素を新たに生み出すようなことをやってる連中がいます。
当然、そうそううまくいくはずもありませんがw
#それすら、潜在的要素なんじゃね?という気もしますし
Re: (スコア:0)
*カルチュア・コンビニエンス・クラブ株式会社は、お客様の同意を得て、株式会社オプトへWEB閲覧履歴、性別・生年月日、郵便番号などの属性データを匿名で提供します。
これも致命的なほど個人情報なんですよね。
何が匿名で提供だ。CCCは人をバカにするのも程がある。