アカウント名:
パスワード:
トシちゃんの個人情報はビッグデータに含まれますか?
ビックカメラから流出するデータはビックデータであってビッグデータではありません。
GartnerとかIBMの定義を参照すれば、Variety, Velocity, Volumeの3種が特徴的なデータをビッグデータを呼ぶようなので、
そもそも論として、一般的なユーザの行動データを大量に集めて意味を見出そうというのがいわゆるビッグデータ論なわけで、マスコミが出すデータが量が少ないというのは当たり前すぎ。
というのはさすがに言い過ぎでしょう。マスコミ含め、官公庁や企業のデータでも、例えば気象系のセンサデータや企業内に蓄積された大量の電子データ等、ビッグデータと呼べるものは色々あります。当然その中にはプレスリリース等も含まれますので、今回は「発生した、かつ公開されたデータ」、と捉えるべきでしょう。
ユーザの行動データを扱ったものが多いことや、マスコミの資料が重要である点は賛成です。日本国内だと個人情報保護法に代表される法規制と、データを保持する企業がリスクを重視するためこういったデータが集まりにくいのが現状です。こういった試みが今後も継続的に行われればいいんですが。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人は巨人ファンでA型で眼鏡をかけている -- あるハッカー
ビッグデータの定義は? (スコア:1)
Re: (スコア:0)
トシちゃんの個人情報はビッグデータに含まれますか?
Re: (スコア:0)
ビックカメラから流出するデータはビックデータであってビッグデータではありません。
Re: (スコア:0)
GartnerとかIBMの定義を参照すれば、Variety, Velocity, Volumeの3種が特徴的なデータをビッグデータを呼ぶようなので、
そもそも論として、一般的なユーザの行動データを大量に集めて意味を見出そうというのがいわゆるビッグデータ論なわけで、マスコミが出すデータが量が少ないというのは当たり前すぎ。
というのはさすがに言い過ぎでしょう。マスコミ含め、官公庁や企業のデータでも、例えば気象系のセンサデータや企業内に蓄積された大量の電子データ等、ビッグデータと呼べるものは色々あります。当然その中にはプレスリリース等も含まれますので、今回は「発生した、かつ公開されたデータ」、と捉えるべきでしょう。
ユーザの行動データを扱ったものが多いことや、マスコミの資料が重要である点は賛成です。
日本国内だと個人情報保護法に代表される法規制と、データを保持する企業がリスクを重視するためこういったデータが集まりにくいのが現状です。こういった試みが今後も継続的に行われればいいんですが。