パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

「東日本大震災ビッグデータワークショップ」に寄せられたデータの桁数」記事へのコメント

  • by Anonymous Coward on 2012年11月05日 13時04分 (#2266002)

    俺もマスコミは嫌いだけど、恣意的に貶める記事書いて楽しいですか?
    いい性格してますね。三流記者に向いてますよ。
    文章で10MBはビックデータでしょうよ。

    • Re:は? (スコア:3, すばらしい洞察)

      by Sukoya (33993) on 2012年11月05日 13時26分 (#2266024) 日記

      ログと記事を比較してサイズの違いを語るのは論外として。

      ビッグデータの定義が不安になるんですが、
      そもそも、ニュースだとかの記事もビッグデータに含まれるんでしょうか?
      どのニュース記事が読まれたとか、どの情報が参照されたとか、そういうアクセスログと合わせてビッグデータかと思っていたのですが……

      親コメント
    • by kawasaki_z750s (32690) on 2012年11月05日 14時57分 (#2266084)
      不特定多数の個人のデータを収集しだすとビッグデータになりますが、
      特定の1社とか、特定分野の複数社くらいの1週間のデータではこんなもんじゃないかと…
      親コメント
    • by nmaeda (5111) on 2012年11月05日 15時41分 (#2266125)

      ビッグデータというのは、ほとんどすべての情報を選別せずに機械的に溜め込んだもの。その中から必要な情報、重要な情報を抽出して記事にまとめたものが例えば、出版物や放送番組になる。

      だから、新聞記事をビッグデータと呼ぶためには、例えば100年分の新聞記事を全部、などという扱い方が必要であって、○×△に関する記事などという風に抽出したものをビッグデータとは呼べないだろう。

      親コメント
      • by taka2 (14791) on 2012年11月05日 16時43分 (#2266161) ホームページ 日記

        > ○×△に関する記事などという風に抽出した

        条件付けが「震災後1週間分の本紙掲載記事」などといった期間指定だけであって、
        その中身に選別がないなら、一種のビッグデータといっていいかと思います。

        できれば、1週間ではなく1ヶ月ぐらいにしておいたほうがいいんじゃないかとは思いますけど、
        ていうか、NHKの「震災後24時間」というのは短すぎかなぁ…

        親コメント
        • by Anonymous Coward

          単純な検索でデータを選別するだけの場合、ビッグデータと呼べるのかなぁ?
          数理解析や統計的処理を行うことで、生データにはない役立つ情報を生成可能なデータのことを
          ビッグデータと呼んでるようにも思いますが…。

    • by Anonymous Coward on 2012年11月05日 13時52分 (#2266044)

      昔、小説書きをしていた頃、だいたいテキストデータの1KBが文庫本の厚み1mmに相当するようなイメージでした。
      10KBくらい書けば、だいたい1cmくらいの文庫本になるな・・・みたいな。
      10MBというと、1cmの文庫本が1000冊程度、約10mくらいでしょうか。
      1日3冊として、まるまる1年の暇が全て吸収されてしまいますね。
      そう考えると、我々の住む地球なんて、ほんとうにちっぽけなものです。

      親コメント
      • by Anonymous Coward

        間違った。10KBで1mm、100KBで1cmでした・・。
        100冊程度ですね。

    • by Anonymous Coward

      いや、きっと、震災関連TV番組のハイビジョン映像を提供しろという主張なのでしょう
      (それ以外に桁の大きなデータを思いつかない)

    • by Anonymous Coward
      容量に着目するとはなかなか…
      目の付け所がシャープなんですよ、きっと。
    • by Anonymous Coward

      「マスコミのデータは小さい」と言いたいのかどうかさえ微妙なタレコミだと思う。

      > ビッグデータといっても日本のマスコミの送出量が、メガ単位でギガに遠く及ばないのが、面白く感じた。
      (中略)
      > ■ツイッタージャパン:震災後1週間分の全ての日本語ツイート(32ギガバイト)
      (中略)
      > 逆に言えば、ゼンリンが辛うじてギガの桁のデータを扱っているが、他はメガ単位で終わっている

      マスコミではないゼンリンを敢えてピックアップしているのに、
      ゼンリンの提供データ量を上回った(これまたマスコミではない)Twitterをスルーした意図が不明。

      と言ったモニョモニョを鑑みて、「記者に向いている」と言う感想に同意w

      そもそも、「提供されたデータ」がメガ単位である事がどう面白いのかサッパリ分からない。
      もし、「ギガ単位のデータを何種類も集めたかったのに大多数はメガ単位であった」と言う話であれば、
      そりゃワークショップ事務局の能力不足でしょうよ。

      • by nmaeda (5111) on 2012年11月05日 15時35分 (#2266119)

        >マスコミではないゼンリンを敢えてピックアップしているのに、

        ゼンリンの出版する、観光案内の類は事実上、雑誌扱いされていると思うが。コンビニでは雑誌と共に並んでいるし、その賞味期間も雑誌同様に短い。

        ちなみに、ゼンリンは、創業時に出版した雑誌に綴じ込みで地図を入れたところ、そちらが好評だったために地図専業に移行した。

        親コメント
        • by Anonymous Coward

          > ゼンリンの出版する、観光案内の類は事実上、雑誌扱いされていると思うが。

          だから何よ?
          ここで言うてるのは電子地図サービスの「株式会社ゼンリンデータコム」。
          観光案内出してるのはゼンリン本体でしょ。

          > ■ゼンリンデータコム:GPS付き携帯電話などで集計した、地域ごとの人口や混雑統計データ。3月8日から17日まで(1.8ギガバイト)

          「マスコミとしてのデータ」ではないよね。
          まぁ、そもそものタレコミ文が言いたい事のハッキリしない
          「マスコミならなんやねん」「マスコミじゃなかったらどうやねん」なアレなので、
          そこがハッキリしない事には何を言っても「…で?」と言う感じなんだけど、

    • by Anonymous Coward

      別に容量で見なくても、1週間分の新聞記事ってそんなにビッグか?とは思う。
      でも集めたデータ全体がビッグであれば、個別の容量なんて大した問題じゃないはずだが。

    • スラドの震災タレコミの記事がKB単位なのを隠すために、意図的にマスコミを揶揄しているとか。

    • by Anonymous Coward

      ビックデータは正義だなんて思っているのは、
      ♪大きいことはいいことだ~って山本直純でも歌っていればいいんだよ

      • by Anonymous Coward

        ボールペンメーカーの方ですか?

    • by Anonymous Coward

      ニューヨークタイムズ1週間分の情報は、シェークスピアの時代(17世紀) の一生分の情報量に等しいと言われているからね

ソースを見ろ -- ある4桁UID

処理中...