アカウント名:
パスワード:
俺もマスコミは嫌いだけど、恣意的に貶める記事書いて楽しいですか?いい性格してますね。三流記者に向いてますよ。文章で10MBはビックデータでしょうよ。
ログと記事を比較してサイズの違いを語るのは論外として。
ビッグデータの定義が不安になるんですが、そもそも、ニュースだとかの記事もビッグデータに含まれるんでしょうか?どのニュース記事が読まれたとか、どの情報が参照されたとか、そういうアクセスログと合わせてビッグデータかと思っていたのですが……
ビッグデータというのは、ほとんどすべての情報を選別せずに機械的に溜め込んだもの。その中から必要な情報、重要な情報を抽出して記事にまとめたものが例えば、出版物や放送番組になる。
だから、新聞記事をビッグデータと呼ぶためには、例えば100年分の新聞記事を全部、などという扱い方が必要であって、○×△に関する記事などという風に抽出したものをビッグデータとは呼べないだろう。
> ○×△に関する記事などという風に抽出した
条件付けが「震災後1週間分の本紙掲載記事」などといった期間指定だけであって、その中身に選別がないなら、一種のビッグデータといっていいかと思います。
できれば、1週間ではなく1ヶ月ぐらいにしておいたほうがいいんじゃないかとは思いますけど、ていうか、NHKの「震災後24時間」というのは短すぎかなぁ…
単純な検索でデータを選別するだけの場合、ビッグデータと呼べるのかなぁ?数理解析や統計的処理を行うことで、生データにはない役立つ情報を生成可能なデータのことをビッグデータと呼んでるようにも思いますが…。
昔、小説書きをしていた頃、だいたいテキストデータの1KBが文庫本の厚み1mmに相当するようなイメージでした。10KBくらい書けば、だいたい1cmくらいの文庫本になるな・・・みたいな。10MBというと、1cmの文庫本が1000冊程度、約10mくらいでしょうか。1日3冊として、まるまる1年の暇が全て吸収されてしまいますね。そう考えると、我々の住む地球なんて、ほんとうにちっぽけなものです。
間違った。10KBで1mm、100KBで1cmでした・・。100冊程度ですね。
いや、きっと、震災関連TV番組のハイビジョン映像を提供しろという主張なのでしょう(それ以外に桁の大きなデータを思いつかない)
「マスコミのデータは小さい」と言いたいのかどうかさえ微妙なタレコミだと思う。
> ビッグデータといっても日本のマスコミの送出量が、メガ単位でギガに遠く及ばないのが、面白く感じた。(中略)> ■ツイッタージャパン:震災後1週間分の全ての日本語ツイート(32ギガバイト)(中略)> 逆に言えば、ゼンリンが辛うじてギガの桁のデータを扱っているが、他はメガ単位で終わっている
マスコミではないゼンリンを敢えてピックアップしているのに、ゼンリンの提供データ量を上回った(これまたマスコミではない)Twitterをスルーした意図が不明。
と言ったモニョモニョを鑑みて、「記者に向いている」と言う感想に同意w
そもそも、「提供されたデータ」がメガ単位である事がどう面白いのかサッパリ分からない。もし、「ギガ単位のデータを何種類も集めたかったのに大多数はメガ単位であった」と言う話であれば、そりゃワークショップ事務局の能力不足でしょうよ。
>マスコミではないゼンリンを敢えてピックアップしているのに、
ゼンリンの出版する、観光案内の類は事実上、雑誌扱いされていると思うが。コンビニでは雑誌と共に並んでいるし、その賞味期間も雑誌同様に短い。
ちなみに、ゼンリンは、創業時に出版した雑誌に綴じ込みで地図を入れたところ、そちらが好評だったために地図専業に移行した。
> ゼンリンの出版する、観光案内の類は事実上、雑誌扱いされていると思うが。
だから何よ?ここで言うてるのは電子地図サービスの「株式会社ゼンリンデータコム」。観光案内出してるのはゼンリン本体でしょ。
> ■ゼンリンデータコム:GPS付き携帯電話などで集計した、地域ごとの人口や混雑統計データ。3月8日から17日まで(1.8ギガバイト)
「マスコミとしてのデータ」ではないよね。まぁ、そもそものタレコミ文が言いたい事のハッキリしない「マスコミならなんやねん」「マスコミじゃなかったらどうやねん」なアレなので、そこがハッキリしない事には何を言っても「…で?」と言う感じなんだけど、
別に容量で見なくても、1週間分の新聞記事ってそんなにビッグか?とは思う。でも集めたデータ全体がビッグであれば、個別の容量なんて大した問題じゃないはずだが。
スラドの震災タレコミの記事がKB単位なのを隠すために、意図的にマスコミを揶揄しているとか。
ビックデータは正義だなんて思っているのは、♪大きいことはいいことだ~って山本直純でも歌っていればいいんだよ
ボールペンメーカーの方ですか?
ニューヨークタイムズ1週間分の情報は、シェークスピアの時代(17世紀) の一生分の情報量に等しいと言われているからね
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike
は? (スコア:0)
俺もマスコミは嫌いだけど、恣意的に貶める記事書いて楽しいですか?
いい性格してますね。三流記者に向いてますよ。
文章で10MBはビックデータでしょうよ。
Re:は? (スコア:3, すばらしい洞察)
ログと記事を比較してサイズの違いを語るのは論外として。
ビッグデータの定義が不安になるんですが、
そもそも、ニュースだとかの記事もビッグデータに含まれるんでしょうか?
どのニュース記事が読まれたとか、どの情報が参照されたとか、そういうアクセスログと合わせてビッグデータかと思っていたのですが……
Re:は? (スコア:2)
特定の1社とか、特定分野の複数社くらいの1週間のデータではこんなもんじゃないかと…
Re:は? (スコア:2)
ビッグデータというのは、ほとんどすべての情報を選別せずに機械的に溜め込んだもの。その中から必要な情報、重要な情報を抽出して記事にまとめたものが例えば、出版物や放送番組になる。
だから、新聞記事をビッグデータと呼ぶためには、例えば100年分の新聞記事を全部、などという扱い方が必要であって、○×△に関する記事などという風に抽出したものをビッグデータとは呼べないだろう。
Re:は? (スコア:1)
> ○×△に関する記事などという風に抽出した
条件付けが「震災後1週間分の本紙掲載記事」などといった期間指定だけであって、
その中身に選別がないなら、一種のビッグデータといっていいかと思います。
できれば、1週間ではなく1ヶ月ぐらいにしておいたほうがいいんじゃないかとは思いますけど、
ていうか、NHKの「震災後24時間」というのは短すぎかなぁ…
Re: (スコア:0)
単純な検索でデータを選別するだけの場合、ビッグデータと呼べるのかなぁ?
数理解析や統計的処理を行うことで、生データにはない役立つ情報を生成可能なデータのことを
ビッグデータと呼んでるようにも思いますが…。
Re:は? (スコア:1)
昔、小説書きをしていた頃、だいたいテキストデータの1KBが文庫本の厚み1mmに相当するようなイメージでした。
10KBくらい書けば、だいたい1cmくらいの文庫本になるな・・・みたいな。
10MBというと、1cmの文庫本が1000冊程度、約10mくらいでしょうか。
1日3冊として、まるまる1年の暇が全て吸収されてしまいますね。
そう考えると、我々の住む地球なんて、ほんとうにちっぽけなものです。
Re: (スコア:0)
間違った。10KBで1mm、100KBで1cmでした・・。
100冊程度ですね。
Re: (スコア:0)
いや、きっと、震災関連TV番組のハイビジョン映像を提供しろという主張なのでしょう
(それ以外に桁の大きなデータを思いつかない)
Re: (スコア:0)
目の付け所がシャープなんですよ、きっと。
Re: (スコア:0)
「マスコミのデータは小さい」と言いたいのかどうかさえ微妙なタレコミだと思う。
> ビッグデータといっても日本のマスコミの送出量が、メガ単位でギガに遠く及ばないのが、面白く感じた。
(中略)
> ■ツイッタージャパン:震災後1週間分の全ての日本語ツイート(32ギガバイト)
(中略)
> 逆に言えば、ゼンリンが辛うじてギガの桁のデータを扱っているが、他はメガ単位で終わっている
マスコミではないゼンリンを敢えてピックアップしているのに、
ゼンリンの提供データ量を上回った(これまたマスコミではない)Twitterをスルーした意図が不明。
と言ったモニョモニョを鑑みて、「記者に向いている」と言う感想に同意w
そもそも、「提供されたデータ」がメガ単位である事がどう面白いのかサッパリ分からない。
もし、「ギガ単位のデータを何種類も集めたかったのに大多数はメガ単位であった」と言う話であれば、
そりゃワークショップ事務局の能力不足でしょうよ。
Re:は? (スコア:2)
>マスコミではないゼンリンを敢えてピックアップしているのに、
ゼンリンの出版する、観光案内の類は事実上、雑誌扱いされていると思うが。コンビニでは雑誌と共に並んでいるし、その賞味期間も雑誌同様に短い。
ちなみに、ゼンリンは、創業時に出版した雑誌に綴じ込みで地図を入れたところ、そちらが好評だったために地図専業に移行した。
Re: (スコア:0)
> ゼンリンの出版する、観光案内の類は事実上、雑誌扱いされていると思うが。
だから何よ?
ここで言うてるのは電子地図サービスの「株式会社ゼンリンデータコム」。
観光案内出してるのはゼンリン本体でしょ。
> ■ゼンリンデータコム:GPS付き携帯電話などで集計した、地域ごとの人口や混雑統計データ。3月8日から17日まで(1.8ギガバイト)
「マスコミとしてのデータ」ではないよね。
まぁ、そもそものタレコミ文が言いたい事のハッキリしない
「マスコミならなんやねん」「マスコミじゃなかったらどうやねん」なアレなので、
そこがハッキリしない事には何を言っても「…で?」と言う感じなんだけど、
Re: (スコア:0)
別に容量で見なくても、1週間分の新聞記事ってそんなにビッグか?とは思う。
でも集めたデータ全体がビッグであれば、個別の容量なんて大した問題じゃないはずだが。
おそらく裏があるに違いない (スコア:0)
スラドの震災タレコミの記事がKB単位なのを隠すために、意図的にマスコミを揶揄しているとか。
昭和の亡霊 (スコア:0)
ビックデータは正義だなんて思っているのは、
♪大きいことはいいことだ~って山本直純でも歌っていればいいんだよ
Re: (スコア:0)
ボールペンメーカーの方ですか?
Re: (スコア:0)
ニューヨークタイムズ1週間分の情報は、シェークスピアの時代(17世紀) の一生分の情報量に等しいと言われているからね