パスワードを忘れた? アカウント作成
12426 story

日本語がブログでの使用言語で世界一のシェア 122

ストーリー by yoosee
ウェブ日記文化は古くからあるしね 部門より

AC曰く、"Sifry’s Alertsの5月1日付けの記事 State of the Blogosphere, April 2006 Part2: On Language and Taggingによると、ブログで使用される言語で日本語が世界一のシェアであるとのこと。ただし引用記事でも指摘されているように、例えば日本語のブログは、携帯電話からの投稿があるため短い記事が多数投稿される傾向にあり、その結果見かけ上ブログ投稿数が多くなる等、必ずしもブログの現状を精確に反映しているわけではない。このようなデータ上の不備を差し引いたとしても、ブログ界だけでなくインターネットのの興味深い一面がうかがわれる。"

データは technorati がトラックしている約3,730万(1日の増加量120万)のエントリによるもので、最新のデータでは日本語37%, 英語31%, 中国語19% となっているが、現時点ではトラックが十分では無いサービスの言語(韓国語やフランス語など)も幾つかあるとしている。他にも色々と興味深いデータがあるようだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 最後の In Summary以下を訳してみました。

    • ブロゴスフィア(ブログの世界)は多数の言語に溢れ、極めて国際的である
    • 初期のブロガーの大多数が用いる言語であった英語は、2006年4月には全てのブログ投稿の3分の1に満たないまでに転落した
    • 日本語と中国語によるブログがかなり成長した
    • 独裁体制で成長し続けている中国語によるブログは、直近6ヶ月のTechnoratiが追跡している投稿の全体的なパーセンテージでは落ち始めた
    • 日本語、中国語、英語、スペイン語、イタリア語、ロシア語、フランス語、ポルトガル語、オランダ語、ドイツ語がTechnoratiによって追跡される最も投稿数の多い言語である
    • 韓国語はこの分析には十分反映されていない
    • 言語の漏れが特定の国や地域を外しているというわけではない
    • Technoratiは現在1億以上の作者作成のタグやブログ投稿の分類を追跡している
    • relタグというマイクロフォーマットが複数の大きなツールメーカーによって採用され、投稿のタグ付けが簡単になった。全てのブログ投稿の約47%には非正規のタグやそれらに関連づけられた分類がある
    --
    MIYAZAKI Yasushi
  • by wokanoyu (30711) on 2006年05月03日 12時24分 (#932547) ホームページ
     戦争中、米軍が日本軍兵士の日記を回収して、いろいろな情報がダダモレになっていたそうですが…

     日本人て、日記が好きなんですかね。
    --
    #Insanely great!
    #をかのゆ
    • by Anonymous Coward on 2006年05月03日 12時40分 (#932559)
      ちょいと昔の事に興味がある人なら皆どこかで読んだことがある話なのだけど。
      日本人の記録好きってのは江戸の昔から連綿と続いているのだそうだ。

      というかほかの国じゃ紙が高かったせいもあるのかもしれないけど、上は武家から下は町民まで毎日の様に記録をつづった紙切れが大量に残ってるのは非常に珍しいらしい。
      しかも書いてあることは今時のブログとあんまり変わらなくて、本日の晩ご飯について事細かな記述があったりとかするそうな。
      まぁ、だからといって生活習俗の細かい事までわかるかどうかは知らないけれども、田舎の蔵をつぶしたりするときは是非ともご連絡がほしいとかそういう人もたくさんいるらしい。

      #伝聞丁なのはずいぶん前に読んだ池波正太郎の対談記事と
      #大学の城好きな教授の自慢話が混ざって記憶してるからなのでAC
      親コメント
      • Re:俺の日常を見てくれ (スコア:1, おもしろおかしい)

        by Anonymous Coward on 2006年05月03日 17時00分 (#932745)
        小学校のころから、日記をつけさせられたりするし。もちろん、
        強制されないと日記なんて書かない日本人も多いけど、小さい頃に
        そういう習慣ができていると、ふと思い立って日記をつけようと思う
        人の割合が増えてもおかしくない。

        ただ、他コメントにあるような、平安時代とかの日記文学とかの存在が、
        現在の日本人の考え方にどれだけ影響を及ぼしてるかは、ちょっと
        分からないと思う。時代がだいぶ離れてるし、それに、当時のほんの
        一握りの人たちだけの文化だったのだし。

        江戸時代の庶民の考え方とかだと、親から子へと伝わって現在でも
        残っていても不思議はなさそう。ただし、武家から町民までって
        言うけど、江戸時代に日本人のほとんどは農民で、自発的な記録や
        日記なんてものとは縁がなかったと思う。だから、日本人のごく一部に
        すぎなかった武士や町民の考え方が、いま日本人全体の考え方の
        ルーツになっているのだとしたら、単に親から子へと伝わっていった
        以外の何かがないといけないと思う。
        親コメント
        • Re:俺の日常を見てくれ (スコア:1, すばらしい洞察)

          by Anonymous Coward on 2006年05月03日 19時01分 (#932813)
          なぁ、江戸の話で武家から町人って言えば農民は確実に入ってると思うのだが、おいら習った事まちがっとるかね?

          ちなみに農民も日記の様な記録をたくさん残してるよ。
          #水飲みホゲホゲじゃ無理だけど、江戸の中期からは物資が豊かになったからなぁ。
          #じゃなきゃ明治維新なんか無理だよ。
          親コメント
      • by suezo (2881) on 2006年05月04日 21時12分 (#933408) 日記
        何しろ大航海してきた船にトイレットペーパーなんか積まれていませんでしたからねぇ。
        日本が開国してからじゃないかな。トイレに紙がついたのは。

        親コメント
    • by Anonymous Coward on 2006年05月03日 17時38分 (#932775)
      まだブログなんて言葉が無かった時代にも、日記つけてる人は山ほどいましたよね。

      ...それで当時(7-8年くらい前?)、こんなに日記付けるのは日本人だけなんだろうかと疑問に思って、米Yahooから個人系のジャンルのページを何十件か見て回ったことがあります。結果は0。写真を並べてるアルバム的なものが多かったですが、日記らしいモノは皆無でした。

      ブログって言葉が出てきたとき、なんで今さら日記?って思ったわけですが、あぁ(少なくとも米国あたりには)そういう文化がなかったからなんだろうと納得しましたが。
      親コメント
  • 書き込みの量に対して、読まれる割合も計らないと単なる独り言になってしまう。

    現状では特定のブログに人気が集まっているので、その他大勢がいくら多くても、
    参考の数値にしかならない。

    CD売り上げのように、ミリオンのみカウントするとかでも統計採ったら面白いと
    思う。
  • 単なるブームかと (スコア:2, すばらしい洞察)

    by kuchinashi (30062) on 2006年05月03日 13時53分 (#932613) ホームページ 日記
    何年かしたら半分くらいには減ってる気がする。 「よく分からないけど流行ってるからわたしも書いてる」ってのは相当多そう。
  • by katchon (13265) on 2006年05月03日 14時19分 (#932638)
    日本人の日常の記録好きはそれこそ古来から
    日記文学として記録に残っている平安朝よりはるか昔から事細かに日々の記録、感想などを書き付けてきた
    それがブログというツールにマッチしただけのこと
    欧米のブログはジャーナリズムであり、日本の日記とは異なるのだと力んでる人も多いけど実際に読んでる?
    たいていは日本と同じだよ
    身辺雑記みたいなものの多いこと多いこと(それが面白いんだけど)
    著名ネットジャーナリストのブログだけ読んで全部見たような事言わないほうがいい
    所詮単なるジャーナル(記録)ですから
    • by leon (26759) on 2006年05月05日 3時07分 (#933501)
      50年以上前に書かれた菊と刀(p18)でも著者が
      「日本人は自分のことを洗いざらい書き立てる強い衝動を持っている。彼らは驚くほどあけすけである。」
      と記していますね。他の東洋人と比較してですが。
      親コメント
  • by moromama (23126) on 2006年05月03日 20時28分 (#932858) 日記
    よっぽど、おたくとか、へんたいが世界的に広まったってことですよね?
    日本語読み書きが必要に迫られるほど、需要があるってことで^^;(うそ臭いが、秋葉を見ているとそうもいえん)

    --
    Minder
  • UTF-8がやっぱり多いんですかね?

    # technoratiをクリックしたら例のトップCDが表示されてvipperの工作かと思ったのは内緒だ。

  • by Markov (30868) on 2006年05月03日 13時34分 (#932596)
    A lot of my Japanese classmate in graduate school enjoy themselves at blog site Mixi, or write their own blogs elsewhere. Many of them post even post twice or three times a day. And the comment below the post is so many, much more than the Chinese blog I have read. I wonder are guys here at ./@jp also blog a lot? And are you really write diary before when therewas such a stuff called "blog" ? ほんとに日本人はブログが現われるの前に、皆が毎日日記を書いていましたか? ありがとう!
    • Re:Is everyone here write blog? (スコア:3, すばらしい洞察)

      by Anonymous Coward on 2006年05月03日 15時12分 (#932688)
      歴史的に識字率が極めて高かった。
      紙の値段が安かった。
      活版印刷術以前から版画を使った書籍の大量印刷法があった。
      1650年代以降、文学や芝居が流行した。
      日本における古典文学は、貴族の随筆や物語、短歌が主である。
      1860年以降、学校教育で日記をつけることが推奨された。
      このような理由で、日本では日記を書くことが一般的である。

      日本ではMovableType登場以前から、WebBBSスクリプトを
      改変した日記システムが多数存在し、独自の進化を遂げてきた。
      ゆえにBlog的文化が欧米よりも早くから存在する。

      欧米ではIRCで行われてきたChatも、日本ではWebBBSの
      インターフェースとして実装された。
      だから、blogシステムは日本人にとって斬新ではない。
      昔からあった個人サイトのWebBBS文化の延長である。
      親コメント
    • by ruto (17678) on 2006年05月03日 14時58分 (#932677) 日記
      /.@jpにも日記 [srad.jp]は古くからありますし、好きなんじゃないでしょうか。
      親コメント
    • 土佐日記
      さらしな日記
      かげろう日記
      等々

      他にも徒然草なんてのもblogみたいなものかな。

      ま、歴史のない国々の人々には想像もできないくらい昔からblog文化みたいなものはあるということだな。
      自分の尺度だけで世界を理解しようとしないことを強くお勧めしよう。

  • 小中学生までが気軽にウェブと付き合っていますしね。
    日常のどうでもいいことをつぶやく層にまで幅広くITが浸透しているという事ですかね。
    それにしても、英語圏の人口と比べると意外な気はしますが。

    記録好きの気質なんてのが本当に日本人に強いのかは疑問ですね。
    • by Anonymous Coward on 2006年05月03日 17時21分 (#932762)
      >記録好きの気質なんてのが本当に日本人に強いのかは疑問ですね。

      海外、特に米国なんかだと毎週のように家族や近所とかでバーベキューパーティーなんかするじゃない?
      ほかにも家族そろってアウトドアでエンジョイとかが多いっぽい感じで。

      対して日本、特にIT浸透率の高そうな都心部になると、もう遊ぶ場所すらない。
      日本の場合、基本的に行楽シーズンや盆・正月以外に家族で行動とかあまりない。
      つまり、仕事・学校以外の場所では引き篭もりと似たようなもんだから、
      ストレス発散や意思疎通の手軽な手段が通信を利用するって事だったんだと思います。

      家族(特に母親や姉妹等女性が多いと思うが)の長電話もそうだし、
      ポケベルから始まって携帯電話の普及、blogのブームとか見てると、
      「うさぎって寂しいと死んじゃうんだよ?だからかまってね?」
      って言うのをさらけ出しちゃってるのが現在なんじゃないかなーとか思ったりして。

      長電話でハッと気づいたが、どれもこれも結局はおばちゃん達の井戸端会議の延長なんでは・・・?
      親コメント
  • by Li-ion (25837) on 2006年05月04日 1時00分 (#932994) 日記
    これって、/.の「日記」も含まれるのでしょうか。

    それにしても、海外のブログって「海外から日本がどう思われているか」とか「その国の大衆文化」とかがわかりますから結構重宝しますね。
    日本では会社のHPで社員のブログがあるってのはあまり聞いたことないけど、韓国とか米国あたりでは当たり前のように多いっていうのも日本と海外のブログの使い方の違いなのか・・・。

    // 未来予想、10年後・・・ 「君たち、宿題(日記)はブログに書いてくるよーに。」 //
    --
    Li-ion DC 1.2V(定格:3.7V) 500mA 乾電池はリサイクルへ
  • by Anonymous Coward on 2006年05月03日 12時16分 (#932543)
    ブログツール使った日記が増えただけじゃん
    • Re:つーか (スコア:1, 興味深い)

      by Anonymous Coward on 2006年05月03日 12時24分 (#932546)
      増えたじゃなくて元々ぶろぐって日記ですよ。
      親コメント
  • by Anonymous Coward on 2006年05月03日 12時21分 (#932545)
    ジャーナリズムとして一定の発言力や影響力を持つという点ではどうなんでしょうね。
    • by Anonymous Coward
      それはツールと言語、という調査から導き出せる代物ではないので
      内容別分類という統計が別途必要かと思われます。

      単にWeb日記として便利だから使われてるだけだと
      ジャーナリズムという視点は無いでしょうから。
  • by Anonymous Coward on 2006年05月03日 12時52分 (#932570)
    携帯の投稿と関連することだけど、日本の平均的なブログの記事は他の国と比べて文章の長さが短すぎると思う。

    • by Anonymous Coward on 2006年05月03日 12時59分 (#932577)
      ただ、選択肢の幅が広い環境というのは良いと思う。
      それにTips的なことがらは意外と短いことが多いものだし。

      机上以外にも広がっているblog作成環境というのは
      それなりに誇れることだとは思う。自由度という面で。

      #そのうち出てくるのでは? 短く書いて、長く表現するという環境も。
      親コメント
    • by Anonymous Coward on 2006年05月03日 17時46分 (#932784)
      エントリ数で比較すると日本語がトップになるけど各エントリが短い、という
      話ですが、エントリ数ではなく文字数で比較するとどうなるんでしょうか。

      と、思ったんですが、文字数での比較がそもそも公平なのかどうか、分からないですね。
      26文字しかないアルファベットと、何千もある漢字とでは、1文字あたりの情報量が
      違うでしょうし。

      全世界の言語に広く翻訳されている作品の長さで割って規格化する、なんてのは
      どうでしょうか。
      親コメント
      • > 文字数での比較がそもそも公平なのかどうか、分からないですね。
        > 26文字しかないアルファベットと、何千もある漢字とでは、1文字あたりの情報量が
        > 違うでしょうし

        手軽に考えるなら、シャノン情報量で数えればいいんじゃないですかね。

        1文字あたりの情報量を「log2 出現確率」で表現します。
        8回に一回は現れる文字なら情報量は3ビットですし
        1000回に一回しか現れない文字なら情報量は10ビットになります。

        文章中に現れる個々の文字のビット数を算出し
        合計すれば文章全体での情報量が出ます。

        もうちょっと真面目に考えるなら、
        文字単位でなく単語単位で出現頻度を数えた方がいいでしょうねえ。
        親コメント
  • by Anonymous Coward on 2006年05月03日 12時55分 (#932574)
    URLを1行書いただけのコメントも日本語にカウントされるのだろうか。
typodupeerror

最初のバージョンは常に打ち捨てられる。

読み込み中...