パスワードを忘れた? アカウント作成
16842 story

ブログの文体で書き手の性別を自動判別 72

ストーリー by mhatta
ネカマがばれる? 部門より

Anonymous Coward曰く、

ITproの記事によると、リクルートの子会社であるブログウォッチャーは、2008年2月を目処に「プロファイルパスポート」というシステムを立ち上げるそうだ。
東工大の奥村学・准教授の研究をベースにした独自技術で、ブログやSNSといった消費者発信型メディア(CGM)に書き込まれた文章を分析し、書き手の属性や行動パターンを判定。これをプロファイルパスポートに反映させ、書き手に合った広告を配信するという仕組みらしい。「おいしい」「まずい」という言葉の使用から評判の良し悪しを判定したりできるそうだが、タレコミ子が気になったのは、「文体から書き手の性別を90%以上の精度で自動判定できる」というところ。性別によってよく使う言葉、使わない言葉があるということだが、自分が異性だと判定されたらちょっとショックかも。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 3~4年前くらいに、メール文面を入力するとその文章の要点を抽出したり、書き手が送り手にどういう印象を持っているかを判断してくれるジョーク交じりのcgiプログラムがあったように記憶しています。
    調べてみてらほとんど情報が残っていなくて、携帯用のアプリで似たような仕組みの有料サービスがあるぐらいのようですが……。

    当時は友人同士で面白がって使っていたんですが、時代が変わると商材になるんですね(もちろん、分析の精度とかは段違いなのでしょうけど)。
    • この手のものは、何を基準に判別するか興味があるのだけれど、もし書き手の性別が分かっているブログ記事のデータがたくさんあれば、機械学習によって基準が分からなくても判別できるというか、そうやって初めて性別の差がどう現れるか分析できるんじゃない?

      個人情報である性別が入っているブログ記事はどうやって集めるんだろう。

      親コメント
  • by Anonymous Coward on 2007年12月12日 8時23分 (#1264265)
    ではまず、土佐日記を試してみましょう。
  • つまり (スコア:2, すばらしい洞察)

    by ofl (28734) on 2007年12月12日 8時18分 (#1264263)
    ネカマ判定装置?
    • by x-AC (25985) on 2007年12月12日 9時13分 (#1264284) ホームページ
      ネトゲに実装して欲しいよねぇ。

      #性別の違う複数のネトゲのアカウントを持ってる人間を知ってるのでID
      親コメント
      • Re:つまり (スコア:3, 興味深い)

        by raf (9322) on 2007年12月12日 16時15分 (#1264599) 日記
        まったくだ。
        ネカマやってたわけでも無いのにオフに行ったら、
        「お前男だったのか!!!」と、言われたこと多数。。。。。

        まー、どんなところで女だと思ったのかを聞いてみたところ、
        言葉遣いよりもその人の反応する話題で見当つけるみたいですね。

        ファッションやらスイーツ(笑)やらの話題に
        それなりに応対してるとそれだけで間違えられるみたいです。
        普通に生活してたらなんとなく耳目に入ってくる程度の情報で
        適当に応対してるだけなんですけどね。(・・
        --
        -- 星を目指さない理由は何もない -- 「MISSING GATE」by 米村孝一郎
        親コメント
      • Re:つまり (スコア:1, おもしろおかしい)

        by Anonymous Coward on 2007年12月12日 9時17分 (#1264289)
        >ネトゲに実装して欲しいよねぇ。

        「エ□ゲに実装して欲しい」に空目した。
        それだけなのでAC.
        親コメント
      • Re:つまり (スコア:1, すばらしい洞察)

        by Anonymous Coward on 2007年12月12日 9時38分 (#1264300)
        ネトゲを通してリアルの人間と付き合おうとするからいけないのでは?
        ゲームはゲームとして、性別も含めてRPするものだと理解してますが。
        親コメント
        • by Anonymous Coward
          オフゲーなら好きにしろというところですが、ネトゲーはモニターの向こう側にも
          リアルの人間がいる(しかもインターナショナルに)ということを忘れては
          いけないと思います。

          そういうのを考えずにロールプレイに酔いしれる(たとえば集団戦闘で参謀気取りとか
          ハートマン軍曹になった気分とか)方も希にいますが、やっぱりリアル同様に
          空気を読むという努力は必要ではないでしょうか。
      • ネトゲに実装って、チャットのログを全部渡すような事になるので、君主 [kunshu.jp]みたいにどこかの大学とコミュニティーの共同研究で、チャットログを提出する考えがありますと、
        発表しただけで騒然として、結局は共同研究を取りやめたって事例があるから、ゲームにはちと難しいんじゃ…

        #オンライン「RPG」なら、性別含めて「役」になりきるのが何ぼだから、別にどうでもいいことだけどさ。

        個人的にはメールサーバーにそういう機能を実装したほうが良いな。
        SPAMの発送者がフィルター潜り抜ける巧妙な文面にした奴でも、男性が女性口調で書いたメールだと判断すれば、そのままゴミ箱往きにするとかね。
        --

        /* Kachou Utumi
        I'm Not Rich... */
        親コメント
    • Re:つまり (スコア:2, おもしろおかしい)

      by Anonymous Coward on 2007年12月12日 10時10分 (#1264330)
      馬鹿、逆だ。
      普段読んでる小気味よくてサバサバしたBlogを、実は綺麗なおねーさんが書いてたりしたら色々とワクテカするだろ!

      # 次は、綺麗かどうかを判別する技術が必要だな
      親コメント
      • by Anonymous Coward
        > 普段読んでる小気味よくてサバサバしたBlogを、実は綺麗なおねーさんが書いてたりしたら色々とワクテカするだろ!

        それなんて真鍋かをり [cocolog-nifty.com]?
    • Re:つまり (スコア:2, おもしろおかしい)

      by Pravda (33859) on 2007年12月12日 12時09分 (#1264429) 日記
      ネカマ判定装置?

      こういう技術が一般化すると、今度はネカマ支援ツールが出てきたりして。

      文中で「素敵な装身具」と書いたりすると、
      ツール「この箇所は『かわいいアクセサリー』と言い換えるべきです」
      ネカマ男「おおそうか、なるほどね」

      #「リボンの騎士」のサファイア[王子|姫]はどんな文章を書くのだろう?

      親コメント
      • ネカマ支援ツール
        聞くところによれば「ギャル語変換 [infoseek.co.jp]」 を使ってネカマを演じる人がいるそうな。

        たとえば「私の名前はclausemitzです。よろしくお願いします。」が

        「禾ムσ名前レ£clдμ∫ёмiтzτ〃£★∋ЗU<ぉ願レヽUма£★」に。

        …って、読めないよ、こんなの(-ω-;)

        --
        clausemitz
        親コメント
      • ネカマ判定装置?

        こういう技術が一般化すると、今度はネカマ支援ツールが出てきたりして。

        っていうか、記述する文体は(IME|FEP)の癖に依存するような気がします。
        だって自分のもっている表現文体だけでは、まともにかな漢字変換できなくって「(IME|FEP)の使いにくさ」みたいに感じているんじゃないでしょうか。
        --
        大槻昌弥(♀) http://www.ne.jp/asahi/pursuits/ootsuki/
        親コメント
    • by Tatenon (20311) on 2007年12月12日 9時25分 (#1264292) 日記
      ネカマ判定なら、ブログなんかよりもネトゲの方がいいと思いますが。

      プレーヤーキャラの横に、中の人判定で

      『←♂』とか『←♀』とか『←?』とか出た方が。

      # ・・・自分で言っといてなんだが、ヤなゲームだな。
      親コメント
    • by Anonymous Coward
      むしろネカマと呼ばれる人たちは意識的に女言葉を使うので難しいかと
  • by Anonymous Coward on 2007年12月12日 19時06分 (#1264703)
    発信者の文体を分析して発信者に合った広告を……どこに載せるの?
    トラックバックspamかなぁ……
  • by Anonymous Coward on 2007年12月12日 8時15分 (#1264259)
    つまり常に男と判定すればOK

    # 要はblogの9割ってspamじゃないだろうかと
  • by akiraani (24305) on 2007年12月12日 11時24分 (#1264388) 日記
     絵文字使いまくりの中高生のケータイブログとか、2ch文化にどっぷり浸ったネット中毒者のブログとかになるともはや文法すら一般的な日本語と異なることもままありますが、そういうのはどこまで判別できるんだろう?

    #そういう連中はそもそもターゲットではないのかもしれないが……。
    --
    しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
  • いかつい顔をしてて、筋肉質で、みるからに武道派な人でも、
    実はかわいいものが大好きだったり、手芸が趣味だったり、
    ぬいぐるみサイト作ってたりするんです。
    会社で軍曹の異名を持つあの人だって、
    週末にはスイーツ食べ歩きしてるかもしれないし、
    携帯の待ち受けが子猫の写真だったりするかもしれないんです。

    そっとしておいてあげてください。

    #このコメントに特定のモデルはいません。多分。
  • メーラーにこの技術を実装して欲しいわね。

     ・本文の文体が女性っぽい && 本文に「○○○(卑猥な言葉)」が含まれる
       → Junk フォルダに移動
     ・本文の文体が女性っぽい && 本文に「食事」または「映画」が含まれる
       → 優先度を「最高」に設定
     ・本文の文体が男性っぽい && 本文に「飲み会」が含まれる
       → サーバから削除

    …みたいなメッセージフィルタが作れれば素敵。
    誰か Thunderbird の Add-on とか作ってくれないかしら?

    #特に意味もなく女性っぽい文体で書いてみたのでID
  • by Anonymous Coward on 2007年12月12日 8時16分 (#1264260)
    性同一性障害の診断って、結構微妙なところもあると聞きます。が、こういうところで、案外容易に診断がつくということもあるんでしょうね。
  • by Anonymous Coward on 2007年12月12日 8時27分 (#1264266)
    読んでるひとに「女性だと思ってた」となんどいわれたことか。
    別にネカマじゃないしホモセクシュアルでもないんだけど。
  • by Anonymous Coward on 2007年12月12日 8時36分 (#1264273)
    男女の区別もありがたいが、人間が書いたものかどうかも判断して欲しい。
    最近は自動生成されたものが多すぎ。
  • by Anonymous Coward on 2007年12月12日 10時29分 (#1264344)
    やたら謙譲語使いまくり、
    何でもかんでも「お」つけまくり、
    動物に敬語使いまくりの
    きんもーっ☆ブログ敬語野郎はどのように判定されるのだろうか?
    • ちょっと意味が違うんだけど、コメントとかで言い争いになったときに「貴殿は」とか不要なまでに丁寧な敬語を使う人って、何を考えているのかと思う。対等に話したいときにそういう態度取られると、わざと距離取っているって思います。まあ、わざとやっているのか、そうでないのかわかりかねますが。
      親コメント
    • by Anonymous Coward
      犬公方自重されたし
typodupeerror

アレゲはアレゲを呼ぶ -- ある傍観者

読み込み中...