KDDI研究所がTwitterのつぶやきから年齢や性別などを推定する技術を開発 61
ストーリー by hylom
ネカマ発見器リリースしてください 部門より
ネカマ発見器リリースしてください 部門より
あるAnonymous Coward 曰く、
KDDI研究所が、Twitterのつぶやきから年代や性別などを推定する技術を開発したそうだ。
この技術を利用してTwitterでプロフィールが確認できた約1万ユーザーのプロフィールを推定したところ、年代は80.2%(20代は89.5%)、性別は78.3%、居住地は72.6%と、高精度に推定できることが確認できました。
とのことで、かなり高精度にプロフィールを推定できるとのこと。自分のつぶやきを解析してもらったらどんな結果が出てくるのか、またたとえば男性が女性を偽ったとしてもそれを見破れるのか、興味は尽きない。
疑問 (スコア:4, すばらしい洞察)
Twitterでプロフィールが確認できた約1万ユーザーのプロフィールを推定した
(強調はKandoによる。)
なのだそうだけど、2つほど疑問がわいた:
・プロフィールに年齢、性別、居住地を書く人はそもそもTweet内容もそういうことを隠さない傾向が強く元々推定し易いということはないのか?
・プロフィールに書かれている内容が正直という仮定は正しいか?
Re:疑問 (スコア:1, 興味深い)
>プロフィールに書かれている内容が正直という仮定は正しいか?
プロフィールが正しいかどうかはあんまり関係ないような。
たいていの人はプロフィール通りのツイートを演じてますから。
#つまりこのKDDI研の推定は演技力の測定でしかなかったと…
Re: (スコア:0)
Re:疑問 (スコア:1)
プロフにおおよその年齢あるいは職業(学生うんぬん)や生活地域が書かれているのはよく見るけど
性別を明記しているのってそんなにあったかなぁ?
職業や所属から類推できるのはあるのか。
「主婦」くらいしかぱっと思いつかないけど。
この技術が主張しているのってなんか釈然としないっすね。
Re: (スコア:0)
単に、特定できる情報を書き込んだ人間の多くが20台だった、と言う結果に他ならないのでは。
全ユーザーの何%がプロフィール特定できたのさw
89.5%にも及ぶ、20代の推定精度…… (スコア:3, 興味深い)
お正月の朝まで生テレビのtwitter連動として年齢階層を調べるのに使ってました。
半数以上を20代にしてしまうので『Twitter全体の年齢統計と差がありすぎる』とパネリストに文句つけられてたけど。
Re:89.5%にも及ぶ、20代の推定精度…… (スコア:2)
あらかじめわかってるtwitter上の構成比率に応じて
結果を表示しているんじゃないの?と斜に構えてみます。
毎回「20台男」という結果を返せば大体あたるんじゃないかと。
# この投稿を見ているキミ、20台あるいは30台、もしくは40~60歳の男または女だな。場合によっては10台。
Re: (スコア:0)
投稿者はその時刻に、twitterに接続していた人物。
Re: (スコア:0)
俺なら20代のつぶやきを100%の精度で20代と判定できるシステムを作れるよ。
例えば (スコア:3, 興味深い)
30代男性が「プリキュア! プリキュア!」と叫んでいたり、中学生が「インセンティブ云々」とつぶやいていたりした場合、どう判定されるのでしょうか
Re:例えば (スコア:5, すばらしい洞察)
> 30代男性が「プリキュア! プリキュア!」
何か問題でも?
http://image.futabachan.info/image/e08aadc84c3ee029dc1818805ccd4674.jpg [futabachan.info]
1を聞いて0を知れ!
Re: (スコア:0)
大きなお友達が子供向けアニメ「プリキュア」の掲示板を閉鎖に追い込む
http://blog.livedoor.jp/dqnplus/archives/1223306.html [livedoor.jp]
Re: (スコア:0)
Re: (スコア:0)
初代の頃の画像だから7年前だよ。
つまり、当時ターゲット世代だったのはもう大半は30半ばだよ。
Re: (スコア:0)
だから今はその人達はターゲット世代ではないということですね。
Re:例えば (スコア:4, おもしろおかしい)
30代男性がプリキュアは別におかしくないだろ...
おれのbotだってまいにちのように「まいんちゃん」ってつぶやいてるし。
Re: (スコア:0)
ちなみにムスカbotに「3分クッキング」ってつぶやいてみよう
ものすげーぞ
Re:例えば (スコア:3, おもしろおかしい)
「おはようございます。今日はいいこと(ry」とか延々6年くらいつぶやき続けているのはどうなるのかと(ry
#少なくとも10歳以下ではないな
Re:例えば (スコア:1)
http://twitter.com/mixi_mocha [twitter.com]
http://twitter.com/MarsPhoenix/status/999383469 [twitter.com]
とかはどうなんでしょうね。
似たり寄ったりのものをハンダ付けしてるのでIDで。
#壮大なストーリ。空転するアイディア。
Re:例えば (スコア:1)
どういう判定になるのかとても興味深いのだが。
Re: (スコア:0)
自分はテレビをあまり見ず、国鉄車両があーだこーだと呟いているんですが、何歳として認識されるのか気になります。
Re:例えば (スコア:1, すばらしい洞察)
Re: (スコア:0)
滝沢国電パンチ!
#ナウいヤングは知りません。
Re:例えば (スコア:1)
とりあえず、年を取ってるほうに見て欲しいと思うなら国電じゃなくてE電っていえばいいと思うよ。
あと、国鉄は国鉄でも国鉄スワローズとか。
#私は北海道のわかもの(自称)なので、地元の野球チームはかつて東映フライヤーズって呼ばれていたぐらいしか知りません。
#にわかですいませんね、ええ
##で、俺は何歳と判定されるですか
##いじめ、かっこわらい(笑)
Re: (スコア:0)
あくまで「滝沢国電パンチ」であって「滝沢E電パンチ」なんてものはないぞ。
Re: (スコア:0)
Re: (スコア:0)
Re: (スコア:0)
(彼らは)自分がなにをしているのか知らないのです (スコア:2, 興味深い)
同じように豊富なコーパスにアクセス出来るgoogleが自然言語解析によって行った事が、IMEとか音声認識とか翻訳であるのに対して、 性別や年齢という個人属性の解析に向かっちゃうところがKDDIの無邪気さだと思います。次は政治信条ですか?宗教ですか?性的志向ですか?
彼らは通信事業者として政治的に危うい立場に立たされうる事に、あまりにも無自覚すぎます。
ここまで、応用についてのコメントなし (スコア:2, おもしろおかしい)
ACに対する「外道照身霊破光線」としても使えるのに。
fjの教祖様
Re:ここまで、応用についてのコメントなし (スコア:2)
AC で、エッチなギャグを連発してるのがばれたらまずい!
Re:ここまで、応用についてのコメントなし (スコア:1)
そのコメントで「エッチなギャグを連発してる事」自体はばれたようなものだと思いますが。。。
#ACにし忘れた?
どのコメントがそうなのかがばれるのでは、またダメージの度合いは違いそうですが。
まずは、/.に聞けw(既出?)w (スコア:2)
聞いてみる。
私は♂ですか?♀ですか?
閑話休題
血液型くらいは当てないと (スコア:1)
Re:血液型くらいは当てないと (スコア:1)
-- 哀れな日本人専用(sorry Japanese only) --
Re:血液型くらいは当てないと (スコア:1)
Re: (スコア:0)
もしかして血液型占いを信じてる人?
Re: (スコア:0)
血液型による性格とか、結構信じてそのとおりに自分の性格を誘導してる人が多いですから。
たとえばA型の人は「自分は几帳面なんだ」と思いこんでるし、O型の人は「自分は多少大雑把でもO型だと言えば許される」とかね。
生化学的な根拠はなくても、心理学的には十分使えます。
Re:血液型くらいは当てないと (スコア:1)
数ヶ月前に「これは当たる!」という評判のサイトがあって
数十の質問に答えたら「あなたは○○で××な性格の△型です」と出るのですが
……最初の質問が「名前と血液型」でした。
Re: (スコア:0)
でこれによってまた迷信が蔓延する、と
Re: (スコア:0)
という質問なら血液型が当たるのですが・・・
黄色or銀・・・・B型
黒・・・・・・・A型
白・・・・・・・O型
赤?ツートンカラー?・・・・AB型?
Re: (スコア:0)
日本語でおk
まさか血液型と車の色が対応するという主張?
ところで緑とか青とか茶色はどうすんの?
まあ、んなわけないだろうから、
無意味さにおいて愛車の色を当てるのと同じくらい
という皮肉のつもりなのか??
Re: (スコア:0)
調査も意味なければネタとしてもイマイチ (スコア:1)
Re:調査も意味なければネタとしてもイマイチ (スコア:1, 興味深い)
特に無意識に自分の癖が出やすいと思われます
そして、他の国までは知りませんが日本では割と「男らしく」「女らしく」
育てられることが多いので男女の差なんかも出てくると思われます
「思いつき」では無いでしょうが実際漫画だと作者の男女の違いって結構顕著に出ますよね
着眼点(視点)やアシスタントが絡んでいても絵(線)の描き方で差が出たり
特にジャンプなどの少年漫画やエロ有りの成年漫画だと、作者の男女差が
はっきりと判る気がします
年齢については漢字の使い方・文体や話題の内容で絞れるでしょうし
サンプルが増えれば結構確率を高くできるんのではないでしょうか
後は性別と年齢が推測できTwiterの内容から嗜好もある程度は判るとなると
様々なマーケティングの参考にできるので、割と実用的かもしれません
Re: (スコア:0)
Re:調査も意味なければネタとしてもイマイチ (スコア:1, すばらしい洞察)
botくんの年齢等も判断してほしい (スコア:1)
今晩の朝ナマでこのシステムが使われる (スコア:0)
という事らしいので、推定データの確度とか、観てれば各々推測が出来るんじゃないかと思う。
年越しの朝ナマでは散々な感じでしたが、はてさて。
Re: (スコア:0)