著者像を推定してブログの話題を分析するblogeye 52
ストーリー by yoosee
blogプロファイリングみたいなのがあると面白いかも 部門より
blogプロファイリングみたいなのがあると面白いかも 部門より
pascal 曰く、
Internet Watchの記事によれば、ブロガーの性別・年齢・居住域を推定して話題を分析するサービス blogeye が13日に公開された。blogeyeは今年度の未踏ソフトウェア創造プロジェクトで採択された「ブログを用いた『なんでも早期発見システム』の開発プロジェクト」の一環として、東京大学大学院生の大倉務氏が作成したもの。ブログの分析には、独自に開発したブロガーの属性推定手法と流行検出手法を用いているとされており、「研究成果を多くの人に使ってみてもらうために公表した」とのこと。
個々のブログの推定結果は表示されないように配慮されているようだが、機械によって年齢や住んでいる場所が特定されてしまうというのは少し怖い気もする。
少し怖い気もする。 (スコア:2, すばらしい洞察)
有名であることが飯のタネになってる一部の人は仕方ないけれど、
堅気の人が、ブログやSNSやここみたいなBBSで、むやみに個人情報を晒すのは
賢いことだとは思えない。
# ましてここではそういうリスクをコントロールしてると臆病者よばわり。
# それって、蛮勇だとおもうんだけどなぁ。
Re:少し怖い気もする。 (スコア:2, 興味深い)
そのものズバリを書かなくても、近くの施設や、何気ない写真、知り合いのブログの情報などから自宅や職場を探し当て、突撃してくる暇な人たちがたくさんいるんだから、ブログなんて書くもんぢゃないと思うね。
どうしてもコメントしたいなら、2chや/.で匿名で書くのが一番だ。
んなわけでAC
Re:少し怖い気もする。 (スコア:0)
Re:少し怖い気もする。 (スコア:1)
> # ましてここではそういうリスクをコントロールしてると臆病者よばわり。
> # それって、蛮勇だとおもうんだけどなぁ。
これは、「ID発言」ですら「蛮勇」と言っているんですよね。それは違うと思う。ここのIDなんて管理者にメールアドレスが知られる程度ですよね。それすら恐れているなら「臆病者」だし、ID取るのが面倒なら「怠慢」ですよね。そういう私自身長らく自分の納得できるID名を探すのをサボっていたのですが。
# 自分の名前でgoogle検索すると上位5番目くらいまでは自分に関係のあることが出てくるので名前とか出したくないですが...
# でもシステムの弾き出した自分の「推測個人情報」を見てみたいです。その前にブログ書け、という話もありますが。ここの書きこみから判定できないかなぁ?
Best regards, でぃーすけ
Re:少し怖い気もする。 (スコア:1, 興味深い)
何歳何ヶ月の息子が居る・・・と書いただけで1億2000万人のうちの5万にまで特定できます。Macintoshの出荷台数は全世界で40万台にも満たないわけで、そのうえITに詳しい人とか言ったら、ご近所ばれしている可能性だってあるでしょう。
#個人情報駄々漏れで簡単に特定できるのでAC
Re:少し怖い気もする。 (スコア:1)
リスク = 危険 + 恐怖
だと。危険というのは,その事象がおきる確率で,恐怖とはその事象が起きてほしくないと願う度合いと言えばいいのかな。例えば「ブログに書いた家族情報から個人を特定されて家族が危害を加えられる」という"確率"はかなり低いです(いままでそういう事件を聞かないので。これから増えれば危険も増しますが)。しかし小さい子供がいたりすれば「恐怖」はかなり大きいでしょう。なのでリスクを考えるときは「危険」と「恐怖」の双方に適切に対処する必要があります。
Re:少し怖い気もする。 (スコア:0)
わたしは、インターネットに個人情報をさらす場合、恐怖の部分でなくて危険の部分が大きい(問題が起きる確率がそれなりに高い)と考えていますが、どうでしょう?
Re:少し怖い気もする。 (スコア:2, 参考になる)
「ヤバい経済学」には,疑問を持ったときに何を調べればいいのかという実例がいくつも出ていて,そういう意味でもいい本だった。
Re:少し怖い気もする。 (スコア:1)
slashdotにて「臆病者」よばわりを避けるためには何も私のようにする必要はないのです。slashdotはIDが残っている状態でどんどんIDを取っても平気である、と宣言していますから(-- FAQの「自分のアカウントを削除するにはどうすればよいですか?」参照)、例えば発言ごとにIDを取っても良い訳です。(ま、実際IDを沢山とってもさほどslashdotのシステムに負荷をかけることはないでしょう。)
という訳で、最初の私の発言に繋がります。
Best regards, でぃーすけ
Re:少し怖い気もする。 (スコア:0)
Re:少し怖い気もする。 (スコア:0)
そりゃぁ、管理者がIP addressやbrowserの情報を記録してて同一人物と思われる発言を集めて... ってやられたらACでも安全とはいえませんが、IDつけて発言するよりは危険度が低いと思うのです。
Re:少し怖い気もする。 (スコア:0)
どこかで本名と紐付けられると全て匿名でなくなります。
実社会で本名だけを知ってる人に「趣味でソフトとか公開している」と話しただけで、次に会ったときに「有名なんですね」とか言われたときはあせりました。
パソコン通信時代にvectorで紐付けられて今でもwebで公開されてるのでバレバレです(あまりない名前だし)
Re:少し怖い気もする。 (スコア:1)
写真や実名を意外と気楽に公開しているような気がします。
日本人は・・・陰湿なんでしょうか。
Re:少し怖い気もする。 (スコア:1)
極端な例だけど、ケンタッキーでゴキブリ揚げた話があったとき、2chのスレッド紹介系のblogでついてたコメントに、「ケンタッキー好きなのに許せない!誰か個人情報晒してこいつの人生滅茶苦茶にしてやれ」というのがあって、前半から後半への飛躍に恐ろしくなりました。
重大な悪戯は厳正に処罰されるべきとは思うけど、ゴキブリ揚げること(しかも真偽は不明)と人生って、釣り合いが取れちゃうべきなのか・・・と、未だに考え込んでしまいます。
とは言え、こういう例をもって「日本人は陰湿」なのかと言うとそうではなくて、何か間違いを起こしてしまったらどうしようという恐れから来る息苦しさが、そこから逸脱してしまった人に向けて一気に噴出してしまい、それを見て恐れをなしてしまってさらに縮こまりつつ、息苦しさの鬱憤を晴らすための噴出先を互いに目を光らせて探し、以下無限ループ、って感じなのかなぁと。
Re:少し怖い気もする。 (スコア:0)
アメリカ人は「誰か個人情報晒してこいつの人生滅茶苦茶にしてやれ」なんて他人任せなことを言わずに
件の高校に乗り込んで銃を乱射するくらいオープンです。
Re:少し怖い気もする。 (スコア:0)
そう。
見方が極小と極大しか無い。中間が無い。これは結構よく語られる日本人像。
この中間とは何か?マジ考えた方がいいと思う。
Re:少し怖い気もする。 (スコア:0)
玉虫色って奴ですね。日本人の得意とするところです。
Re:少し怖い気もする。 (スコア:1)
なんか2極ではないけれど、やっぱり何かが極端なような。
適切なだけ責任取る、という作業は日本文化においては難しいのかなぁ。
Re:少し怖い気もする。 (スコア:1)
そういうピアプレッシャーを感じて匿名に走る人たちだけ
--
のりたま@解析するプログラムがあるなら
ブログの内容をかく乱させるを吐き出すプログラムも作ればいいだけじゃん
Re:少し怖い気もする。 (スコア:1)
というのは措くとして、いつもリスクをコントロールしなきゃいけないか、ということを考えるべきでしょうね。
#そりゃ、内部情報をタレこんだりコメントしたりする場合は私だって匿名の臆病者になりますけど。
個人的な感想を述べれば、そういう葛藤が起きない、ってことは、近代的自我なんつーものは、幻想に過ぎないんだねー、と思わざるを得ませんね。
Re:少し怖い気もする。 (スコア:0)
> とを考えるべきでしょうね。
IDとACを使い分けるより、常にACのほうが、間違えてIDで送信してしまう
リスクがない分安全ですよね。
Re:少し怖い気もする。 (スコア:1)
近代的自我があれば(強ければ)偉いとも思いませんけどね。
Re:少し怖い気もする。 (スコア:0)
Re:少し怖い気もする。 (スコア:1)
「だけに見えます」は視野狭窄が過ぎるでしょう。
それに、意見は主張するのに、その責任を一切持とうとしない自我も、十分卑俗です。
Re:少し怖い気もする。 (スコア:1)
Re:少し怖い気もする。 (スコア:0)
タイトルを読むだけで、ある程度の人物像は浮かびますよ。
#人物像バレバレなのでAC
Re:少し怖い気もする。 (スコア:1)
Re:少し怖い気もする。 (スコア:0)
Re:少し怖い気もする。 (スコア:1)
過去にはfjというもっと恐ろしい場所があったので、感覚が麻痺してるだけかもしれませんけど。
Re:少し怖い気もする。 (スコア:1)
> (別段親しくもない)あなたの知人が/.を見ていて、あなたがalef_Fであったことに気づいてしまう
ってことになるのが気持ち悪い人にとっても、
固定のハンドルが付くだけで個人情報の漏洩リスクとか言われてもなぁ。 [srad.jp]、
その人物像から個人を特定できるなら、それを個人情報と呼んでも構いません [srad.jp]
という話でいう「個人情報」にはならないと思いますね。
私も人物像が推測できたり、知人に趣味心情がばれるといったのは気にしませんが、ブログだの掲示板だので個人情報はさらしたくないですね。
#今でも時々fjに書き込んでるし、fjの記事までたどり着けば個人情報もろばれですが…
Re:少し怖い気もする。 (スコア:1)
>なんとなく見えてしまうのは気持ち悪くありませんか?
横から失礼します。
ID・匿名に関わらず、投稿が、自分自身の趣味・信条等々を
反映したものになるのは、やむを得ないのではないでしょうか。
その事を踏まえた上で、なおかつ、自分の意見を表明するところに、
ネットのコミュニケーションの「面白さ」があるのではないかと。
Re:少し怖い気もする。 (スコア:0)
・(おそらく関東の)アパート住まい
・コミックガンボを配布していた駅を2つ通勤に利用している
(23区内だと該当駅は20、それ以外を含めても30)
個人情報に結びつくようなのは、これしか分かりませんな
ただ、Alef Fさんはスラドに400回以上コメントしてるので、それらも調べればもっと個人情報に繋がるかもしれません。
日記書いてたりする人だと、更に情報は集まるでしょうね
何より、私があるIDを持つ人物が1億2千万人のうちの誰であるかを特定するのは非常に困難ですが
その人物の知り合いが、自分の知り合い数十数百人のうちの誰かそのIDの人物を重ね合わせるのは、はるかに容易でしょうね。
Re:少し怖い気もする。 (スコア:1)
そういう人に/.-JのIDと個人が結びつけられたからといって、なにか問題が起きるともあまり思えないです。
#首都圏在住程度より細かい個人情報に結びつくようなことは、なるべく書かないように気を使ってるつもりなんです、これでも。
LEFT ALONE (スコア:2, おもしろおかしい)
さっそく、blogeye.jpにアクセスし、個人的に関心のあるキーワードをいくつか入れてみたのですが(詳細は秘匿)、引っかかる件数が少なすぎて…。
世間からズレているのは前から気づいてましたが、ブロガー諸氏諸嬢からもズレていることが、今回判明してしまいました。X-)
Re:LEFT ALONE (スコア:0)
「さー、あたしには関係ないしぃ」
「そうよね~」
Anonymous Cowardの著者像 (スコア:0)
#いえ、私じゃなくってもう一人の方のを
Re:Anonymous Cowardの著者像 (スコア:0)
Re:Anonymous Cowardの著者像 (スコア:0)
Re:Anonymous Cowardの著者像 (スコア:0)
#1265546 で「もう一人の」と書かれている様に、
ACはこの俺と #1265546 の二人でやってるんだぜ。
御前達は俺じゃないから、必然的に #1265546 と言う事になる。
Re:Anonymous Cowardの著者像 (スコア:0)
#じゃあオレは誰?
Re:Anonymous Cowardの著者像 (スコア:0)
多重人格ということで意見の一致を見ております。
#もちろんAC。
そこまで特定しなくてもいいから (スコア:0)
Re:そこまで特定しなくてもいいから (スコア:0)
…UOで女性キャラやってて最初に誘ってくれた友達としゃべってたら、彼のUO内奥さん(リアル女性)がものすごい嫉妬してたことがありましたので、夢ばかりではないみたいですが。
年齢 (スコア:0)
だとすれば実年齢と一致するとは限らないから、個人情報としての意味は薄いですな。
どんどん暴きましょう。
Re:年齢 (スコア:1)
種死関係だったら、腐女子。
三国人叩きに熱中するのは、ネトウヨ。
頭は10代。体はボロボロ。
・・・ビタミン剤でも売りつけましょうか。
Re:年齢 (スコア:1)
でも結局、そういうルールをたくさん準備したエキスパートシステム [wikipedia.org]みたいなもんなんでしょうね。そう考えると、未踏ソフトウェアと言う割には1980年代の薫りが漂っている感じです。
Re:年齢 (スコア:1)
「未踏」かというとどうか、には同意。まぁ、結果を目新しく示す、ということですかね。
Re:年齢 (スコア:0)
「書き手の属性推定には、独自に開発したブログテキストからの著者属性推定技術を用いています。この技術では、多数のブログを統計的に分析して得た辞書を用いることで、ブログテキストに含まれる僅かな特徴も捉え、著者属性を推定できます。」
となっていますね。機械学習などの統計的自然言語処理技術を使っているのではないでしょうか?
Re:年齢 (スコア:0)
1stやボトムズやマクロスは有名すぎるので手がかりにならない。
ザンボット3やオーガスやガリアンなどがあればオジサンの可能性は高いと思う。
懐かしい (スコア:0)
サイトを思い出した。その時代に出てくればもっと話題になったのかも
しれないなあと。
でもまあそれが本当に有意義であれば出てくる時期に問題はないか。