パスワードを忘れた? アカウント作成
12756944 story
マイクロソフト

Microsoftの画像の説明文を自動生成するAI「CaptionBot」、色々な意味で話題に 38

ストーリー by hylom
まだまだ未熟か 部門より
あるAnonymous Coward 曰く、

Microsoftが写真を自動認識して説明文(キャプション)を自動的に生成するボット「CaptionBot」を公開しているのだが、これによって生成された説明文が物議を醸しているという(MashableAsiaRBB TODAYSlashdot)。

たとえば、ミシェル夫人を腕に抱くオバマ米大統領の写真には「スーツにネクタイの男性が携帯電話に話している」との説明文が出力された。また、昨年世界を二分する騒ぎを起こした「白金・青黒ドレス」については、「ネクタイを締めた猫」と判定されている。

TEAMROCK.COMでは13の写真をCaptionBotに判定させている。たとえばロックバンドMetallicaのメンバーがアイスホッケーチーム「San Jose Sharks」のマスコットキャラクターの着ぐるみと映っている写真では、CaptionBotは正しくメンバーのJames Hetfieldを認識した。しかし、目立つ着ぐるみについてはスルーされている。ほかの有名人では、Courtney Loveは認識できたものの、ロックバンドKISSのGene Simmonsは認識できず「オートバイに座っている赤いジャケットの女性」と認識されていた。また、世界で話題の日本人アイドルグループBabymetalについてはまったく認識できなかったようだ。こうしたミスを探すのもネタとして楽しまれている模様。

なお、先日同じくMicrosoftの人工知能チャットボット「Tay」がヒトラーを肯定したり、人種差別的な言葉を発したりするように学習されてしまったことが話題になったが、このような問題を受けてか、ヒトラー関係の画像はすべて無視するように設定するなどの対策が施されている模様。オサマ・ビンラディンも識別しないようになっているという。しかし、同じナチス指導者であるメンゲレやゲッベルスについては識別可能で、また毛沢東、ポルポトもしくはサダム・フセインも識別可能と、対処にはばらつきがあるようだ(CNN)。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by nemui4 (20313) on 2016年04月21日 7時41分 (#3001154) 日記

    PCの中にあったサンプル画像とその他を投入

    紫陽花
    ->I think it's a close up of a plant.

    コアラ
    ->I think it's a close up of a dog.

    クラゲ
    ->I am not really confident, but I think it's a group of colorful kites in the sky.

    お台場のガンダム像(夜)
    ->I think it's a street sign at night.

    桜の木
    ->I think it's a large tree.

    概ねあってますね。
    コアラって犬っぽいし、青い海の中のクラゲも凧に見えなくはない。
    #ハリウッド映画のキャラくらいなら認識するのかな。

    • by Anonymous Coward

      windowsのシンボルマーク (http://images.srad.jp/topics/microsoft_64.png)
      -> I am not really confident, but I think it's a close up of two giraffes near a tree.

      internet explorerのアイコン (http://res1.windows.microsoft.com/resbox/en/internet%20explorer/main/9ef08744-ea07-42e7-a69a-0e722a9f30bd_10.png)
      -> I am not really confident, but I think it's two giraffes in a fenced in area.

      caption botのアイコン (https://www.captionbot.ai/Images/captionbot.png)
      -> I am not really confident, but I think it's two gi

      • by minet (45149) on 2016年04月21日 13時07分 (#3001301) 日記

        Winfows XPの壁紙(草原)

        I think it's a lush green field.

        Windows 8の壁紙(花)

        I think it's a flower in it.

        Windows 10の壁紙(光るガラスのロゴ)

        I think it's a stop light at night.

        極めて普通の反応でした。身内のネタを知っているわけではないらしい。マイクロソフトはこういう所がマジメだなあ。

        親コメント
      • by nemui4 (20313) on 2016年04月21日 9時59分 (#3001202) 日記

        「写真」を対象にしているようでイラストやアイコンはダメみたいですね。
        鳥獣戯画のカエル(立ってるカエル一匹でテーブルとかも無い)を単体でぶちこんだら
        ->I am not really confident, but I think it's a couple of giraffes that are walking on the edge of a table.

        抽象化とか簡略などのアレンジはまだ認識できないっぽい。
        写真でも「補正」が効いてると苦手なのかもしれない。

        親コメント
      • by Anonymous Coward

        何故キリンなんだろう。しかも2頭。

        • by minet (45149) on 2016年04月21日 20時38分 (#3001553) 日記

          「2頭のキリン」は、他にも回答する画像がありました。
          学習に使った素材の中にそういう写真があったのではないかと思います。

          親コメント
        • by Anonymous Coward

          ラフイラストとかアニメのキャプチャとか与えると高確率で2匹のキリンが来る
          元ネタの画像見てみたい

      • by Anonymous Coward

        なんだこの動物園(キリンしかいない)

    • by Anonymous Coward

      自動車を運転したり囲碁で人間に勝ったり、最近の人工知能の進化凄いと思う一方で、
      まだ、こんなこともまともにできないのかと、人工知能が人間を追い越すなんてまだまだ先なんじゃと思ったりもする。

      >ヒトラー関係の画像はすべて無視するように設定するなどの対策が施されている模様。

      無視ってのは雑な対応だなぁ。
      まあ、ヒトラーじゃないのにヒトラーと判定されたら、ゴリラ問題みたいになるから仕方ないのか。

      • by nemui4 (20313) on 2016年04月21日 15時07分 (#3001356) 日記

        チャップリンの独裁者関連もシカトされるんすかね。
        お試しテストっぽいから、取り敢えず対応できないところはスルーしておくのはしょうがないか。
        どうせみんなあの手この手で際どい写真乗せて愉しむんだろうし。

        親コメント
      • by Anonymous Coward
        単にサンプルが足りないだけで十分まともにできてると思うよ
        コアラ見せられて犬とか、そりゃコアラ見たことなけりゃそう言うだろ
        そのうちインターネットからガンガン画像収集してマンコと赤貝も正確に判別できるようになるだろうね
        そしたら人間の代わりに猥褻図画の裁判やらせればいい
    • by Anonymous Coward

      山繭蛾の写真があったので投入してみました

      「対の靴と思う」でした。

      そのように見えなくもありません。

  • ビル・ゲイツ [wikimedia.org]を見せたら

    I think it's Bill Gates in a suit and tie and he seems 😁.

    と返した。

    面白かったのが、スラド過去記事 [security.srad.jp]からリンクされてた「日経新聞出版社、ネット炎上/緊急記者会見対策DVDを発売」 [impress.co.jp]の画像を見せたら

    I think it's a group of people sitting at a desk and they seem 😐😐😐😐.

    と返した。複数人の表情も認識するようだ。

  • by Anonymous Coward on 2016年04月21日 9時41分 (#3001195)

    AIに対してまで言論弾圧とは...
    Microsoftも面倒なのに目を付けられたな

    • by ciina (26410) on 2016年04月21日 9時56分 (#3001200) 日記

      公共への発言・表現には責任が付きまとうものだから、botにも責任が必要がなったと考えればサイバーではなかろうか。

      親コメント
    • by Anonymous Coward

      実験的なサービスとしても、世界に公開している以上は相応の管理がなされるのは妥当だと思うけどな。
      どの辺が言論弾圧なんだろう?

      AIが「この人物はヒトラー」であると判別するのが言論なんスかねぇ。
      AIの機能を制限するのが弾圧なんスかねぇ。

      • by Anonymous Coward

        焚書や放送法や金盾と何が違うの?
        とおっしゃりたいわけですね

        • by Anonymous Coward

          いいえ。
          MicrosoftのCaptionBotへの措置のどの辺がどのように言論弾圧なのか教えてほしいだけですよ。
          なぜここで焚書や放送法や金盾が出てくるのかもわかりません。

    • by Anonymous Coward

      Googleのゴリラタグ騒動 [it.srad.jp]とか、面倒くさい連中を
      相手にしなきゃならんのはMicrosoftに限った話ではない。

      そのうち、人工知能をポリティカリーコレクトな状態に再教育したり検証したりする専門家や会社が出てくるかもな。

    • by Anonymous Coward

      旭日旗を学習させて炎上させよう

    • by Anonymous Coward

      品位のない言動をするようなAIは、MSの技術力のなさを露呈することになるし、
      そういったAIを放置することは、MSの品位のなさや管理能力のなさを露呈することになり、
      いずれにしてもMSのイメージダウンにつながるから。

      • by Anonymous Coward

        ヒトラーをヒトラーと判定するのに、技術力とは関係ないでしょ。
        むしろ、できないほうが疑われる。

        • by Anonymous Coward

          品位のある言動をとらせることと、ヒトラーをヒトラーと判定することに何の関係が?
          全く別の話じゃん。
          それに後者は技術力がないと出来ないし、前者に至っては技術力があっても出来てないよ?
          なぜ無関係の話を持ち出すのかも分からないし、それが技術力と関係ないって見解になるのかも分からんね。

          #ヒトラーと判定できたものをマスクするのは実に簡単だが

  • by Anonymous Coward on 2016年04月21日 9時52分 (#3001197)

    AIに対してステルス性能があるって事だよね?
    認識しつつ無視(無反応)が正しい対処じゃね?

    • by Anonymous Coward

      Googleも黒人をゴリラとタグ付けした事件で、認識エンジンからゴリラカテゴリを外す [wsj.com]という処置をやった。

      社会的な制約のせいでAIの痴呆化がすすむ。

      • by Anonymous Coward

        こうやって日々 AI の足を引っ張っていかないと、すぐに AI が超知性へと進化して人類を置き去りにするから仕方がない。

        • by Anonymous Coward

          超知性への進化オレたちに突然変異して人類一般人を置き去りにするから仕方がない。

          かと・・・

  • by Anonymous Coward on 2016年04月21日 10時05分 (#3001206)

    もうこれ「変なモノ」でいいんじゃなかろうか……

  • by Anonymous Coward on 2016年04月21日 12時05分 (#3001264)

    >世界で話題の日本人アイドルグループBabymetal

    「世界で話題」という表現では実態と与える印象に差がありすぎるでしょ
    そんなでは以前にもあった韓国のナントカスタイルってやつと同じではないか

    • by I-say (18650) on 2016年04月21日 14時49分 (#3001347)

      その手のもんまとめて「インド人もビックリ」程度に思っておけば、
      無駄にストレス溜めないで済むんじゃない?

      親コメント
    • by Anonymous Coward

      韓国のなんとかスタイルは実際世界中で話題になったからあのデブに失礼だな。
      あの歌は韓国の恥部を歌った歌詞だからわだいになると韓国人は恥ずかしいのだが。
      尤もみんな歌詞は気にせず面白動画として楽しんでるんだから別にいいか。

    • by Anonymous Coward

      「世界で話題」なんて見出しを見たって屁とも思いませんけどね。
      媒体によっては、具体的に名何の意味もない惹句どころか、東スポ以下の安易なキャプションですし。
      昨今は特に。

      「筆者の脳内世界では話題」と解釈して概ね間違いないですよ。

    • by Anonymous Coward

      わざわざ海外の音楽メディアのサイトが取り上げてるくらいだから
      話題になっているのは確かなのでは?

      良い意味か悪い意味でかはともかく。

  • by Anonymous Coward on 2016年04月21日 12時18分 (#3001270)

    と空目した、シビル・ウォーの待ち切れなさ

  • by Anonymous Coward on 2016年04月21日 12時29分 (#3001276)

    Part1の問題作成はできない、まで理解しました。

  • by Anonymous Coward on 2016年04月21日 15時37分 (#3001367)

    物事の認知・認識っていうのは難しそうですね
    視覚的にこう見える
    →それを各種の知識と照らし合わせる
     (こんな背景とこの動物の組み合わせは変だなとか、まあいろいろ)
    →それを踏まえて、もう一回視覚情報を再検討
    →再度知識と照らし合わせ
    →・・・
    みたいなプロセスが必要だろうから。
    視覚だけじゃなくて、聴覚にしても、自然言語認識にしても同じだけど。

    ロールシャッハーテスト的な、多様な見方があるものとかもあるだろうし、
    この構図は、○○って画家、あるいは写真家の有名な作品の構図だ、みたいな考え方もあるだろうし

    • by Anonymous Coward

      そこらへんのプロセスはニューラルネットでブラックボックスなんじゃないのかな

typodupeerror

長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds

読み込み中...