Microsoftの画像の説明文を自動生成するAI「CaptionBot」、色々な意味で話題に

Microsoftの画像の説明文を自動生成するAI「CaptionBot」、色々な意味で話題に 38

ストーリー by hylom 2016年04月21日 7時00分
まだまだ未熟か部門より

あるAnonymous Coward 曰く、

Microsoftが写真を自動認識して説明文（キャプション）を自動的に生成するボット「CaptionBot」を公開しているのだが、これによって生成された説明文が物議を醸しているという（MashableAsia、RBB TODAY、Slashdot）。
たとえば、ミシェル夫人を腕に抱くオバマ米大統領の写真には「スーツにネクタイの男性が携帯電話に話している」との説明文が出力された。また、昨年世界を二分する騒ぎを起こした「白金・青黒ドレス」については、「ネクタイを締めた猫」と判定されている。
TEAMROCK.COMでは13の写真をCaptionBotに判定させている。たとえばロックバンドMetallicaのメンバーがアイスホッケーチーム「San Jose Sharks」のマスコットキャラクターの着ぐるみと映っている写真では、CaptionBotは正しくメンバーのJames Hetfieldを認識した。しかし、目立つ着ぐるみについてはスルーされている。ほかの有名人では、Courtney Loveは認識できたものの、ロックバンドKISSのGene Simmonsは認識できず「オートバイに座っている赤いジャケットの女性」と認識されていた。また、世界で話題の日本人アイドルグループBabymetalについてはまったく認識できなかったようだ。こうしたミスを探すのもネタとして楽しまれている模様。
なお、先日同じくMicrosoftの人工知能チャットボット「Tay」がヒトラーを肯定したり、人種差別的な言葉を発したりするように学習されてしまったことが話題になったが、このような問題を受けてか、ヒトラー関係の画像はすべて無視するように設定するなどの対策が施されている模様。オサマ・ビンラディンも識別しないようになっているという。しかし、同じナチス指導者であるメンゲレやゲッベルスについては識別可能で、また毛沢東、ポルポトもしくはサダム・フセインも識別可能と、対処にはばらつきがあるようだ（CNN）。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索38コメント Log In/Create an Account

やってみた (スコア:2)

by nemui4 (20313) on 2016年04月21日 7時41分 (#3001154) 日記

PCの中にあったサンプル画像とその他を投入
紫陽花
->I think it's a close up of a plant.
コアラ
->I think it's a close up of a dog.
クラゲ
->I am not really confident, but I think it's a group of colorful kites in the sky.
お台場のガンダム像(夜)
->I think it's a street sign at night.
桜の木
->I think it's a large tree.
概ねあってますね。
コアラって犬っぽいし、青い海の中のクラゲも凧に見えなくはない。
#ハリウッド映画のキャラくらいなら認識するのかな。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  windowsのシンボルマーク (http://images.srad.jp/topics/microsoft_64.png)
  -> I am not really confident, but I think it's a close up of two giraffes near a tree.
  internet explorerのアイコン (http://res1.windows.microsoft.com/resbox/en/internet%20explorer/main/9ef08744-ea07-42e7-a69a-0e722a9f30bd_10.png)
  -> I am not really confident, but I think it's two giraffes in a fenced in area.
  caption botのアイコン (https://www.captionbot.ai/Images/captionbot.png)
  -> I am not really confident, but I think it's two gi
  - Re:やってみた (スコア:2)
    
    by minet (45149) on 2016年04月21日 13時07分 (#3001301) 日記
    
    Winfows XPの壁紙（草原）
    I think it's a lush green field.
    Windows 8の壁紙（花）
    I think it's a flower in it.
    Windows 10の壁紙（光るガラスのロゴ）
    I think it's a stop light at night.
    極めて普通の反応でした。身内のネタを知っているわけではないらしい。マイクロソフトはこういう所がマジメだなあ。
    
    シェア
    
    親コメント
  - Re:やってみた (スコア:1)
    
    by nemui4 (20313) on 2016年04月21日 9時59分 (#3001202) 日記
    
    「写真」を対象にしているようでイラストやアイコンはダメみたいですね。
    鳥獣戯画のカエル(立ってるカエル一匹でテーブルとかも無い)を単体でぶちこんだら
    ->I am not really confident, but I think it's a couple of giraffes that are walking on the edge of a table.
    抽象化とか簡略などのアレンジはまだ認識できないっぽい。
    写真でも「補正」が効いてると苦手なのかもしれない。
    
    シェア
    
    親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    何故キリンなんだろう。しかも２頭。
    - Re:やってみた (スコア:1)
      
      by minet (45149) on 2016年04月21日 20時38分 (#3001553) 日記
      
      「2頭のキリン」は、他にも回答する画像がありました。
      学習に使った素材の中にそういう写真があったのではないかと思います。
      
      シェア
      
      親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      ラフイラストとかアニメのキャプチャとか与えると高確率で2匹のキリンが来る
      元ネタの画像見てみたい
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    なんだこの動物園（キリンしかいない）
- Re: (スコア:0)
  
  by Anonymous Coward
  
  自動車を運転したり囲碁で人間に勝ったり、最近の人工知能の進化凄いと思う一方で、
  まだ、こんなこともまともにできないのかと、人工知能が人間を追い越すなんてまだまだ先なんじゃと思ったりもする。
  ＞ヒトラー関係の画像はすべて無視するように設定するなどの対策が施されている模様。
  無視ってのは雑な対応だなぁ。
  まあ、ヒトラーじゃないのにヒトラーと判定されたら、ゴリラ問題みたいになるから仕方ないのか。
  - Re:やってみた (スコア:1)
    
    by nemui4 (20313) on 2016年04月21日 15時07分 (#3001356) 日記
    
    チャップリンの独裁者関連もシカトされるんすかね。
    お試しテストっぽいから、取り敢えず対応できないところはスルーしておくのはしょうがないか。
    どうせみんなあの手この手で際どい写真乗せて愉しむんだろうし。
    
    シェア
    
    親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    単にサンプルが足りないだけで十分まともにできてると思うよ
    コアラ見せられて犬とか、そりゃコアラ見たことなけりゃそう言うだろ
    そのうちインターネットからガンガン画像収集してマンコと赤貝も正確に判別できるようになるだろうね
    そしたら人間の代わりに猥褻図画の裁判やらせればいい
- Re: (スコア:0)
  
  by Anonymous Coward
  
  山繭蛾の写真があったので投入してみました
  「対の靴と思う」でした。
  そのように見えなくもありません。
人の写真は表情を認識して絵文字で返す (スコア:2)

by minet (45149) on 2016年04月21日 13時00分 (#3001298) 日記

ビル・ゲイツ [wikimedia.org]を見せたら
I think it's Bill Gates in a suit and tie and he seems 😁.
と返した。
面白かったのが、スラド過去記事 [security.srad.jp]からリンクされてた「日経新聞出版社、ネット炎上/緊急記者会見対策DVDを発売」 [impress.co.jp]の画像を見せたら
I think it's a group of people sitting at a desk and they seem 😐😐😐😐.
と返した。複数人の表情も認識するようだ。
嘆かわしい (スコア:1)

by Anonymous Coward on 2016年04月21日 9時41分 (#3001195)

AIに対してまで言論弾圧とは...
Microsoftも面倒なのに目を付けられたな
- Re:嘆かわしい (スコア:1)
  
  by ciina (26410) on 2016年04月21日 9時56分 (#3001200) 日記
  
  公共への発言・表現には責任が付きまとうものだから、botにも責任が必要がなったと考えればサイバーではなかろうか。
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  実験的なサービスとしても、世界に公開している以上は相応の管理がなされるのは妥当だと思うけどな。
  どの辺が言論弾圧なんだろう？
  ＡＩが「この人物はヒトラー」であると判別するのが言論なんスかねぇ。
  ＡＩの機能を制限するのが弾圧なんスかねぇ。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    焚書や放送法や金盾と何が違うの？
    とおっしゃりたいわけですね
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      いいえ。
      MicrosoftのCaptionBotへの措置のどの辺がどのように言論弾圧なのか教えてほしいだけですよ。
      なぜここで焚書や放送法や金盾が出てくるのかもわかりません。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  Googleのゴリラタグ騒動 [it.srad.jp]とか、面倒くさい連中を
  相手にしなきゃならんのはMicrosoftに限った話ではない。
  そのうち、人工知能をポリティカリーコレクトな状態に再教育したり検証したりする専門家や会社が出てくるかもな。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  旭日旗を学習させて炎上させよう
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    CaptionBot「統一教会」
- Re: (スコア:0)
  
  by Anonymous Coward
  
  品位のない言動をするようなAIは、MSの技術力のなさを露呈することになるし、
  そういったAIを放置することは、MSの品位のなさや管理能力のなさを露呈することになり、
  いずれにしてもMSのイメージダウンにつながるから。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    ヒトラーをヒトラーと判定するのに、技術力とは関係ないでしょ。
    むしろ、できないほうが疑われる。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      品位のある言動をとらせることと、ヒトラーをヒトラーと判定することに何の関係が？
      全く別の話じゃん。
      それに後者は技術力がないと出来ないし、前者に至っては技術力があっても出来てないよ？
      なぜ無関係の話を持ち出すのかも分からないし、それが技術力と関係ないって見解になるのかも分からんね。
      #ヒトラーと判定できたものをマスクするのは実に簡単だが
認識されない様に対処ってマズくね？ (スコア:0)

by Anonymous Coward on 2016年04月21日 9時52分 (#3001197)

AIに対してステルス性能があるって事だよね？
認識しつつ無視（無反応）が正しい対処じゃね？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  Googleも黒人をゴリラとタグ付けした事件で、認識エンジンからゴリラカテゴリを外す [wsj.com]という処置をやった。
  社会的な制約のせいでAIの痴呆化がすすむ。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    こうやって日々 AI の足を引っ張っていかないと、すぐに AI が超知性へと進化して人類を置き去りにするから仕方がない。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      ~~超知性への進化~~オレたちに突然変異して人類一般人を置き去りにするから仕方がない。
      かと・・・
タグ (スコア:0)

by Anonymous Coward on 2016年04月21日 10時05分 (#3001206)

もうこれ「変なモノ」でいいんじゃなかろうか……
気持ち悪い (スコア:0)

by Anonymous Coward on 2016年04月21日 12時05分 (#3001264)

>世界で話題の日本人アイドルグループBabymetal
「世界で話題」という表現では実態と与える印象に差がありすぎるでしょ
そんなでは以前にもあった韓国のナントカスタイルってやつと同じではないか
- Re:気持ち悪い (スコア:2)
  
  by I-say (18650) on 2016年04月21日 14時49分 (#3001347)
  
  その手のもんまとめて「インド人もビックリ」程度に思っておけば、
  無駄にストレス溜めないで済むんじゃない？
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  韓国のなんとかスタイルは実際世界中で話題になったからあのデブに失礼だな。
  あの歌は韓国の恥部を歌った歌詞だからわだいになると韓国人は恥ずかしいのだが。
  尤もみんな歌詞は気にせず面白動画として楽しんでるんだから別にいいか。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  「世界で話題」なんて見出しを見たって屁とも思いませんけどね。
  媒体によっては、具体的に名何の意味もない惹句どころか、東スポ以下の安易なキャプションですし。
  昨今は特に。
  「筆者の脳内世界では話題」と解釈して概ね間違いないですよ。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  わざわざ海外の音楽メディアのサイトが取り上げてるくらいだから
  話題になっているのは確かなのでは？
  良い意味か悪い意味でかはともかく。
CaptainBot (スコア:0)

by Anonymous Coward on 2016年04月21日 12時18分 (#3001270)

と空目した、シビル・ウォーの待ち切れなさ
TOEIC (スコア:0)

by Anonymous Coward on 2016年04月21日 12時29分 (#3001276)

Part1の問題作成はできない、まで理解しました。
認知 (スコア:0)

by Anonymous Coward on 2016年04月21日 15時37分 (#3001367)

物事の認知・認識っていうのは難しそうですね
視覚的にこう見える
→それを各種の知識と照らし合わせる
　（こんな背景とこの動物の組み合わせは変だなとか、まあいろいろ）
→それを踏まえて、もう一回視覚情報を再検討
→再度知識と照らし合わせ
→・・・
みたいなプロセスが必要だろうから。
視覚だけじゃなくて、聴覚にしても、自然言語認識にしても同じだけど。
ロールシャッハーテスト的な、多様な見方があるものとかもあるだろうし、
この構図は、○○って画家、あるいは写真家の有名な作品の構図だ、みたいな考え方もあるだろうし
- Re: (スコア:0)
  
  by Anonymous Coward
  
  そこらへんのプロセスはニューラルネットでブラックボックスなんじゃないのかな

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

やってみた (スコア:2)

Re: (スコア:0)

Re:やってみた (スコア:2)

Re:やってみた (スコア:1)

Re: (スコア:0)

Re:やってみた (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:やってみた (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

人の写真は表情を認識して絵文字で返す (スコア:2)

嘆かわしい (スコア:1)

Re:嘆かわしい (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

認識されない様に対処ってマズくね？ (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

タグ (スコア:0)

気持ち悪い (スコア:0)

Re:気持ち悪い (スコア:2)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

CaptainBot (スコア:0)

TOEIC (スコア:0)

認知 (スコア:0)

Re: (スコア:0)