パスワードを忘れた? アカウント作成
6526090 story
人工知能

LSVRC(大規模視覚認識コンテスト)でdeep learningを使ったシステムが圧勝 16

ストーリー by hylom
人工知能の進化 部門より
bluecrow 曰く、

LSVRC(Large Scale Visual Recognition Challenge、大規模視覚認識チャレンジ) 2011という画像認識コンテストにおいて、deep learning(ニューラルネットのような多層の認識処理層を持つ機械学習システム)が圧勝したそうだ。画像分類コンテストで圧勝したシステムの発表スライド(PDF)や他参加チームのスライドも公開されている(PDF)。研究者の間ではこの結果は衝撃的だったようだ(Togetterまとめ)。

古い知識しか持ち合わせていないタレコミ子としては、シグモイド関数を否定しmax関数を採用するなど、優勝チームの取った戦略を興味深く見ている。ニューラルネットの世界では「大規模ニューラルネットのブレークスルー: Deep Learning」 」など密かなブレイクスルーが起きており、再び機械学習の最先端に躍り出た恰好だ。

タレコミ子より進んだ知識をお持ちの./erは、このスライドのどんな点に注目するのだろうか。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • ・2011ではなく2012なのでわ
    ・./er(ドットスラッシャー)ではなく /.er(スラッシュドッター)なのでわ
    ええ全ては自分で蒔いた種なわけですが
    • by Anonymous Coward
      ./でも、「ここ」っていう意味があるでしょうから、/.erでもここに集まっている人々っていう意味なら良いんじゃないかと最近思うようになりました。むしろ、/.だと書き込もうにも、permission deniedを食らうという・・・。
  • by Anonymous Coward on 2012年11月01日 6時04分 (#2263516)

    高専プロコン、「サイコロの個数を数える」という課題に対し人力で数えたチームが優勝 [srad.jp]
    まあ人間の脳はニューラルネットワークそのものだわな

    • by Anonymous Coward

      ディープカウントとか言っとけばかっこいいんじゃない?

      • by Anonymous Coward

        チープカウント、いやチートカウントか。

  • おっさん的には、視覚でニューラルというとパーセプトロンしか思いつかないんだけど…
    なんかこの分野の俯瞰的な状況を教えてエライ人

    --
    # mishimaは本田透先生を熱烈に応援しています
  • by Anonymous Coward on 2012年11月01日 6時45分 (#2263524)

    機械翻訳や音声認識などでは、事前に蓄えた大量のデータセットを利用した処理が当たり前のようになっているそうだが、それと同様の流れと理解していいのかな?
    記憶容量の制約や演算量の爆発を気にせずに、昔は泥臭いと思われていたような物量に頼った処理を出来るようになってるらしいが

    • by Anonymous Coward
      >モデルの概要
      >約1週間、確率的な勾配降下法のもと、2つのNVIDIA GPUで訓練した。
      となっているので、GPUによる演算のアシストも効いているようです。
  • by Anonymous Coward on 2012年11月01日 13時10分 (#2263722)

    機械学習をneuralでやったぜ!的な雰囲気ですが、まだ正確な知識を得てないのでよくわからんです(´・ω・`)
    まあ、泥臭くやる手法がとうとうシグモイド関数(fuzzy logic)を終焉と導くほどになったあらわれかもしれません。
    (将棋AIのボンクラーズみたいなもんですかね。。。)
    多層でできたってことから、よーしパパ今から相互結合で頑張っちゃうもんね的なペーパーがでたりするんでしょうか(いや、ない)

    ところで、リンクされてた [fc2.com]とこから引用
    > ただし深いニューラルネットで成功をおさめていたものもありました。
    > ネオコグニトロンや...
    え?!Σ(゚Д゚)

    # マニアックなモデルだと思ってたのでAC
    # 視覚系自己組織化モデルとしては成功かも(ただしonly one)

  • by Anonymous Coward on 2012年11月01日 19時55分 (#2264015)

    kaggle http://www.kaggle.com/ [kaggle.com] というところで、機械学習のコンペが多数開催されているのですが、
    最近終了した "Merck Molecular Activity Challenge" もdeep learningを使ったチームが優勝してました。
    http://blog.kaggle.com/2012/10/31/merck-competition-results-deep-nn-an... [kaggle.com]
    2位がデータマイニングのエキスパートチームだったことを考えると、deep learningおそるべしといったところでしょうか。

  • by Anonymous Coward on 2012年11月01日 20時01分 (#2264020)

    何をどういう処理をしてるんだろな
    解説希望

    何々の(例えば画像?)データを入力として取り

    処理A

    処理B

    処理C

    する

    処理A、B、Cって何?
    数学的処理?
    数学だったらどういう分野?

  • by Anonymous Coward on 2012年11月01日 23時53分 (#2264152)

    シンボルグラウンディング問題 [wikipedia.org]にたいして物量作戦による解決の目処がたった、ということ?

    • by Anonymous Coward
      ・多層(7~8層)のニューラルネットで
      ・事前の画像処理なしで(RGBデータのみで)
      ・deep learning を使い学習し
      ・記号着地に成功し(猫の画像なら猫だと出力し)
      ・特徴量研究者涙目、という状況なのでわ
      • by Anonymous Coward

        データを分類するだけなので記号着地とはとりあえず関係ありません
        (そもそも「猫」だと出力しません)

typodupeerror

犯人は巨人ファンでA型で眼鏡をかけている -- あるハッカー

読み込み中...