LSVRC(大規模視覚認識コンテスト)でdeep learningを使ったシステムが圧勝 16
ストーリー by hylom
人工知能の進化 部門より
人工知能の進化 部門より
bluecrow 曰く、
LSVRC(Large Scale Visual Recognition Challenge、大規模視覚認識チャレンジ) 2011という画像認識コンテストにおいて、deep learning(ニューラルネットのような多層の認識処理層を持つ機械学習システム)が圧勝したそうだ。画像分類コンテストで圧勝したシステムの発表スライド(PDF)や他参加チームのスライドも公開されている(PDF)。研究者の間ではこの結果は衝撃的だったようだ(Togetterまとめ)。
古い知識しか持ち合わせていないタレコミ子としては、シグモイド関数を否定しmax関数を採用するなど、優勝チームの取った戦略を興味深く見ている。ニューラルネットの世界では「大規模ニューラルネットのブレークスルー: Deep Learning」 」など密かなブレイクスルーが起きており、再び機械学習の最先端に躍り出た恰好だ。
タレコミ子より進んだ知識をお持ちの./erは、このスライドのどんな点に注目するのだろうか。
打ち間違え (スコア:2)
・./er(ドットスラッシャー)ではなく /.er(スラッシュドッター)なのでわ
ええ全ては自分で蒔いた種なわけですが
Re: (スコア:0)
なぜこれが関連ストーリーにない (スコア:1)
高専プロコン、「サイコロの個数を数える」という課題に対し人力で数えたチームが優勝 [srad.jp]
まあ人間の脳はニューラルネットワークそのものだわな
Re: (スコア:0)
ディープカウントとか言っとけばかっこいいんじゃない?
Re: (スコア:0)
チープカウント、いやチートカウントか。
パーセプトロンとどう違うの? (スコア:1)
おっさん的には、視覚でニューラルというとパーセプトロンしか思いつかないんだけど…
なんかこの分野の俯瞰的な状況を教えてエライ人
# mishimaは本田透先生を熱烈に応援しています
Re:パーセプトロンとどう違うの? (スコア:2, 参考になる)
http://besom1.blog85.fc2.com/blog-entry-104.html
http://research.preferred.jp/2012/11/deep-learning/
Re:パーセプトロンとどう違うの? (スコア:1)
おー
参考になります!
# mishimaは本田透先生を熱烈に応援しています
物量戦? (スコア:0)
機械翻訳や音声認識などでは、事前に蓄えた大量のデータセットを利用した処理が当たり前のようになっているそうだが、それと同様の流れと理解していいのかな?
記憶容量の制約や演算量の爆発を気にせずに、昔は泥臭いと思われていたような物量に頼った処理を出来るようになってるらしいが
Re: (スコア:0)
>約1週間、確率的な勾配降下法のもと、2つのNVIDIA GPUで訓練した。
となっているので、GPUによる演算のアシストも効いているようです。
neural networkというよりexpert systemより? (スコア:0)
機械学習をneuralでやったぜ!的な雰囲気ですが、まだ正確な知識を得てないのでよくわからんです(´・ω・`)
まあ、泥臭くやる手法がとうとうシグモイド関数(fuzzy logic)を終焉と導くほどになったあらわれかもしれません。
(将棋AIのボンクラーズみたいなもんですかね。。。)
多層でできたってことから、よーしパパ今から相互結合で頑張っちゃうもんね的なペーパーがでたりするんでしょうか(いや、ない)
ところで、リンクされてた [fc2.com]とこから引用
> ただし深いニューラルネットで成功をおさめていたものもありました。
> ネオコグニトロンや...
え?!Σ(゚Д゚)
# マニアックなモデルだと思ってたのでAC
# 視覚系自己組織化モデルとしては成功かも(ただしonly one)
Kaggle competition も制覇 (スコア:0)
kaggle http://www.kaggle.com/ [kaggle.com] というところで、機械学習のコンペが多数開催されているのですが、
最近終了した "Merck Molecular Activity Challenge" もdeep learningを使ったチームが優勝してました。
http://blog.kaggle.com/2012/10/31/merck-competition-results-deep-nn-an... [kaggle.com]
2位がデータマイニングのエキスパートチームだったことを考えると、deep learningおそるべしといったところでしょうか。
ニューラルネットってなんぞや (スコア:0)
何をどういう処理をしてるんだろな
解説希望
何々の(例えば画像?)データを入力として取り
処理A
処理B
処理C
する
処理A、B、Cって何?
数学的処理?
数学だったらどういう分野?
よくわからないんだが (スコア:0)
シンボルグラウンディング問題 [wikipedia.org]にたいして物量作戦による解決の目処がたった、ということ?
Re: (スコア:0)
・事前の画像処理なしで(RGBデータのみで)
・deep learning を使い学習し
・記号着地に成功し(猫の画像なら猫だと出力し)
・特徴量研究者涙目、という状況なのでわ
Re: (スコア:0)
データを分類するだけなので記号着地とはとりあえず関係ありません
(そもそも「猫」だと出力しません)