Re:AIが自ら判断して断念したというのなら評価する (#3112102) | 東ロボくん、東大を断念

「東ロボくん、東大を断念」記事へのコメント

記事ページを表示すべてのコメント取得

検索67コメント Log In/Create an Account

AIが自ら判断して断念したというのなら評価する (スコア:1)

by qem_morioka (30932)

食わせる正解が少ない場合は(記事のを引用すれば)寒いという言葉の意味を
どこかで教える必要がでてくるってことか。
AlphaGOみたいに囲碁のルール教えなくても、とにかく大量にデータ食わせて
さらに自己対戦して学習を深化させれば、もう意味(囲碁のルール)なんて
関係なくなる、いわゆる無我の境地にたっ(回線が切れました
- Re: (スコア:1)
  
  by Anonymous Coward
  
  AlphaGoでも囲碁の「ルール」は教えてるんじゃね．
  教えてないのは定石や評価関数や、可能性の高い次の手の予想など。
  しかし自然言語理解においてはその覚えるべきルールが、即ち「常識」があまりに多すぎるんだな。
  これはもう「未来の二つの顔」のネタの一つになってたくらいの古典的問題の一つ。
  - Re: (スコア:1)
    
    by qem_morioka (30932)
    
    AlphaGOに囲碁のルールは全く教えてないよ。
    良いとされる棋譜を大量に読み込ませ(教師付き学習)、
    ある程度勝つ結果が出てきたら自分自身対戦させて学習を深化(強化学習)させた。
    対象のルールを教えなくても学習を深化させれば良い結果を出す、
    ということで、AlphaGOの学習に偏った方法も話題になったと思ったけど…
    - Re: (スコア:1)
      
      by Anonymous Coward
      
      こういうデマを広げちゃ駄目よ。
      AlphaGoの基本は、既存のMCTSであって、当然囲碁のルール通りに打つ仕組みが根幹にある。
      ルールを知らなかったら、ランダムにプレイアウトを作るMCTSが動作するわけがない。
      そのうえで、どの手がよさそうか評価するところにDeepLearningを使ってるだけ。
      - Re: (スコア:1)
        
        by qem_morioka (30932)
        
        囲碁のルールは教えていないです。教えているのはこれが良い棋譜、これが
        悪い棋譜というものだけ(教師付き学習)で、ランダムプレイさせてるわけじゃない。
        # MCTSの漏れで負けたのは確かだけどね
        
        Re:AIが自ら判断して断念したというのなら評価する (スコア:1)
        
        by Anonymous Coward on 2016年11月10日 11時24分 (#3112102)
        
        ちゃんとネイチャーの記事読め。
        MCTSと言っている時点でルールが前提なのは当たり前。
        あなたMCTSも全然分かってないでしょ。
        さらに強化学習の部分もうそ。
        自己対戦で強化学習の部分は、かえって精度落とすから、バッサリ限定利用にしている。
        
        シェア
        
        親コメント
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        プレイアウトがあるからMCTSが使えるとか、最初聞いた時は「その発想はなかった！」だったわ。
        これ、チェスとか将棋だと使えないたぶんテクニックなんだよね。
        そもそも「黒と白が交互に差す」「相手のコマに触ったり動かしたりしてはダメ」
        「一度打ったコマは動かしちゃダメ」みたいなのも、かなり特殊なルールだけど、この辺も
        棋譜だけ与えて学習しろと言われてもお手上げだろうね。基本だけでも囲碁を知ってる人間なら、
        その辺は「常識」なのでルールの範疇だと意識してないかもしれない。
        #麻雀なら「一定条件を満たせば相手の捨てた牌を取ることができる」というルールがあったり。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

東ロボくん、東大を断念 More ログイン

「東ロボくん、東大を断念」記事へのコメント

AIが自ら判断して断念したというのなら評価する (スコア:1)

Re: (スコア:1)

Re: (スコア:1)

Re: (スコア:1)

Re: (スコア:1)

Re:AIが自ら判断して断念したというのなら評価する (スコア:1)

Re: (スコア:0)

スラド