パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

東ロボくん、東大を断念」記事へのコメント

  • 食わせる正解が少ない場合は(記事のを引用すれば)寒いという言葉の意味を
    どこかで教える必要がでてくるってことか。

    AlphaGOみたいに囲碁のルール教えなくても、とにかく大量にデータ食わせて
    さらに自己対戦して学習を深化させれば、もう意味(囲碁のルール)なんて
    関係なくなる、いわゆる無我の境地にたっ(回線が切れました

    • by Anonymous Coward

      AlphaGoでも囲碁の「ルール」は教えてるんじゃね.
      教えてないのは定石や評価関数や、可能性の高い次の手の予想など。

      しかし自然言語理解においてはその覚えるべきルールが、即ち「常識」があまりに多すぎるんだな。
      これはもう「未来の二つの顔」のネタの一つになってたくらいの古典的問題の一つ。

      • AlphaGOに囲碁のルールは全く教えてないよ。

        良いとされる棋譜を大量に読み込ませ(教師付き学習)、
        ある程度勝つ結果が出てきたら自分自身対戦させて学習を深化(強化学習)させた。

        対象のルールを教えなくても学習を深化させれば良い結果を出す、
        ということで、AlphaGOの学習に偏った方法も話題になったと思ったけど…

        • by Anonymous Coward on 2016年11月09日 21時20分 (#3111837)

          こういうデマを広げちゃ駄目よ。
          AlphaGoの基本は、既存のMCTSであって、当然囲碁のルール通りに打つ仕組みが根幹にある。
          ルールを知らなかったら、ランダムにプレイアウトを作るMCTSが動作するわけがない。
          そのうえで、どの手がよさそうか評価するところにDeepLearningを使ってるだけ。

          親コメント
          • 囲碁のルールは教えていないです。教えているのはこれが良い棋譜、これが
            悪い棋譜というものだけ(教師付き学習)で、ランダムプレイさせてるわけじゃない。

            # MCTSの漏れで負けたのは確かだけどね

            親コメント
            • by Anonymous Coward on 2016年11月10日 11時24分 (#3112102)

              ちゃんとネイチャーの記事読め。
              MCTSと言っている時点でルールが前提なのは当たり前。
              あなたMCTSも全然分かってないでしょ。

              さらに強化学習の部分もうそ。
              自己対戦で強化学習の部分は、かえって精度落とすから、バッサリ限定利用にしている。

              親コメント
              • by Anonymous Coward

                プレイアウトがあるからMCTSが使えるとか、最初聞いた時は「その発想はなかった!」だったわ。
                これ、チェスとか将棋だと使えないたぶんテクニックなんだよね。

                そもそも「黒と白が交互に差す」「相手のコマに触ったり動かしたりしてはダメ」
                「一度打ったコマは動かしちゃダメ」みたいなのも、かなり特殊なルールだけど、この辺も
                棋譜だけ与えて学習しろと言われてもお手上げだろうね。基本だけでも囲碁を知ってる人間なら、
                その辺は「常識」なのでルールの範疇だと意識してないかもしれない。

                #麻雀なら「一定条件を満たせば相手の捨てた牌を取ることができる」というルールがあったり。

Stay hungry, Stay foolish. -- Steven Paul Jobs

処理中...