アカウント名:
パスワード:
食わせる正解が少ない場合は(記事のを引用すれば)寒いという言葉の意味をどこかで教える必要がでてくるってことか。
AlphaGOみたいに囲碁のルール教えなくても、とにかく大量にデータ食わせてさらに自己対戦して学習を深化させれば、もう意味(囲碁のルール)なんて関係なくなる、いわゆる無我の境地にたっ(回線が切れました
AlphaGoでも囲碁の「ルール」は教えてるんじゃね.教えてないのは定石や評価関数や、可能性の高い次の手の予想など。
しかし自然言語理解においてはその覚えるべきルールが、即ち「常識」があまりに多すぎるんだな。これはもう「未来の二つの顔」のネタの一つになってたくらいの古典的問題の一つ。
AlphaGOに囲碁のルールは全く教えてないよ。
良いとされる棋譜を大量に読み込ませ(教師付き学習)、ある程度勝つ結果が出てきたら自分自身対戦させて学習を深化(強化学習)させた。
対象のルールを教えなくても学習を深化させれば良い結果を出す、ということで、AlphaGOの学習に偏った方法も話題になったと思ったけど…
こういうデマを広げちゃ駄目よ。AlphaGoの基本は、既存のMCTSであって、当然囲碁のルール通りに打つ仕組みが根幹にある。ルールを知らなかったら、ランダムにプレイアウトを作るMCTSが動作するわけがない。そのうえで、どの手がよさそうか評価するところにDeepLearningを使ってるだけ。
囲碁のルールは教えていないです。教えているのはこれが良い棋譜、これが悪い棋譜というものだけ(教師付き学習)で、ランダムプレイさせてるわけじゃない。
# MCTSの漏れで負けたのは確かだけどね
ちゃんとネイチャーの記事読め。MCTSと言っている時点でルールが前提なのは当たり前。あなたMCTSも全然分かってないでしょ。
さらに強化学習の部分もうそ。自己対戦で強化学習の部分は、かえって精度落とすから、バッサリ限定利用にしている。
プレイアウトがあるからMCTSが使えるとか、最初聞いた時は「その発想はなかった!」だったわ。これ、チェスとか将棋だと使えないたぶんテクニックなんだよね。
そもそも「黒と白が交互に差す」「相手のコマに触ったり動かしたりしてはダメ」「一度打ったコマは動かしちゃダメ」みたいなのも、かなり特殊なルールだけど、この辺も棋譜だけ与えて学習しろと言われてもお手上げだろうね。基本だけでも囲碁を知ってる人間なら、その辺は「常識」なのでルールの範疇だと意識してないかもしれない。
#麻雀なら「一定条件を満たせば相手の捨てた牌を取ることができる」というルールがあったり。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人は巨人ファンでA型で眼鏡をかけている -- あるハッカー
AIが自ら判断して断念したというのなら評価する (スコア:1)
食わせる正解が少ない場合は(記事のを引用すれば)寒いという言葉の意味を
どこかで教える必要がでてくるってことか。
AlphaGOみたいに囲碁のルール教えなくても、とにかく大量にデータ食わせて
さらに自己対戦して学習を深化させれば、もう意味(囲碁のルール)なんて
関係なくなる、いわゆる無我の境地にたっ(回線が切れました
Re: (スコア:1)
AlphaGoでも囲碁の「ルール」は教えてるんじゃね.
教えてないのは定石や評価関数や、可能性の高い次の手の予想など。
しかし自然言語理解においてはその覚えるべきルールが、即ち「常識」があまりに多すぎるんだな。
これはもう「未来の二つの顔」のネタの一つになってたくらいの古典的問題の一つ。
Re: (スコア:1)
AlphaGOに囲碁のルールは全く教えてないよ。
良いとされる棋譜を大量に読み込ませ(教師付き学習)、
ある程度勝つ結果が出てきたら自分自身対戦させて学習を深化(強化学習)させた。
対象のルールを教えなくても学習を深化させれば良い結果を出す、
ということで、AlphaGOの学習に偏った方法も話題になったと思ったけど…
Re: (スコア:1)
こういうデマを広げちゃ駄目よ。
AlphaGoの基本は、既存のMCTSであって、当然囲碁のルール通りに打つ仕組みが根幹にある。
ルールを知らなかったら、ランダムにプレイアウトを作るMCTSが動作するわけがない。
そのうえで、どの手がよさそうか評価するところにDeepLearningを使ってるだけ。
Re: (スコア:1)
囲碁のルールは教えていないです。教えているのはこれが良い棋譜、これが
悪い棋譜というものだけ(教師付き学習)で、ランダムプレイさせてるわけじゃない。
# MCTSの漏れで負けたのは確かだけどね
Re:AIが自ら判断して断念したというのなら評価する (スコア:1)
ちゃんとネイチャーの記事読め。
MCTSと言っている時点でルールが前提なのは当たり前。
あなたMCTSも全然分かってないでしょ。
さらに強化学習の部分もうそ。
自己対戦で強化学習の部分は、かえって精度落とすから、バッサリ限定利用にしている。
Re: (スコア:0)
プレイアウトがあるからMCTSが使えるとか、最初聞いた時は「その発想はなかった!」だったわ。
これ、チェスとか将棋だと使えないたぶんテクニックなんだよね。
そもそも「黒と白が交互に差す」「相手のコマに触ったり動かしたりしてはダメ」
「一度打ったコマは動かしちゃダメ」みたいなのも、かなり特殊なルールだけど、この辺も
棋譜だけ与えて学習しろと言われてもお手上げだろうね。基本だけでも囲碁を知ってる人間なら、
その辺は「常識」なのでルールの範疇だと意識してないかもしれない。
#麻雀なら「一定条件を満たせば相手の捨てた牌を取ることができる」というルールがあったり。