アカウント名:
パスワード:
AIに創造性があるのではなくて、人間に抜けがあるということなのではなかろうかね。結局、今の深層学習がやってることって全パターン評価して最高点を探すという作業であって、論理立てて解法を見つけているわけじゃあないでしょ。
ゲームみたいに勝ち負けの判断基準がはっきりしていればそれでまったく問題ないだろうし、そこから先はもう単なるパワーゲームになるんじゃないかな。
これは別に創造性が有るって話ではないよ。最初はランダムだって言って居る様に単に勝利のパターンを探すための試行が時間的に効率良く、既に無印よりもZEROの方が多くの手をポケットに持って居るってだけだろう。
考えてみると、人間の「創造性」と言われるものも似たようなものじゃなかろうか個体レベルではなく群体レベルで
最初はランダムに行動または「教師付き学習」して、成功したものは名声と金を得てさらなる行動すなわち強化学習し、そうでないものは「いい歳してxxxなんかして...」と社会的落伍もしくは(時代によっては)餓死して生物的落伍する
囲碁の話しているときに、「全パターン評価して」ねえ。
対局中に現れる局面は、学習に使用したのとは異なる局面が大部分です。それに対して評価値が出せるのは、学習によって、今まで見たことがある局面との共通点から有利不利を推測しているからで、それは「先入観」そのものです。仮に、今のものよりもよい評価値を求められる学習手法ができたとしたら、AlphaGo Zero もやはり「先入観による評価漏れだらけ」ということになります。要するに、全パターン評価なんてできないんだから、抜けがあるのは必然なんです。人間だろうとAIだろうと違いはありません。
「先入観による評価漏れをなくす」とか、「今の深層学習がやってることって全パターン評価して最高点を探すという作業」という言葉が明らかにしているのは、あなたが深層学習を知らないという事実だけですよ。
抜けがあるというか、人間向けにあえてそういう手法を構築したという側面もあるのかも。
自分が例えやすいところで、ソフトウェアの開発でも、徹底的に最速な実装を目指すならアセンブラなりC言語なりでガリガリ書かないとダメだけど。それだと多くの場面で開発者の能力の限度を超えちゃうから、CGやらオブジェクト指向やらと、動作の効率を犠牲にした、扱いやすくてそこそこ「強い」、より簡便な方法が模索されてきたわけで。
囲碁についても、その手の、人間が扱いやすくするような抽象化が研鑽されてきたんだろうと思う。
で、このAIも全探索してるわけじゃないわけで、何かしらの「別種の抽象化を使った簡便な方法」に辿り着いたと見なせるような状態なのか、そういう方法論として切り出せるような綺麗な物は存在しないぐらいに圧倒的な腕力ベースなのか。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人は巨人ファンでA型で眼鏡をかけている -- あるハッカー
先入観による評価漏れをなくす (スコア:1)
AIに創造性があるのではなくて、人間に抜けがあるということなのではなかろうかね。
結局、今の深層学習がやってることって全パターン評価して最高点を探すという作業であって、論理立てて解法を見つけているわけじゃあないでしょ。
ゲームみたいに勝ち負けの判断基準がはっきりしていればそれでまったく問題ないだろうし、そこから先はもう単なるパワーゲームになるんじゃないかな。
しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
Re: (スコア:0)
これは別に創造性が有るって話ではないよ。
最初はランダムだって言って居る様に単に勝利のパターンを探すための試行が時間的に効率良く、
既に無印よりもZEROの方が多くの手をポケットに持って居るってだけだろう。
Re:先入観による評価漏れをなくす (スコア:1)
考えてみると、人間の「創造性」と言われるものも似たようなものじゃなかろうか
個体レベルではなく群体レベルで
最初はランダムに行動または「教師付き学習」して、
成功したものは名声と金を得てさらなる行動すなわち強化学習し、
そうでないものは「いい歳してxxxなんかして...」と社会的落伍もしくは(時代によっては)餓死して生物的落伍する
Re: (スコア:0)
囲碁の話しているときに、「全パターン評価して」ねえ。
対局中に現れる局面は、学習に使用したのとは異なる局面が大部分です。それに対して評価値が出せるのは、学習によって、今まで見たことがある局面との共通点から有利不利を推測しているからで、それは「先入観」そのものです。仮に、今のものよりもよい評価値を求められる学習手法ができたとしたら、AlphaGo Zero もやはり「先入観による評価漏れだらけ」ということになります。要するに、全パターン評価なんてできないんだから、抜けがあるのは必然なんです。人間だろうとAIだろうと違いはありません。
「先入観による評価漏れをなくす」とか、「今の深層学習がやってることって全パターン評価して最高点を探すという作業」という言葉が明らかにしているのは、あなたが深層学習を知らないという事実だけですよ。
Re: (スコア:0)
抜けがあるというか、人間向けにあえてそういう手法を構築したという側面もあるのかも。
自分が例えやすいところで、ソフトウェアの開発でも、
徹底的に最速な実装を目指すならアセンブラなりC言語なりでガリガリ書かないとダメだけど。
それだと多くの場面で開発者の能力の限度を超えちゃうから、CGやらオブジェクト指向やらと、
動作の効率を犠牲にした、扱いやすくてそこそこ「強い」、より簡便な方法が模索されてきたわけで。
囲碁についても、その手の、人間が扱いやすくするような抽象化が研鑽されてきたんだろうと思う。
で、このAIも全探索してるわけじゃないわけで、何かしらの「別種の抽象化を使った簡便な方法」に辿り着いたと見なせるような状態なのか、
そういう方法論として切り出せるような綺麗な物は存在しないぐらいに圧倒的な腕力ベースなのか。