先入観による評価漏れをなくす (#3299047) | 新たな囲碁AI「AlphaGo Zero」、人間の対局データを使わないことでさらなる強さを獲得

「新たな囲碁AI「AlphaGo Zero」、人間の対局データを使わないことでさらなる強さを獲得」記事へのコメント

記事ページを表示すべてのコメント取得

検索119コメント Log In/Create an Account

先入観による評価漏れをなくす (スコア:1)

by akiraani (24305) on 2017年10月20日 17時30分 (#3299047) 日記

AIに創造性があるのではなくて、人間に抜けがあるということなのではなかろうかね。
結局、今の深層学習がやってることって全パターン評価して最高点を探すという作業であって、論理立てて解法を見つけているわけじゃあないでしょ。
ゲームみたいに勝ち負けの判断基準がはっきりしていればそれでまったく問題ないだろうし、そこから先はもう単なるパワーゲームになるんじゃないかな。

--
しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
- Re: (スコア:0)
  
  by Anonymous Coward
  
  これは別に創造性が有るって話ではないよ。
  最初はランダムだって言って居る様に単に勝利のパターンを探すための試行が時間的に効率良く、
  既に無印よりもZEROの方が多くの手をポケットに持って居るってだけだろう。
  - Re:先入観による評価漏れをなくす (スコア:1)
    
    by bero (5057) on 2017年10月20日 19時48分 (#3299157) 日記
    
    考えてみると、人間の「創造性」と言われるものも似たようなものじゃなかろうか
    個体レベルではなく群体レベルで
    最初はランダムに行動または「教師付き学習」して、
    成功したものは名声と金を得てさらなる行動すなわち強化学習し、
    そうでないものは「いい歳してxxxなんかして...」と社会的落伍もしくは（時代によっては）餓死して生物的落伍する
    
    シェア
    
    親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  囲碁の話しているときに、「全パターン評価して」ねえ。
  対局中に現れる局面は、学習に使用したのとは異なる局面が大部分です。それに対して評価値が出せるのは、学習によって、今まで見たことがある局面との共通点から有利不利を推測しているからで、それは「先入観」そのものです。仮に、今のものよりもよい評価値を求められる学習手法ができたとしたら、AlphaGo Zero もやはり「先入観による評価漏れだらけ」ということになります。要するに、全パターン評価なんてできないんだから、抜けがあるのは必然なんです。人間だろうとAIだろうと違いはありません。
  「先入観による評価漏れをなくす」とか、「今の深層学習がやってることって全パターン評価して最高点を探すという作業」という言葉が明らかにしているのは、あなたが深層学習を知らないという事実だけですよ。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  抜けがあるというか、人間向けにあえてそういう手法を構築したという側面もあるのかも。
  自分が例えやすいところで、ソフトウェアの開発でも、
  徹底的に最速な実装を目指すならアセンブラなりC言語なりでガリガリ書かないとダメだけど。
  それだと多くの場面で開発者の能力の限度を超えちゃうから、CGやらオブジェクト指向やらと、
  動作の効率を犠牲にした、扱いやすくてそこそこ「強い」、より簡便な方法が模索されてきたわけで。
  囲碁についても、その手の、人間が扱いやすくするような抽象化が研鑽されてきたんだろうと思う。
  で、このAIも全探索してるわけじゃないわけで、何かしらの「別種の抽象化を使った簡便な方法」に辿り着いたと見なせるような状態なのか、
  そういう方法論として切り出せるような綺麗な物は存在しないぐらいに圧倒的な腕力ベースなのか。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

新たな囲碁AI「AlphaGo Zero」、人間の対局データを使わないことでさらなる強さを獲得 More ログイン

「新たな囲碁AI「AlphaGo Zero」、人間の対局データを使わないことでさらなる強さを獲得」記事へのコメント

先入観による評価漏れをなくす (スコア:1)

Re: (スコア:0)

Re:先入観による評価漏れをなくす (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

スラド