Re:「AlphaGo」って何だろう (#3216088) | 囲碁世界レーティング1位の柯潔九段とAlphaGoが対局、第1局はAlphaGoが勝利

「囲碁世界レーティング1位の柯潔九段とAlphaGoが対局、第1局はAlphaGoが勝利」記事へのコメント

記事ページを表示すべてのコメント取得

検索31コメント Log In/Create an Account

「AlphaGo」って何だろう (スコア:0)

by Anonymous Coward

この手のソフトは用意したデータセットによって学習結果が大きく変わる。
データセットを変えて学習しなおしたら、身体は一緒だけど中身が違う、ヒトで例えれば双子の片割れのようなものになる。おそらくはAplhaGoも学習リセットのようなことはしてるだろう。
つまり「AlphaGoのレーティング」算出に用いたデータは大勢いるAlphaGo双生児vs棋士の勝負データなのかなと思う。AlphaGoのレーティングを決めるというのは人類のレーティングを決めるのに等しい行為なのかなｗ
- Re: (スコア:2)
  
  by qem_morioka (30932)
  
  AlphaGOって最初は棋譜を学習してある程度良い手を打てるようになったら
  自己対戦による強化学習してる(前回では500万回ww)から、与えた教材が～
  というよりも前回負けた原因でもあるモンテカルロ木探索のパラメーターを
  修正して再度強化学習したんだろうなーと。
  前回のタレコミでAlphaGOには囲碁のルールが実装されてないって言ったら
  ﾌﾙﾎﾞｯｺになったなー
  自己学習における勝敗判定の先生にはもちろんルールが仕込まれてるけど、
  AlphaGo自身には囲碁のルールなんて実装されてないって、もう一度ここで
  大声で言っておこう
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    ルール実装しなかったら、最終的に出力された手が反則手でないことを100%保証できないと思うんだけど
    それは問題ないの？
    - Re:「AlphaGo」って何だろう (スコア:0)
      
      by Anonymous Coward on 2017年05月24日 15時24分 (#3216088)
      
      そんなもん保証する必要ある？
      反則手を指したらその先生プログラムが敗北判定してくれるんだから
      次の局からは学習してそういう手指さなければいいだけ
      
      シェア
      
      親コメント
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        学習でどんなに精度が上がっても100%にはならんだろ。
        反則手判定ルーチン入れるだけで100%防げるのは自明なのに
        やらない理由ある？
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        ソフトウェアの出力として反則手を握り潰すなら意味があるが、不平等な評価をすると歪みそうで怖い
        エキスパートシステムならそれでいいかもしれないが、エキスパートシステムが役に立たない理由の一つでもあるし、発想自体が悪手

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

囲碁世界レーティング1位の柯潔九段とAlphaGoが対局、第1局はAlphaGoが勝利 More ログイン

「囲碁世界レーティング1位の柯潔九段とAlphaGoが対局、第1局はAlphaGoが勝利」記事へのコメント

「AlphaGo」って何だろう (スコア:0)

Re: (スコア:2)

Re: (スコア:0)

Re:「AlphaGo」って何だろう (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

スラド