アカウント名:
パスワード:
完璧に打つAI相手の勝負では、人間は絶対に勝てないってことか。
どんなに頑張っても引き分けにしかならないですね
映画ウォー・ゲームでは最後三目並べに勝者がいないことを悟ったコンピューターがチェスをやろうと持ち掛けるが、チェス、将棋、囲碁だとどうなるのだろうか?一応ルール上は全部引き分けのパターンがあるみたいですが
人間が最善ではない手も含めて打った時にそれでも勝てない証明はされてないのでは?
>人間が最善ではない手も含めて打った時にそれでも勝てない証明はされてないのでは?
両者最善手を打つ場合(弱解決)、片方だけが最善手を打つ場合、共に考慮しているようです(両者が最善手を打たない場合は考慮されていない(強解決))
(今回の論文の概略) https://gigazine.net/news/20231106-othello-is-solved/ [gigazine.net] https://yaneuraou.yaneu.com/2023/11/06/the-surefire-winning-strategy-f... [yaneu.com]
(今回の論文の解説) https://qiita.com/Nyanyan_Cube/items/a373da3157cdd117afcc [qiita.com]
(弱解決について) https://www.jstage.jst.go.jp/article/sugaku/65/1/65_0651093/_pdf/-char/j [jst.go.jp]
1. 最初の10手をまず既存のオセロソフト(を改造したもの)の評価関数で見積もる。2. 残り50手を完全読みする(実際にはさらに14手-36手に分割してこの手順を再帰的に適用するようなことをしてるけど省略)3. 完全読みした評価値と1.の評価値が一致していたので(弱)解決4. もし一致していなかったら、完全読みした評価値をメモ化して改善された評価関数で1.からの手順を繰り返す
最初から完全読みするのと何が違うのかと言うと、1.で評価しなかった局面(99.9%)については2.の完全読みをしなくて済むので計算量が大幅に節約できる。評価しなかった局面の評価値が違っていても結果に影響がないことはα-β法の原理により保証されている。
トータルの計算量は単純に初手からnull window searchとかpn searchとかした方が少ないんじゃないかなメモリが大量に必要になるとか並列処理がやりにくいとかで、なんかゴチャゴチャ工夫して現実的な時間で結論まで到達できるようになったと
論文の手法は50マス空きの局面や36マス空きの局面を並列で探索できるのが強みって書いてた
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
普通のやつらの下を行け -- バッドノウハウ専門家
ということは (スコア:0)
完璧に打つAI相手の勝負では、人間は絶対に勝てないってことか。
Re: (スコア:0)
どんなに頑張っても引き分けにしかならないですね
映画ウォー・ゲームでは最後三目並べに勝者がいないことを悟ったコンピューターがチェスをやろうと持ち掛けるが、チェス、将棋、囲碁だとどうなるのだろうか?
一応ルール上は全部引き分けのパターンがあるみたいですが
Re: (スコア:0)
人間が最善ではない手も含めて打った時にそれでも勝てない証明はされてないのでは?
Re: (スコア:3, 興味深い)
>人間が最善ではない手も含めて打った時にそれでも勝てない証明はされてないのでは?
両者最善手を打つ場合(弱解決)、片方だけが最善手を打つ場合、共に考慮しているようです
(両者が最善手を打たない場合は考慮されていない(強解決))
(今回の論文の概略)
https://gigazine.net/news/20231106-othello-is-solved/ [gigazine.net]
https://yaneuraou.yaneu.com/2023/11/06/the-surefire-winning-strategy-f... [yaneu.com]
(今回の論文の解説)
https://qiita.com/Nyanyan_Cube/items/a373da3157cdd117afcc [qiita.com]
(弱解決について)
https://www.jstage.jst.go.jp/article/sugaku/65/1/65_0651093/_pdf/-char/j [jst.go.jp]
Re: (スコア:2, 参考になる)
1. 最初の10手をまず既存のオセロソフト(を改造したもの)の評価関数で見積もる。
2. 残り50手を完全読みする(実際にはさらに14手-36手に分割してこの手順を再帰的に適用するようなことをしてるけど省略)
3. 完全読みした評価値と1.の評価値が一致していたので(弱)解決
4. もし一致していなかったら、完全読みした評価値をメモ化して改善された評価関数で1.からの手順を繰り返す
最初から完全読みするのと何が違うのかと言うと、1.で評価しなかった局面(99.9%)については2.の完全読みをしなくて済むので計算量が大幅に節約できる。評価しなかった局面の評価値が違っていても結果に影響がないことはα-β法の原理により保証されている。
Re:ということは (スコア:0)
トータルの計算量は単純に初手からnull window searchとかpn searchとかした方が少ないんじゃないかな
メモリが大量に必要になるとか並列処理がやりにくいとかで、なんかゴチャゴチャ工夫して現実的な時間で結論まで到達できるようになったと
Re: (スコア:0)
論文の手法は50マス空きの局面や36マス空きの局面を並列で探索できるのが強みって書いてた