アカウント名:
パスワード:
仮に、相手がある局面において決まったの手を打つと仮定すれば
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
あと、僕は馬鹿なことをするのは嫌いですよ (わざとやるとき以外は)。-- Larry Wall
脳のシミュレートができなくても (スコア:2, 参考になる)
計算機でもDPマッチング [google.co.jp]により「直観」を実現することは可能です。
Re:脳のシミュレートができなくても (スコア:2, 興味深い)
あきらかにチェスや将棋にはそういった構造がありませんし、おそらく P で解ける問題でもないでしょう。したがって DP
Re:脳のシミュレートができなくても (スコア:2, 興味深い)
チェスとかにDPを適用する場合の難点は、
・相手がいる。(マルチエージェント)
・状態空間が膨大で計算量が大きい。
という事だと思います。
仮に、相手がある局面において決まったの手を打つと仮定すれば
計算量は別にして、その仮定の元で最適解が得られます。
MDP(Markov Decision Problem)だから、 Bellman 方程式を解けばよいだけです。
本当は、相手によって最適な戦略は変わってしまいますが。
"決まった手"と言うのは、Aを0.5、Bを0.3、Cを0.2の割合で
選択するといった確率的なものでも構いません。
ただし、その確率が変わる(これを相手が学習する言う)場合には、
MDPではなくなってしまいます。
実際には相手が居るので、例えば MIN-MAX法 [kyoto-u.ac.jp]とか
を
Re:脳のシミュレートができなくても (スコア:0)
Re:脳のシミュレートができなくても (スコア:1)
> 現状では求めることさえできない訳ですよね。
そうですね。これでは状態遷移確率が求められませんので、
>> MDP(Markov Decision Problem)だから、 Bellman 方程式を解けばよいだけです。
は明らかに間違いです。m(_ _)m
状態遷移確率が固定であっても、不明だとDPは解けませんね。
#強化学習なら可能ですが。