アカウント名:
パスワード:
>「自分からは裏切らないが、相手が裏切った回数だけ裏切り返す」 >というアルゴリズムが最強だったそうです。
「しっぺ返し」ですね。そのもっともシンプルなのを4行法則、と呼んでいたと思います。(複数のソース
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy
ゲーム理論ですな (スコア:4, 参考になる)
「数学的にモラルを守ることの優れている点を証明できるか」というのを研究する奴でしたよね。
# 星野力氏の「ロボットにつけるクスリ」で読みました。
1・普通に協調すればそこそこの良い結果が得られるが、
2・「相手が正直に対応する」とわかっている場合には、ざっくり裏切ればもっと良い結果が得られる。
3・また、正直に協調して相手に裏切られるとダメージがでかい。
4・そして、両方で裏切った場合は裏切られるよりはマシだが、協調した時よりもずっと少ないスコアしか稼げない。
という前提条件があって、この中でどう対戦するのが最も有利かを競うものです。
Re:ゲーム理論ですな (スコア:1)
>「自分からは裏切らないが、相手が裏切った回数だけ裏切り返す」
>というアルゴリズムが最強だったそうです。
「しっぺ返し」ですね。そのもっともシンプルなのを4行法則、と呼んでいたと思います。(複数のソース
えむり
Re:ゲーム理論ですな (スコア:4, 興味深い)
今度の手 = 相手の1つ前の手
という簡単なアルゴリズムで実現できました。
これは確かに「正確な通信路」の時は最強でした。
ここで「たまに通信路でノイズが発生する(嘘の手が教えられる)」現象が発生すると事態は一変します。
「しっぺ返し」が正確にしっぺ返しすることができなくなるので、この機構に破綻が生じます。
たとえばTfT同士で対戦時、ノイズが乗るとその後次のノイズまで裏切り合いになり得点効率ががくんと落ちます。
この状況で繰り返し囚人
Re:ゲーム理論ですな (スコア:1)
サンタフェ研究所での複雑系の研究華やかなりし頃(つまり昔なので詳細は忘れたと言うこと)、出版されたArtificial Life (Proceedings of International Conference of AL)のどれかに、GAで生成したプレイヤーではESS(evolutional Stable Strategyだったけ?)は出
Re:ゲーム理論ですな (スコア:1)
最強戦略は確かGAで生成されたものではなく、複雑な統計学的手法を用いたアルゴリズムであった記憶があります。
# いやー、滅茶苦茶懐かしい.