最強戦略ってありますか?
サンタフェ研究所での複雑系の研究華やかなりし頃(つまり昔なので詳細は忘れたと言うこと)、出版されたArtificial Life (Proceedings of International Conference of AL)のどれかに、GAで生成したプレイヤーではESS(evolutional Stable Strategyだったけ?)は出現しなかった。chaoticな振る舞いを示した、というような報告があったと思うのですが。設定が違ったかな? 違ってたら(_ _)
# いやー、懐かしい。
ゲーム理論ですな (スコア:4, 参考になる)
「数学的にモラルを守ることの優れている点を証明できるか」というのを研究する奴でしたよね。
# 星野力氏の「ロボットにつけるクスリ」で読みました。
1・普通に協調すればそこそこの良い結果が得られるが、
2・「相手が正直に対応する」とわかっている場合には、ざっくり裏切ればもっと良い結果が得られる。
3・また、正直に協調して相手に裏切られるとダメージがでかい。
4・そして、両方で裏切った場合は裏切られるよりはマシだが、協調した時よりもずっと少ないスコアしか稼げない。
という前提条件があって、この中でどう対戦するのが最も有利かを競うものです。
常に協調し続けるなら、双方が繁栄しますが、
利己的な立場から見てもそれが最も有利な戦略なのかどうか。
もしかして、うまく裏切って相手よりも抜きん出る方法があるのかどうか。
このあたりが研究の焦点だったと思います。
相手の出方がまったくわからない『一発勝負』の場合は、
『裏切ったほうが有利』なんですが、これを繰り返すというところに、
この研究のミソがあるわけで…。
P.S
しかし、相手より優位に立つことに対する優越感を
どう表現したのかが気になります(^^;;
研究者が作成した思考するソフトウェアを使った対戦では、
TfTというのだったか、
「自分からは裏切らないが、相手が裏切った回数だけ裏切り返す」
というアルゴリズムが最強だったそうです。
Re:ゲーム理論ですな (スコア:1)
>「自分からは裏切らないが、相手が裏切った回数だけ裏切り返す」
>というアルゴリズムが最強だったそうです。
「しっぺ返し」ですね。そのもっともシンプルなのを4行法則、と呼んでいたと思います。(複数のソースで見ましたが、一番覚えているのは教科書よりもサイバーナイトの…)
時節柄、この話を見るとどうにも重い考えに及んでしまいます。
#アオカケスかわいい…
えむり
Re:ゲーム理論ですな (スコア:4, 興味深い)
今度の手 = 相手の1つ前の手
という簡単なアルゴリズムで実現できました。
これは確かに「正確な通信路」の時は最強でした。
ここで「たまに通信路でノイズが発生する(嘘の手が教えられる)」現象が発生すると事態は一変します。
「しっぺ返し」が正確にしっぺ返しすることができなくなるので、この機構に破綻が生じます。
たとえばTfT同士で対戦時、ノイズが乗るとその後次のノイズまで裏切り合いになり得点効率ががくんと落ちます。
この状況で繰り返し囚人のジレンマゲームを行うと、簡単には最強のアルゴリズムが組めなくなったことまでは覚えています。
最強のアルゴリズムは相当複雑なものだと聞いた覚えがあります。
(以下オフトピック:TfTの最も簡単なソース)
/* true: Cooperate
false: Defact */
bool TfT(bool priv){
return priv;
}
Re:ゲーム理論ですな (スコア:2, 参考になる)
関連する話題を読んでたところでした。
tit-for-tat より強い戦略として
Pavlof 戦略というのが 1993年に Nowak らによって論文が
書かれました。これは、しっぺ返しの一部を変えて
前回の自分:前回の相手
裏切り:協調 ⇒ 裏切り
裏切り:裏切り ⇒ 協調
という部分が違います。裏切り合った後に自分から
仲直りするわけですね。
Pavlof 戦略はそのように呼ばれる前から知られていて
simpleton(おばかさん)と呼ばれていたそうです。
でもシミュレーションしてみると全然 simpleton じゃなかったってわけ。
それでもうこれ以上の戦略はないだろうと思われていたんですが、
1996にDalahaye らが Gradural 戦略というさらに強力なものを
発見しました。それは、
最初は協調
2回目以降は、相手が協調したら協調
裏切った場合それがn回目ならn回裏切り返す
そのあと2回協調する
というもので、だんだん報復を重くしていき、
そのあとちょっと冷却期間をおくというものです。
# こんな感じなので、実はもっと強いやつがまた発見されたりして...
# みんな考えてみたら??
Re:ゲーム理論ですな (スコア:1)
> そのあとちょっと冷却期間をおくというものです。
生々しくて怖いですな。
Re:ゲーム理論ですな (スコア:1)
サンタフェ研究所での複雑系の研究華やかなりし頃(つまり昔なので詳細は忘れたと言うこと)、出版されたArtificial Life (Proceedings of International Conference of AL)のどれかに、GAで生成したプレイヤーではESS(evolutional Stable Strategyだったけ?)は出現しなかった。chaoticな振る舞いを示した、というような報告があったと思うのですが。設定が違ったかな? 違ってたら(_ _)
# いやー、懐かしい。
Re:ゲーム理論ですな (スコア:1)
最強戦略は確かGAで生成されたものではなく、複雑な統計学的手法を用いたアルゴリズムであった記憶があります。
# いやー、滅茶苦茶懐かしい.
Re:ゲーム理論ですな (スコア:0)
ほぼ終了しているスレッドですが。
Re:ゲーム理論ですな (スコア:1)
つまり某chでは自分から煽らず、煽られたら煽られた回数だけ
煽り返す、ということですね。
Re:ゲーム理論ですな (スコア:1, おもしろおかしい)
Re:ゲーム理論ですな (スコア:1)
というか、それが有効であることを、生物は長い歴史の間に遺伝子に記憶しているんで、
「調教」という行為が成立し得るように生物は出来ている…のかなと…
</単なる妄想>