アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
開いた括弧は必ず閉じる -- あるプログラマー
元論文の要約 (スコア:5, 参考になる)
実験ケ-ジ:
・「主役」の鳥と、それに対して反応をする「脇役」の鳥の二つ
の別々のケ-ジがある。ケ-ジは透明でお互いの行動は見える
・両者からは透明な餌箱も見えていて、その量が見える
・それぞれのケ-ジには C、D の二つの止まり木があって、
C は「協調」、D は「裏切り」に分類される。
トライアル:
・二匹の Blue Jay を別々のケ-ジの開始地点に止まらせる
・トライアル開始を示す光が点灯して、まず主役の鳥が
C/D どちらかの止まり木を選ぶ
・次に脇役の鳥が行
理解(Re:元論文の要約 (スコア:1)
#タレコミ文のまずい点も。
これは「繰り返し囚人のジレンマ」だけでなく「囚人のジレンマ」との両方にかかる実験。
・「実験対象(主役)」のトリは「C」にとまる確率を上げておく。
(結果/差を見やすくするためだと思う。問題はない範囲の前操作だろう)
・実験対象のトリの選択の結果を受けて「脇役」のトリが木にとまる。
実はこの脇役がどっちにとまるかは、実験やってるヒトが決められるような仕組み。
言ってみれば「ボット」というか「AI」というか、そんな感じ。
だから、このボットのアルゴリズムとして、
Re:理解(Re:元論文の要約 (スコア:0)
ここがまだちょっと微妙に違うかも。
もしも、「あと何回か先にもらえる餌1個」には全然価値がなくって、いま食べられなきゃヤダ!とゆー、非常に近視眼的な考え方しかしないバカ鳥の場合、今のターンでどれだけの餌を獲得できるかが重要であって、続くターンのことはどーでもいいので、「繰り返しありの囚人のジレンマ」の状況であっても、事実上は繰り返しなしと同じことになってしまって、裏切りをチョイスするのが最適ってことになってしまうよね。
なので獲得した餌をプールする、とゆー操作を加えてやる必要がある。たとえば5ターンごとに餌がもらえるとすると、いま最初のターンで獲得した餌も、続く第2~5ターンで獲得した餌も、どちらも5ターン先にしか食べられないので、そうすると5ターンの間にどれだけ多くの餌を獲得できるかが重要になって、今のターンでどれだけ獲得できるかは意味を持たなくなる。
とはいえ、単にどっかにプールされてるんだけど、それは見えないとゆー場合だと、「見えないけど報酬がたまってる」とゆーことは鳥には理解できないので(鳥にルールを説明してやったわけじゃないからね)、プールされてることが鳥にも分かるように透明な箱にプールしておくことにする、とゆーことかと。