アカウント名:
パスワード:
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日本発のオープンソースソフトウェアは42件 -- ある官僚
元論文の要約 (スコア:5, 参考になる)
実験ケ-ジ:
・「主役」の鳥と、それに対して反応をする「脇役」の鳥の二つ
の別々のケ-ジがある。ケ-ジは透明でお互いの行動は見える
・両者からは透明な餌箱も見えていて、その量が見える
・それぞれのケ-ジには C、D の二つの止まり木があって、
C は「協調」、D は「裏切り」に分類される。
トライアル:
・二匹の Blue Jay を別々のケ-ジの開始地点に止まらせる
・トライアル開始を示す光が点灯して、まず主役の鳥が
C/D どちらかの止まり木を選ぶ
・次に脇役の鳥が行
Re:元論文の要約 (スコア:1, 参考になる)
というのは正しいと思うけど、この変数を変化させるという操作の意味は違うかと。
報酬が実際にもらえるのが先延ばしになるほど、報酬としての価値が下がる、たとえば「今もらえる1粒の餌は、1ターン後にもらえる2粒の餌と同等の価値がある」というような価値判断 (discount) を鳥が持っていると仮定すると、毎ターンごとにすぐに餌がもらえる状況では「協調した方が裏切るよりも本当は(=長期的には)得」という状況が実際には成立していない可能性がある。
なので、数ターン後にならないと餌がもらえないようにする&透明な箱にプールされて餌がたまってることは分かるようにしておくと、discountの効果がキャンセルされて、実際に鳥にとって「協調したほうが裏切るよりも本当は得」という状況が作り出せるのではないか?
でもって、実験したらそのとおりの結果になった、ということだと思うです。