アカウント名:
パスワード:
ポイントはそこじゃないみたいです
最初は「人間の交渉を模倣する」ようにさせる。次に、「交渉結果のスコアが高くなるように」させてみる。
しかし、ここで野放しにしておくと、(当然予想されることとして)人間の自然な言葉のやりとり(を模倣すること)からは逸脱してしまう。
そこで、逸脱しないように修正を加えつつ、高いスコアを出すにはどうしたらよいか、というような話みたい。
「交渉」とは具体的にどのようなことをするかというと、「帽子」や「本」など、それぞれ特定の「価値」を与えられたアイテムの集合を、「こちら側からは見えない別の価値体系」を持った相手と分け合う、ということです。
実際のやりとりは、「帽子をあげますから、本をください」といったようなものです。
むしろ興味深い点は、この過程で、ボットが相手を騙そうとする、つまり、自分にとってあまり価値の高くないアイテムを「欲しがっているようなふりをする」行動が見られたということです。
人間に分かる手筋だけに制限された AlphaGo みたいなもんやな
つくづくAlphaGoの開発者がそんな馬鹿じゃなくてよかった
それは本件とは全然違うだろ。AlphaGoが唯一話せる言語は打ち手のことであり、それは人間もちゃんと理解出来る形になっている。その打ち手に至った「思考プロセス」を理解出来ないというのはまた別の話。
むしろ興味深い点は、この過程で、ボットが相手を騙そうとする
人間の模倣からスタートしたのが原因でないとすれば、交渉というスキームそのものに欺騙を含んでいるということだろうか。確かに興味深い。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
海軍に入るくらいなら海賊になった方がいい -- Steven Paul Jobs
論文斜めに読んできたけど (スコア:5, 参考になる)
ポイントはそこじゃないみたいです
最初は「人間の交渉を模倣する」ようにさせる。
次に、「交渉結果のスコアが高くなるように」させてみる。
しかし、ここで野放しにしておくと、(当然予想されることとして)人間の自然な言葉のやりとり(を模倣すること)からは逸脱してしまう。
そこで、逸脱しないように修正を加えつつ、高いスコアを出すにはどうしたらよいか、というような話みたい。
「交渉」とは具体的にどのようなことをするかというと、「帽子」や「本」など、それぞれ特定の「価値」を与えられたアイテムの集合を、「こちら側からは見えない別の価値体系」を持った相手と分け合う、ということです。
実際のやりとりは、「帽子をあげますから、本をください」といったようなものです。
むしろ興味深い点は、この過程で、ボットが相手を騙そうとする、つまり、自分にとってあまり価値の高くないアイテムを「欲しがっているようなふりをする」行動が見られたということです。
Re:論文斜めに読んできたけど (スコア:1)
人間に分かる手筋だけに制限された AlphaGo みたいなもんやな
Re: (スコア:0)
つくづくAlphaGoの開発者がそんな馬鹿じゃなくてよかった
Re: (スコア:0)
それは本件とは全然違うだろ。
AlphaGoが唯一話せる言語は打ち手のことであり、それは人間もちゃんと理解出来る形になっている。
その打ち手に至った「思考プロセス」を理解出来ないというのはまた別の話。
Re: (スコア:0)
むしろ興味深い点は、この過程で、ボットが相手を騙そうとする
人間の模倣からスタートしたのが原因でないとすれば、交渉というスキームそのものに欺騙を含んでいるということだろうか。確かに興味深い。