アカウント名:
パスワード:
十分な教師データが集まるまでは(出処はどこであれ)人間がデータ処理した結果が必要なのではないでしょうか。
AlphaZeroは自己対戦による学習だけで旧Alpha Goに圧勝して、人間の棋譜などいらない(むしろ邪魔)と証明しちゃったんだよね
「勝ち負けのルール」という教師情報があるからな。
囲碁の場合はこの手のゲームの中では複雑な方だが、各手ごとに取れる手は有限でたかだか数十個だし、途中経過が違っても結果への影響が少ないことも多い。
二足歩行ロボットなんかじゃ、ランダムに関節動かしてればのたうち回るだけで、赤ん坊のように立ってよちよち歩きできるようになるまでどんだけかかるかわからんぞ。ほっとくと、匍匐前進に最適化されてしまうかもしれん。
うん、何度もそうなってしまった教育の結果を見たが、かえって賢いんでない?と思ったもちろん実物ロボでなくシミュレーション上だし、シミュレータの実物を見たわけじゃなくTV番組でだが
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
最初のバージョンは常に打ち捨てられる。
教師データを集めるために人力は必要 (スコア:0)
十分な教師データが集まるまでは(出処はどこであれ)人間がデータ処理した結果が必要なのではないでしょうか。
Re: (スコア:0)
AlphaZeroは自己対戦による学習だけで旧Alpha Goに圧勝して、人間の棋譜などいらない(むしろ邪魔)と証明しちゃったんだよね
Re:教師データを集めるために人力は必要 (スコア:0)
「勝ち負けのルール」という教師情報があるからな。
囲碁の場合はこの手のゲームの中では複雑な方だが、各手ごとに取れる手は有限でたかだか数十個だし、
途中経過が違っても結果への影響が少ないことも多い。
二足歩行ロボットなんかじゃ、ランダムに関節動かしてればのたうち回るだけで、
赤ん坊のように立ってよちよち歩きできるようになるまでどんだけかかるかわからんぞ。
ほっとくと、匍匐前進に最適化されてしまうかもしれん。
Re: (スコア:0)
うん、何度もそうなってしまった教育の結果を見たが、かえって賢いんでない?と思った
もちろん実物ロボでなくシミュレーション上だし、シミュレータの実物を見たわけじゃなくTV番組でだが