アカウント名:
パスワード:
AlphaGO→囲碁のルールは実装していない。ひたすら勝てる手を効率よく捜すことに特化。強化学習も何が正しいか(つまり人間が作った勝てる棋譜)を初期学習させる必要がある。AI「囲碁?何の事か分かりませんが、勝つと言われる状態になる確率が一番高いのはこの手です」
AlphaGO Zero→囲碁のルールを実装している。いわば「教師なし学習」で、AIが目指すひとつの目標。自己学習で強化されるが、初期学習に人の手(棋譜)を使わないのが特徴。AI「俺の経験だと、この手が一番強い」
暫くスラドを見てなかったので、コメントを書く時期を逃してしまいました。
qem_moriokaさんの言葉が不十分で総叩きに合っていますが、基本的にはqem_moriokaさんのおっしゃっている事は納得できます。
Zeroではない方のAlphaGo (AlphaGo Lee) のポリシーネットワークは、与えられた局面から次に指す手を予測するように、人間の棋譜から教師あり学習をさせて作られています。
このネットワークの入力になる「与えられた局面」というのは、碁盤の黒石、白石の配置やルール上打てない点、次に敵に打たれると石が取られる点、等を別々に分解して作られる48枚の19x19の画像です。
そのID番号でその見識ならば、ある程度は後進の教育に携わっているはずと見受けられますが、その立場で、qem_moriokaさんのような、何も理解せずにそれっぽい組み立てを頭の中でしている人に、「そうとも言える」なんて解釈をしてあげるのが、qem_moriokaさんにとっても周りにとっても悪影響なのは理解しましょう。
結局、あなたの言っている解釈じゃ、ニューラルネットはルールを実装していない、モンテカルロ木探索にはルールが必要といっているだけですよね。それは、ニューラルネットやゲーム木探索を知っている人ならば、全員、今時なら高校生程度で、火を見るより明確に知っています。
僕も、嘘八百で展開した雑談は好きなんだけど、間違いや不理解を指摘されてもそのままにして展開しても、何も生まれないからつまんないんだよね。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
※ただしPHPを除く -- あるAdmin
AI「今度の俺は囲碁に詳しいから知ってるんだッ!!・・・」 (スコア:0)
AlphaGO
→囲碁のルールは実装していない。ひたすら勝てる手を効率よく捜すことに特化。
強化学習も何が正しいか(つまり人間が作った勝てる棋譜)を初期学習させる必要がある。
AI「囲碁?何の事か分かりませんが、勝つと言われる状態になる確率が一番高いのはこの手です」
AlphaGO Zero
→囲碁のルールを実装している。いわば「教師なし学習」で、AIが目指すひとつの目標。
自己学習で強化されるが、初期学習に人の手(棋譜)を使わないのが特徴。
AI「俺の経験だと、この手が一番強い」
Re: (スコア:1)
暫くスラドを見てなかったので、コメントを書く時期を逃してしまいました。
qem_moriokaさんの言葉が不十分で総叩きに合っていますが、基本的にはqem_moriokaさんのおっしゃっている事は納得できます。
Zeroではない方のAlphaGo (AlphaGo Lee) のポリシーネットワークは、与えられた局面から次に指す手を予測するように、
人間の棋譜から教師あり学習をさせて作られています。
このネットワークの入力になる「与えられた局面」というのは、碁盤の黒石、白石の配置やルール上打てない点、次に敵に打たれると石が取られる点、等を
別々に分解して作られる48枚の19x19の画像です。
Re:AI「今度の俺は囲碁に詳しいから知ってるんだッ!!・・・」 (スコア:0)
そのID番号でその見識ならば、ある程度は後進の教育に携わっているはずと見受けられますが、
その立場で、qem_moriokaさんのような、何も理解せずにそれっぽい組み立てを頭の中で
している人に、「そうとも言える」なんて解釈をしてあげるのが、
qem_moriokaさんにとっても周りにとっても悪影響なのは理解しましょう。
結局、あなたの言っている解釈じゃ、ニューラルネットはルールを実装していない、
モンテカルロ木探索にはルールが必要といっているだけですよね。
それは、ニューラルネットやゲーム木探索を知っている人ならば、全員、今時なら高校生程度で、
火を見るより明確に知っています。
僕も、嘘八百で展開した雑談は好きなんだけど、間違いや不理解を指摘されてもそのままにして展開しても、
何も生まれないからつまんないんだよね。