パスワードを忘れた? アカウント作成
13300897 story
ゲーム

DeepMindがAlphaGo同士の対局の棋譜を公開 81

ストーリー by hylom
違う摂理で動くもの 部門より

Google傘下のDeepMindが開発する囲碁ソフトウェア「AlphaGo」同士が対局した棋譜が公開された朝日新聞窓の杜)。

公開された棋譜では、人間では思い付かなかったような手が数多く含まれているとのこと。白石勇一六段の解説では、「言葉が出ません」「信じられないような打ち方」「完全に意味不明な進行が頻出」「人間の碁の延長線上には無い碁」などと評されている。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by NOBAX (21937) on 2017年06月05日 16時36分 (#3222509)
    AlphaGoは3,000万局 [nicovideo.jp]の自己対局をこなしたそうです。
    人間が1日10局検討したとして、1年で約3,000局ですから、3,000万局を調べるためには1万年かかることになります。
    つまり、AlphaGoは1万年後の未来から来た棋士であり、見たことのない手を打つのも、
    現在の人間が敵わないのも納得できるところです。
    • AlphaGoは3,000万局 [nicovideo.jp]の自己対局をこなしたそうです。

      人間が1日10局検討したとして、1年で約3,000局ですから、3,000万局を調べるためには1万年かかることになります。

      なーに、棋士を1万人用意すれば1年で終わるよ(まてまちなさい

      親コメント
      • なーに、棋士を1万人用意すれば1年で終わるよ(まてまちなさい

        まさに、そういうことでは無いかと。
        一人が新しい戦法を発明したら、それを皆が真似することで、
        その後の、切磋琢磨による昇華がハイペースで進むという、リアル遺伝的アルゴリズム。

        親コメント
        • 自己レスですが、
          人間はこのリアル遺伝的アルゴリズムにより、
          やみくもに10000局指すよりは、群としては、効率的な自己学習が行えるのではないか、
          数の力ならば人間も侮れないのではないか?
          ということを言いたかったのですが、どうも話がずれていたようで、お恥ずかしい今日この頃。

          親コメント
          • AlphaGOのモンテカルロ木探索って確かに闇雲だけど
            あるパラメーターにしたがって闇雲してるから(えー

            数の力でいえばコンピューターには勝てない。だから
            それを越えるためには理(ことわり)の力が必要。

            無秩序から秩序を見いだすのは人の力でしかなしえない

            # …い、今のところは(えー

            親コメント
        • 人間では、機械に比べてバイアスがあるから、10000人x1年ではまるで追いつけないのでは?
          検索範囲が狭すぎるというか。人間同士がランダムで相関の無い手を打つのはかなり難しいかも。

          親コメント
        • by Anonymous Coward

          ナルトの影分身修行は理に適っていたんだなぁ

        • by Anonymous Coward

          タチコマの並列化を地でいく感じかぁ

        • by Anonymous Coward

          1万人で対抗するためには、情報のロスが無く完全な形で全員に共有される必要があるのです。

          人と人とが正しくわかり合う、まさか究極の囲碁棋士とはニュータイプのことかっ!

      • by Anonymous Coward

        なーに、棋士を1万人用意すれば1年で終わるよ(まてまちなさい

        ここにも人月の神話が!

      • by Anonymous Coward

        対局だから二万人必要なのでは。

        • by Anonymous Coward

          AlphaGoは自己対局を3,000万局行ったので、それとの比較ならば一万人で良いのでは?

    • by Anonymous Coward

      >人間が1日10局検討したとして、1年で約3,000局ですから、3,000万局を調べるためには1万年かかることになります。

      10 x 365 = 3650
      30000000 / 3650 = 8219.17808219

    • by Anonymous Coward

      ヒカルの碁って平安時代の霊がとりつくんだっけ。実際平安時代の棋譜見たら現代じゃ考えられないほど原始的なものなのかな?1000年かけて人類ってどんだけ進化したんだろう?

  • 打てる人が「ストーリー性とか流れがないからつまんない」と言ってた
    雲上の遥か上のレベルになるとそうなのかもしれないと思った。

    • 自己対潜いや対戦の棋譜じゃないが前回の対戦のときの棋譜を見て
      AlphaGOの打ち筋って今までこれはやっちゃいけないと言われてきたものを
      やっても勝てるということをAIが示してくれた、俺たちはもっと自由に
      囲碁を打てるんだ (゚∀゚) !ヒャッハー って喜んでいた若い棋士達がいたってのは
      やっぱ素晴らしいと思うんですよ

      ストーリー性とか流れは勝つための評価基準として重宝されていたわけで
      そこから解放されたというのは実は大きいんじゃないかなあ。

      AlphaGOはこれで引退だけど、そこからストーリー性を汲んだ打ち筋まで
      作り出すようなAIがでてくるんじゃないかな。
      今回のモンテカルロ木探索は単純に勝利を目指した一つの方法(数十年前から
      研究されていたとはいえ実用化までこぎつけたのは最近)でしかないが、
      ストーリー性という評価を組みこむことができれば、また面白くなるんじゃないかな。

      親コメント
    • by Anonymous Coward

      得意な戦法とかではなく局面毎に勝利に向かって打つだけですからね。
      人間同士の対戦は相性とか次は負けないという気持ちとか不安定な要素があるからドラマを感じるのだと思います。
      まあそんなドラマ性なんて思い込みと言われればそれまでですが…

  • by Anonymous Coward on 2017年06月05日 22時32分 (#3222733)

    絶句するくらいなんだから、九段なんかじゃ相手にならんわな

  • by Anonymous Coward on 2017年06月05日 16時19分 (#3222495)

    相手の思考(試行)負荷を最大値にすることに重きを置いているとかなのかな
    機械学習系特有の負荷のかけ方で思考的に意味不明みたいな

  • by Anonymous Coward on 2017年06月05日 16時31分 (#3222503)

    αGOが世界一強いというのは実際そうなんだろうが
    勝因として以前のαGOとは違う打ち方をしてきたというのがある

    例えば藤井システム考案直後の藤井九段(九段か忘れたけど)みたいな強さという印象は拭えない

    • そりゃどうやって勝利手を検索するか、というのがAlphaGoの場合の強さになる。
      前回負けたときも探索から漏れた手が実は勝利手だったというのが判明したので
      探索のパラメータを変えた、というのがあったけど、今回は計算量(CPUパワー)も
      減らして来てるから、相当最適化が進んだんだなという感じ。

      要は勝ち方がわかってきたからそんなにCPUパワーかけなくても良くなった(゚∀゚)!
      つーことかね _(:3 」∠)_

      親コメント
      • by Anonymous Coward
        完全に学習が終わった後では19x19ピクセルの画像を入力して座標値を1つ返すだけのニューラルネットだからね
        その辺のスマホでも数秒で終わる計算だろう
        • by Anonymous Coward

          とった石の数考慮しないんですか?

          • とった石の数考慮しないんですか?

            よく碁のルールを分かってないかもしれませんが
            する必要ありますか?

            # 取った石の数は勝敗に影響しないんですよね
            # 僅差だと影響するルールがあるとか?

            親コメント
            • とった石はあとで埋めるですよ
              親コメント
              • by Anonymous Coward on 2017年06月05日 22時28分 (#3222726)

                それは日本ルールだね。
                日本ルールは例外と判例が山ほどあって、ルールとしては美しくないし、ゲームの目的も「盤上により多くの石をおく権利を得た方の勝ち、取られた石は権利放棄と同じだから
                自分の権利地に埋めもどす」という初心者にはとってもわかりにくいもの。
                中国ルールと台湾ルールは例外がほとんどなく、ゲームの目的も、「盤上により多く石を置けた方の勝ち」という至極簡単なもの。
                権利云々は関係ないから、「取らず三目」だら「隅の曲がり四目」だら、グダグダ言わずに、全て盤上で決着をつけることができる(ことができる)。
                中国ルールと台湾ルールの違いは、中国ルールが、一手パスが損にならない局面があって、それが戦略上有利になるから、
                その場面で一手パスせずに、終局宣言すればボーナスがもらえるのが台湾ルール。(もちろん、ボーナス目当てに考え違いで早すぎる終局宣言すると、
                ボーナス以上の損になるわけで、そこまできちんと考えないといけない)

                まあ、たいていの場合、結果は同じになる。

                親コメント
              • 取らず三目は?

                と思ったらいつの間にかそのままだとセキ
                →仕方ないんで白が取って二目にルール変わってた
                #いつの間にかって28年も前だけど。まだコミ5目半の頃

                --
                ともあれ、ヤードポンド法は滅ぶべきであると考える次第である
                親コメント
          • by Anonymous Coward

            過去30手考慮するとして(None, 19, 19, 30)…

    • by Anonymous Coward

      最終決戦用を前にして、自分の手の内を晒す棋士なんているの?

      普通は過去の棋譜が公開されていて、今年もそれと似たような打ち方をするだろうと予測するだけ。
      その予測とは異なることもある。今まで見せたことのないテクニックを事前に公開する義務は、
      どの棋士にも課せられてないと思うんだけどね。

      それはイセドルや柯潔側だって同じ事。人間は成長するし、去年と同じ打ち方をする義務もない。
      今年の打ち方をAlphaGo/DeepMind側に教えて、それを元にAlphaGoに学習させたわけじゃないでしょう。

      • by Anonymous Coward

        純粋な囲碁の勝負が目的ならそれで良いと思うけれど
        人工知能の研究が目的なら手の打ち晒しても良かったと思うよ。
        これでAIは囲碁に関して人間を超えたと勝ち逃げされてもなんかなぁ。

        • ちから is パワーに任せてランダムに選んだ手から
          勝利をもぎ取る、そんなエレガントでもなんでもない方法は認めない

          人間なら人間らしく打ってAlphaGOに勝てる方法があるはず…
          …のかな _(:3 」∠)_

          # そしてそれを学習されたらまた最初からだけどorz

          親コメント
    • by Anonymous Coward

      >勝因として以前のαGOとは違う打ち方をしてきたというのがある

      いや、今までの棋譜は片っ端から覚えた後に自己学習してるから、そんなレベルの話じゃあない。

  • by Anonymous Coward on 2017年06月05日 18時31分 (#3222584)

    対局中に碁石を使って自分が望むドットを作り上げるまでに成長とか期待。

  • by Anonymous Coward on 2017年06月05日 19時55分 (#3222628)

    人間が打ちそうな手に対してはほとんど学習データを蓄積できないはずなのにそれでも勝っちゃうんだ。

    将棋だと「人間様の過去の棋譜や定跡を猿真似している以上真にコンピューターが人間に勝ったとはいえない」とかなんとか見苦しい言い訳しているみたいだけど、とっくにその段階は超えてるのね。

    • >人間が打ちそうな手に対してはほとんど学習データを蓄積できないはずなのにそれでも勝っちゃうんだ。

      学習データの中に、人間同士の過去対局棋譜で手に入るすべてがおそらく含まれている、からかもしれません。
      しかし、それにしても、機械同士では意味不明な棋譜でも、それに比べれば対名人では少しは理解できる棋譜になる、ということらしいから、面白いですね。対人間では手加減しているわけでもないないでしょうし。ストーリーは負けた人間側が作っているのかも。

      親コメント
    • by Anonymous Coward

      誰と戦ってんの?

    • by Anonymous Coward

      実は序盤なんてどうでもいいゲームでした、というオチだったりして

  • by Anonymous Coward on 2017年06月05日 21時36分 (#3222694)

    毎回最善の手で打ってたら、毎回同じ流れにはならないのかな・・・

typodupeerror

皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー

読み込み中...