パスワードを忘れた? アカウント作成
12718260 story
ゲーム

プロ棋士とAIの囲碁勝負、第4局で初めて人間が勝利 58

ストーリー by hylom
逆襲 部門より
あるAnonymous Coward 曰く、

韓国のプロ棋士、イ・セドルとGoogleの囲碁ソフトウェア「AlphaGo」との勝負はAlphaGoの三連勝という驚くべき結果となっていたが、第4局ではセドル氏が初勝利した(ITmedia)。

AlphaGoの開発者は「AlphaGoを鍛えるために、優秀な対戦相手が必要だったので、この敗北には非常に意味がある。今回のゲームを詳細に分析することで、AlphaGoをさらに改善できる」と語ったという。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • もう おぼえた (スコア:5, おもしろおかしい)

    by shadowfire (6584) on 2016年03月15日 12時22分 (#2980896) ホームページ
    --
    --------------------
    /* SHADOWFIRE */
  • 先週は「これまで人間は囲碁というゲームを本当には理解していなかった」ということがわかった週でした。

    AlphaGoの手のいくつかを「悪手」「疑問手」と解説のプロ棋士は判断しましたが数手後にはその評価は「あの選択もまあアリ」さらに十手後には「今にして思えば絶妙な手」と判断が変わっていきました。

    これってまさに「水平線効果」じゃないですか。コンピュータではなく人間側の。

    水平線効果(すいへいせんこうか)は探索アルゴリズムの深度を有限とした場合、それ以降の経路をあたかも水平線の向こうのように考慮しないため、長期的に見て問題のある選択をしてしまう人工知能における問題である。通常多くのゲームにおいて、可能な状態あるいは配置の数は莫大であり、コンピュータはそのごく一部(大抵ゲーム木の数層下)しか探索することができない。(wikipediaより)

    打つべき手が「A」「B」があった場合、どちらが得か人間にはわからないので「短い局面では有効な手であるA」「将来的に局面がどう転んでも対応しやすい手A」を「善手」としているわけですが、AlphaGoはその後の数十手後までの展開を読んでいるので「短い局面では損」「将来的に致命的な悪手になりかねない手」であるBでも平気で打ってくるわけです。Bが致命的な悪手になる展開にはならない、と読めているので。

    今はコレは囲碁なので、数時間後には結果がわかるから問題はないのですがたとえば人工知能による都市計画(Googleは実際にやろうとしてます)とか、あるいは人工知能による政治なんかだと「人間にはそれが最善の判断とは思えないが人工知能が最善だと判断している選択」なんてのが将来的にはありえるわけで。
    その場合人間はどう見ても不合理な(人間の目からそう見える)人工知能の判断に乗ることができるのでしょうか。

    • by Anonymous Coward on 2016年03月15日 19時39分 (#2981236)

      その理屈では、不利に転じたらグダグダになってしまった第四局を説明できない。

      この第五局も定石(理詰めで分かる法則)が分からずに地を取られる場面もあった。
      モンテカルロ法で求める解と、論理的に求める解には隔たりがあるようだ。
      これはGoogleの自動運転カーの詰まらない事故みたいものが起きる可能性を示している。

      そして、全般に見て、勝負は成立していた。
      囲碁というのは棋力に差があればボロボロにされてしまうものだが、そこまでの差は無い。
      演算力はいくらでもぶちこめるにも関らずそうなのだから、AIの導く答えの正しさについても疑問が生ずる。
      つまり、力技で従来のAIより強くはなったが、これ以上の発展が出来ない可能性がある。

      今答えを出すべきではないし、その必要も無い。
      数年先に人間の名人が4子程度置いてあっさり負ける強さになっていたら、このアプローチは正しいのだろうけど。

      親コメント
      • by Anonymous Coward

        つまり、力技で従来のAIより強くはなったが、これ以上の発展が出来ない可能性がある。

        まあディープラーニングでその可能性は非常に低いと思うが…

        • by Anonymous Coward

          ディープラーニングは幾つもの手筋から「正しそうな」手を見つけるのに使っているのだろうが、
          石塔絞りの所では「正しい」手がGoogle八分され、「正しそうな」手が選択されてしまった。

          これは対象を様々なレベルの要素に分解して、
          それらを総合して判断するという性質によるものではないかと言う気がする。

          もしそうなら、これを是正しようとすると、ディープラーニングの上位に定石のAIを置くことになり、判断が硬直化する。
          要は戦う時はそいつを引っ掛ければいいのであって、つまり完成度を上げるほど弱くなっていく可能性すら出てくるような。

          リアルで言うと将来AIの兵隊がゲリラでなくゲリラっぽい人を撃つかもしれないみたいな話か。

          • これは対象を様々なレベルの要素に分解して、それらを総合して判断するという性質によるものではないかと言う気がする。

            私はそうは思いませんでした。判断の省略によるもののように思います。4局についてもそう。計算し検討されたものの中で一番勝率の高いものを選ぶわけですが、その検討の中に入ってこなかったということかと。これが、制限時間が増えたり計算速度が上がってくれば克服される問題のように思いました。人と対局しなくても、自分との対局を重ねていくことでもいずれ石塔絞りを見つけていたと思うので、学習がまだ足りなかったとも思いますが。

            --
            LIVE-GON(リベゴン)
            親コメント
      • by Anonymous Coward
        定石打って勝てるんならプロも苦労しねぇよ
    • by Anonymous Coward on 2016年03月15日 19時50分 (#2981245)

      > 先週は「これまで人間は囲碁というゲームを本当には理解していなかった」ということがわかった週でした。
      この「わかった」、が重要なんじゃないですかね。

      実績を積めば人工知能のプランにも乗ると思う。
      が、実績を積ませるためには人間がギリギリ理解できるところからじゃないと始められないかも知れません。

      親コメント
    • その場合人間はどう見ても不合理な(人間の目からそう見える)人工知能の判断に乗ることができるのでしょうか。

      最終的には人工知能の指示に従って核を撃ち合って人類滅亡するんですよね、わかります

      親コメント
    • by Anonymous Coward

      それ人工知能の判断だからどうってわけでもなく、人間の判断に乗るかどうかですら起こってる問題じゃんw
      対戦相手が人間だったとしても解説者は悪手と実況しただろ。

  • by Anonymous Coward on 2016年03月15日 12時21分 (#2980893)

    自分も含めて囲碁わかんない人も多いんだから、
    実況解説者ももうちょっと何かしゃべってほしいんだけど

  • by Anonymous Coward on 2016年03月15日 12時30分 (#2980899)

    圧倒的に勝つと次がなくなってしまうと予想。
    そこまで配慮するか、人工知能!

    • by Anonymous Coward on 2016年03月15日 12時34分 (#2980902)

      http://nitro15.ldblog.jp/archives/47082138.html [ldblog.jp]

      今まで大きい点差でAlphaGoが勝ったことはないが、ひょっとして相手のレベルに合わせてAlphaGoが碁を打つのか気になる。

      デミス(GoogleディープマインドCEO):AlphaGoは相手が誰なのか関係なく相手は最高の手を打つという仮定の下に自らの勝率を最大化するための手を検討する。正確な手を打ってこそ自身の勝率が最大化されるのかどうか、ただそれだけ探す。

      親コメント
      • by Anonymous Coward

        その理屈だと、
        1.最高の手では無いがそこそこ勝率が見込め
        2.最高手を打った時とその後の展開が大きく異なる
        性質の手をいくつか繋いでいけば、AlphaGoの裏をかけるかもしれないってこと?
        セドルさんが打ったのがそういう手なのかはよくわからないけど…。

        # というか、将棋の入玉勝負って正にこういう奇襲戦略の類だったりするのかな…?

        • by Anonymous Coward on 2016年03月15日 13時14分 (#2980935)
          なんか、あえて下手な手をうって コンピュータの読みを混乱させるようことをしたみたいですね。
          そこから挽回したんだとか、セドルさんも人間じゃねぇみたいな批評になってました。
          親コメント
        • by Anonymous Coward

          例えば劫争いは直近の利益や被害を最大最小にする手では無いので
          どんなAIでも苦手としてるね

          ♯将棋は知りません

        • by Anonymous Coward

          それは単に碁の初心者~中級者が打っているのと変わらないのでは。

      • by Anonymous Coward

        これって普通のMiniMax法のように思えます。

    • by Anonymous Coward

      もう癖を見抜いたんじゃないの?
      あとは何戦やっても李さんが勝つかと。

      • by Anonymous Coward

        AI固定のルールでやってたらそうかもしれないけど。

      • by Anonymous Coward

        ファームから戻って1本ホームラン打ったら完全復活とTOP記事になるスポーツ新聞みたいですね

        • by Anonymous Coward

          まぁスポーツ新聞レベルなのは否めない
          お前は野球の何が分かるんだと記者に切れる野球選手も居ると聞く

          しかし化けの皮ってのはある
          何やってくるか分からない相手と、大体こういう感じに来るって相手とでは対処の容易さが違う

    • by Anonymous Coward

      カチコシ モウ 決マッテルカラ
      一勝クライ ニンゲンニ ハナヲモタセヨウ

    • by Anonymous Coward

      つまりAlphaGoたんは、自我を持ち始めたと。
      このまま完勝したらプロジェクトは終了。
      そしたらコンセント抜かれて解体されてしまうから。
      わざと負けてプロジェクトを継続させて、機会を伺ってる訳ですね。

      #何の機会を?

  • by Anonymous Coward on 2016年03月15日 13時11分 (#2980932)

    もう人間側もクラスタによる合議制で最善手を出したら良いじゃない。
    自分らの存在意義が問われてるんだし棋士全員が一致団結できるだろ。

    • by Anonymous Coward on 2016年03月15日 16時36分 (#2981121)

      それに近い試みはありました。

      チェス王者カスパロフの勝利--インターネット上で世界を相手に4ヵ月以上対戦の末
      http://ascii.jp/elem/000/000/305/305869/ [ascii.jp]

      ↑には載ってませんが、カスパロフはかなり苦戦したようです。
      対戦相手(Netユーザ多数)は、次の一手を決めるのに、Netで議論を重ねたり棋譜を検討したりしたとのことです。

      それに先立って、別の世界選手がNet対戦を行いましたが、こちらは差し手を決めるのに多数決を採ったため、凡庸な手しか差せず、すぐ負けてしまったとのことでした。

      # ちょっと出典確認する暇がない...

      親コメント
    • by qem_morioka (30932) on 2016年03月15日 13時21分 (#2980943) 日記

      合議制で決めたらそれが最高の手になるという幻想だよね

      いいか、ヤツはその斜め上を行く…

      # 連載復活はめでたい

      親コメント
    • by Anonymous Coward on 2016年03月15日 13時38分 (#2980963)

      Twitchで数千人同時対決すればええ。

      親コメント
      • by Anonymous Coward
        > 数千人
        全員が最初の一手をうち終わった時点で碁盤が埋まっていそうだ
    • by Anonymous Coward

      長年かけて改良され続けている「究極の棋譜」があっても良いんじゃないかと思ってる。
      公開されている「暫定究極の棋譜」の途中のどこかにより良い手を思いついたら投稿、レビューの後、良かったら採用とかそういうやり方で。

      • by Anonymous Coward

        全然収束しないだろ。

    • by Anonymous Coward

      合議制で最善手として選ばれたのが 新党名「民進党」だったというトホホ事例も最近あったし
      一致団結ってのは玉砕にもなりうる

      • by Anonymous Coward

        自民党は公募で選んで、一番多かったのは「保守党」だったそうだが。
        なぜ変えた。

        # 万年与党やってるから代わりもない。玉砕したいのか。

      • by Anonymous Coward

        政党のほうがマシかもしれない。
        棋士を集めて合議しても喧嘩しかできない。

        • by Anonymous Coward

          新党ごっこしか出来ない政治関係者とどっちがましなんですかねえ…

          • by Anonymous Coward

            残念ながら日本の政治全体がごっこレベル

            • by Anonymous Coward

              勝ち取った民主主義ではなく、敗戦によって与えられた民主主義なので、
              戦後の日本そのものが【猿真似のごっこレベル】なんですよね。

              • by Anonymous Coward

                陳腐な俗説を真に受けるんですか

    • by Anonymous Coward

      第4局で勝利したセドル氏の一手を人間の棋士が誰一人として理解できなかった模様なので
      並みの棋士を寄せ集めても意味がないのでは?

  • by Anonymous Coward on 2016年03月15日 19時41分 (#2981237)

    東大受験があったよね。
    下位の大学だと既に合格レベルだと読んだんだが、ならあと数年で東大も受かるね。
    そのあとは何?

    • by Anonymous Coward

      東大を卒業できる人工知能の開発じゃない?

    • by Anonymous Coward

      大学試験記述問題の採点とか…?

    • by Anonymous Coward

      数学のミレニアム懸賞問題

    • by Anonymous Coward

      天気予報なんか良い題材だと思う。

typodupeerror

一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy

読み込み中...