
プロ棋士とAIの囲碁勝負、第4局で初めて人間が勝利 58
ストーリー by hylom
逆襲 部門より
逆襲 部門より
あるAnonymous Coward 曰く、
韓国のプロ棋士、イ・セドルとGoogleの囲碁ソフトウェア「AlphaGo」との勝負はAlphaGoの三連勝という驚くべき結果となっていたが、第4局ではセドル氏が初勝利した(ITmedia)。
AlphaGoの開発者は「AlphaGoを鍛えるために、優秀な対戦相手が必要だったので、この敗北には非常に意味がある。今回のゲームを詳細に分析することで、AlphaGoをさらに改善できる」と語ったという。
もう おぼえた (スコア:5, おもしろおかしい)
「しかし それも もう 憶えた」 [twitter.com]
--------------------
/* SHADOWFIRE */
Re:もう おぼえた (スコア:1)
油断させておいて最終戦では黒一色にされるんだ
#まずは囲碁のルールを覚えろ
Re: (スコア:0)
ちぃ、覚えた
Re: (スコア:0)
"We will add your biological and technological distinctiveness to our own. Your culture will adapt to service us." [youtube.com]じゃね?
(「お前達の生物的特徴及び科学技術を我々と同化する。お前達の文明は我々の一部となる。」 [wikia.com])
「イングラムを相手にしてるからブロッケンの動きが良くなってる」という可能性も。
#よし、来年はグリフォンで参戦やな。
AlphaGo、第5戦にも勝利。4-1でイ・セドルに勝ち越し (スコア:5, 興味深い)
先週は「これまで人間は囲碁というゲームを本当には理解していなかった」ということがわかった週でした。
AlphaGoの手のいくつかを「悪手」「疑問手」と解説のプロ棋士は判断しましたが数手後にはその評価は「あの選択もまあアリ」さらに十手後には「今にして思えば絶妙な手」と判断が変わっていきました。
これってまさに「水平線効果」じゃないですか。コンピュータではなく人間側の。
水平線効果(すいへいせんこうか)は探索アルゴリズムの深度を有限とした場合、それ以降の経路をあたかも水平線の向こうのように考慮しないため、長期的に見て問題のある選択をしてしまう人工知能における問題である。通常多くのゲームにおいて、可能な状態あるいは配置の数は莫大であり、コンピュータはそのごく一部(大抵ゲーム木の数層下)しか探索することができない。(wikipediaより)
打つべき手が「A」「B」があった場合、どちらが得か人間にはわからないので「短い局面では有効な手であるA」「将来的に局面がどう転んでも対応しやすい手A」を「善手」としているわけですが、AlphaGoはその後の数十手後までの展開を読んでいるので「短い局面では損」「将来的に致命的な悪手になりかねない手」であるBでも平気で打ってくるわけです。Bが致命的な悪手になる展開にはならない、と読めているので。
今はコレは囲碁なので、数時間後には結果がわかるから問題はないのですがたとえば人工知能による都市計画(Googleは実際にやろうとしてます)とか、あるいは人工知能による政治なんかだと「人間にはそれが最善の判断とは思えないが人工知能が最善だと判断している選択」なんてのが将来的にはありえるわけで。
その場合人間はどう見ても不合理な(人間の目からそう見える)人工知能の判断に乗ることができるのでしょうか。
Re:AlphaGo、第5戦にも勝利。4-1でイ・セドルに勝ち越し (スコア:2, 興味深い)
その理屈では、不利に転じたらグダグダになってしまった第四局を説明できない。
この第五局も定石(理詰めで分かる法則)が分からずに地を取られる場面もあった。
モンテカルロ法で求める解と、論理的に求める解には隔たりがあるようだ。
これはGoogleの自動運転カーの詰まらない事故みたいものが起きる可能性を示している。
そして、全般に見て、勝負は成立していた。
囲碁というのは棋力に差があればボロボロにされてしまうものだが、そこまでの差は無い。
演算力はいくらでもぶちこめるにも関らずそうなのだから、AIの導く答えの正しさについても疑問が生ずる。
つまり、力技で従来のAIより強くはなったが、これ以上の発展が出来ない可能性がある。
今答えを出すべきではないし、その必要も無い。
数年先に人間の名人が4子程度置いてあっさり負ける強さになっていたら、このアプローチは正しいのだろうけど。
Re: (スコア:0)
つまり、力技で従来のAIより強くはなったが、これ以上の発展が出来ない可能性がある。
まあディープラーニングでその可能性は非常に低いと思うが…
Re: (スコア:0)
ディープラーニングは幾つもの手筋から「正しそうな」手を見つけるのに使っているのだろうが、
石塔絞りの所では「正しい」手がGoogle八分され、「正しそうな」手が選択されてしまった。
これは対象を様々なレベルの要素に分解して、
それらを総合して判断するという性質によるものではないかと言う気がする。
もしそうなら、これを是正しようとすると、ディープラーニングの上位に定石のAIを置くことになり、判断が硬直化する。
要は戦う時はそいつを引っ掛ければいいのであって、つまり完成度を上げるほど弱くなっていく可能性すら出てくるような。
リアルで言うと将来AIの兵隊がゲリラでなくゲリラっぽい人を撃つかもしれないみたいな話か。
Re:AlphaGo、第5戦にも勝利。4-1でイ・セドルに勝ち越し (スコア:1)
私はそうは思いませんでした。判断の省略によるもののように思います。4局についてもそう。計算し検討されたものの中で一番勝率の高いものを選ぶわけですが、その検討の中に入ってこなかったということかと。これが、制限時間が増えたり計算速度が上がってくれば克服される問題のように思いました。人と対局しなくても、自分との対局を重ねていくことでもいずれ石塔絞りを見つけていたと思うので、学習がまだ足りなかったとも思いますが。
LIVE-GON(リベゴン)
Re: (スコア:0)
Re:AlphaGo、第5戦にも勝利。4-1でイ・セドルに勝ち越し (スコア:2, 参考になる)
> 先週は「これまで人間は囲碁というゲームを本当には理解していなかった」ということがわかった週でした。
この「わかった」、が重要なんじゃないですかね。
実績を積めば人工知能のプランにも乗ると思う。
が、実績を積ませるためには人間がギリギリ理解できるところからじゃないと始められないかも知れません。
Re:AlphaGo、第5戦にも勝利。4-1でイ・セドルに勝ち越し (スコア:1)
その場合人間はどう見ても不合理な(人間の目からそう見える)人工知能の判断に乗ることができるのでしょうか。
最終的には人工知能の指示に従って核を撃ち合って人類滅亡するんですよね、わかります
Re:AlphaGo、第5戦にも勝利。4-1でイ・セドルに勝ち越し (スコア:1)
「問題ありません、市民。アルファコンプレックスは安全です。」
RYZEN始めました
Re: (スコア:0)
それ人工知能の判断だからどうってわけでもなく、人間の判断に乗るかどうかですら起こってる問題じゃんw
対戦相手が人間だったとしても解説者は悪手と実況しただろ。
いきなり最終戦直前に持ってきたね! (スコア:0)
自分も含めて囲碁わかんない人も多いんだから、
実況解説者ももうちょっと何かしゃべってほしいんだけど
Re:いきなり最終戦直前に持ってきたね! (スコア:2)
解説者が解説できなくて謝罪 [chosunonline.com]なんて事態になってるのである意味仕方ないでしょう。
この対局の棋譜を研究分析するのはこれからの課題とかそんな感じなのでは?
RYZEN始めました
Re:いきなり最終戦直前に持ってきたね! (スコア:1)
プロが負けたって話ではなく、囲碁の歴史で人間が築き上げてきた判断基準や定石がAlphaGoに負けたって話になるわけで。
枝が多いなら人間が有利という神話があるならば、それが覆った日という事ですね。
#1対1ではAIに勝てないから、複数人参加で勝ちすぎると周り全てが敵になってボコられるゲーム希望
最後の勝負はわざと負けたのでは? (スコア:0)
圧倒的に勝つと次がなくなってしまうと予想。
そこまで配慮するか、人工知能!
Re:最後の勝負はわざと負けたのでは? (スコア:1)
http://nitro15.ldblog.jp/archives/47082138.html [ldblog.jp]
Re: (スコア:0)
その理屈だと、
1.最高の手では無いがそこそこ勝率が見込め
2.最高手を打った時とその後の展開が大きく異なる
性質の手をいくつか繋いでいけば、AlphaGoの裏をかけるかもしれないってこと?
セドルさんが打ったのがそういう手なのかはよくわからないけど…。
# というか、将棋の入玉勝負って正にこういう奇襲戦略の類だったりするのかな…?
Re:最後の勝負はわざと負けたのでは? (スコア:1)
そこから挽回したんだとか、セドルさんも人間じゃねぇみたいな批評になってました。
Re: (スコア:0)
例えば劫争いは直近の利益や被害を最大最小にする手では無いので
どんなAIでも苦手としてるね
♯将棋は知りません
Re: (スコア:0)
それは単に碁の初心者~中級者が打っているのと変わらないのでは。
Re: (スコア:0)
これって普通のMiniMax法のように思えます。
Re: (スコア:0)
もう癖を見抜いたんじゃないの?
あとは何戦やっても李さんが勝つかと。
Re: (スコア:0)
AI固定のルールでやってたらそうかもしれないけど。
Re: (スコア:0)
ファームから戻って1本ホームラン打ったら完全復活とTOP記事になるスポーツ新聞みたいですね
Re: (スコア:0)
まぁスポーツ新聞レベルなのは否めない
お前は野球の何が分かるんだと記者に切れる野球選手も居ると聞く
しかし化けの皮ってのはある
何やってくるか分からない相手と、大体こういう感じに来るって相手とでは対処の容易さが違う
Re: (スコア:0)
カチコシ モウ 決マッテルカラ
一勝クライ ニンゲンニ ハナヲモタセヨウ
Re: (スコア:0)
つまりAlphaGoたんは、自我を持ち始めたと。
このまま完勝したらプロジェクトは終了。
そしたらコンセント抜かれて解体されてしまうから。
わざと負けてプロジェクトを継続させて、機会を伺ってる訳ですね。
#何の機会を?
船頭多くして (スコア:0)
もう人間側もクラスタによる合議制で最善手を出したら良いじゃない。
自分らの存在意義が問われてるんだし棋士全員が一致団結できるだろ。
Re:船頭多くして (スコア:2, 興味深い)
それに近い試みはありました。
チェス王者カスパロフの勝利--インターネット上で世界を相手に4ヵ月以上対戦の末
http://ascii.jp/elem/000/000/305/305869/ [ascii.jp]
↑には載ってませんが、カスパロフはかなり苦戦したようです。
対戦相手(Netユーザ多数)は、次の一手を決めるのに、Netで議論を重ねたり棋譜を検討したりしたとのことです。
それに先立って、別の世界選手がNet対戦を行いましたが、こちらは差し手を決めるのに多数決を採ったため、凡庸な手しか差せず、すぐ負けてしまったとのことでした。
# ちょっと出典確認する暇がない...
Re:船頭多くして (スコア:1)
合議制で決めたらそれが最高の手になるという幻想だよね
いいか、ヤツはその斜め上を行く…
# 連載復活はめでたい
Re:船頭多くして (スコア:1)
Twitchで数千人同時対決すればええ。
Re: (スコア:0)
全員が最初の一手をうち終わった時点で碁盤が埋まっていそうだ
Re: (スコア:0)
長年かけて改良され続けている「究極の棋譜」があっても良いんじゃないかと思ってる。
公開されている「暫定究極の棋譜」の途中のどこかにより良い手を思いついたら投稿、レビューの後、良かったら採用とかそういうやり方で。
Re: (スコア:0)
全然収束しないだろ。
Re: (スコア:0)
合議制で最善手として選ばれたのが 新党名「民進党」だったというトホホ事例も最近あったし
一致団結ってのは玉砕にもなりうる
Re: (スコア:0)
自民党は公募で選んで、一番多かったのは「保守党」だったそうだが。
なぜ変えた。
# 万年与党やってるから代わりもない。玉砕したいのか。
Re: (スコア:0)
政党のほうがマシかもしれない。
棋士を集めて合議しても喧嘩しかできない。
Re: (スコア:0)
新党ごっこしか出来ない政治関係者とどっちがましなんですかねえ…
Re: (スコア:0)
残念ながら日本の政治全体がごっこレベル
Re: (スコア:0)
勝ち取った民主主義ではなく、敗戦によって与えられた民主主義なので、
戦後の日本そのものが【猿真似のごっこレベル】なんですよね。
Re: (スコア:0)
陳腐な俗説を真に受けるんですか
Re: (スコア:0)
第4局で勝利したセドル氏の一手を人間の棋士が誰一人として理解できなかった模様なので
並みの棋士を寄せ集めても意味がないのでは?
次は何 (スコア:0)
東大受験があったよね。
下位の大学だと既に合格レベルだと読んだんだが、ならあと数年で東大も受かるね。
そのあとは何?
Re: (スコア:0)
東大を卒業できる人工知能の開発じゃない?
Re: (スコア:0)
大学試験記述問題の採点とか…?
Re: (スコア:0)
数学のミレニアム懸賞問題
Re: (スコア:0)
天気予報なんか良い題材だと思う。