第2回将棋電王戦、第5局はGPS将棋の勝利。コンピューターがプロ棋士に勝ち越す 163
ストーリー by headless
投了 部門より
投了 部門より
第2回将棋電王戦の最終局となる第5局が20日に行われ、102手でGPS将棋が三浦弘行八段を破った(第2回将棋電王戦 対戦結果、
マイナビニュースの記事、
日本経済新聞の記事、
ねとらぼの記事)。
GPS将棋は世界コンピュータ将棋選手権第19回および第22回で優勝した現在最強の将棋ソフト。今回は東京大学駒場キャンパスの600台以上のコンピューターを接続して勝負に挑んだ。1秒間に2億7千万局面を読むことができるという。三浦八段も順位戦でA級にランクされる現役最強棋士の一人で、最強ソフトとの好勝負が期待されていた。対局は先攻した後手のGPS将棋が優勢に進め、102手で三浦八段が投了。消費時間は三浦八段が3時間59分、GPS将棋が2時間7分。団体戦の対戦成績はコンピューター側の3勝1敗1分けで、コンピューターがプロ棋士に勝ち越した。
GPS将棋は世界コンピュータ将棋選手権第19回および第22回で優勝した現在最強の将棋ソフト。今回は東京大学駒場キャンパスの600台以上のコンピューターを接続して勝負に挑んだ。1秒間に2億7千万局面を読むことができるという。三浦八段も順位戦でA級にランクされる現役最強棋士の一人で、最強ソフトとの好勝負が期待されていた。対局は先攻した後手のGPS将棋が優勢に進め、102手で三浦八段が投了。消費時間は三浦八段が3時間59分、GPS将棋が2時間7分。団体戦の対戦成績はコンピューター側の3勝1敗1分けで、コンピューターがプロ棋士に勝ち越した。
そんなことより (スコア:5, 興味深い)
コンピューターが新定跡を作るかもしれないという方がニュースではないだろうか。
検討によれば今回の戦いが始まった一手は新手らしいので、ソフトが新しい定跡を切り開く時代に入ったと考えれば感慨深い。
新手の先の検討を人間がやりつつ、GPS将棋同士でこの局面から先を100局とかささせて
比較、検討すれば評価関数の確からしいさの底上げにも繋がると思うし楽しみではある。
Re:そんなことより (スコア:2, 参考になる)
昔のボナンザがよく使った「ボナンザ囲い」は、当時はコンピュータならではのヘンテコな囲いとしか思われていませんでしたが、角の打ち込みに対する強さが買われて、今ではプロの角交換将棋で普通に現れる囲いになっていますね。
当のボナンザは今じゃこの囲い使わなくなってるんですけど(笑)
Re:そんなことより (スコア:2)
棋譜をたどれば30年くらい前に塚田泰明九段が田中寅彦九段相手に似たような局面で指した記録があるんだとか。
その時は無理攻めとされたようですが、今回の局面ではつながる筋があったということでしょう。
#GPSは棋譜をたどったわけじゃなくて自力でつなげたらしいですけどね
RYZEN始めました
Re:そんなことより (スコア:2, すばらしい洞察)
弱くなったというよりは、評価関数的な最善手が人間の感覚に勝りだしたんじゃないかな?
入玉辺りの特殊な状況を除けば、勝てない時代が来てるともいえる。
プロ棋士が、細い攻めをよく繋いだって言ってたが、繋がる攻め(防御側が最善手を繋げても切れない探索木ができてる)に
感覚的な細いなんて表現を使ってる時点で、人間がAIに勝てる時代は終わったのを実感したかも。
公平なルールで (スコア:4, おもしろおかしい)
>東京大学駒場キャンパスの600台以上のコンピューターを接続して勝負に挑んだ。
棋士にも、ほかの人に電話で聞く権利を持たせればいいのに。
Re:公平なルールで (スコア:4, すばらしい洞察)
プロ同士のタイトル戦がネット実況されるのを見ていればわかりますが、控え室の検討にない妙手が指されることも多く、単に頭数を増やせばよいというものでもないかと。
本来の意味で、「船頭多くして、船、山に登る」とも言いますし。
(人を増やせば不可能も可能になる、という意味に転じかかっているらしいですが。)
Re:公平なルールで (スコア:1)
コンスタンティノープル攻略以後は肯定的な意味で使うようになったんだよ。
Re:公平なルールで (スコア:2, 興味深い)
「人間と同じ大きさの筐体に収まる」かつ「人間と同じ消費エネルギー」の計算機というのはいかがでしょう?
Re:公平なルールで (スコア:1)
良さそうな)棋士を選べば、何とかなるかも。
Re:公平なルールで (スコア:3, 興味深い)
現状でも「リニア」に性能向上はしませんし、
「処理ユニット数を増やしたら(少しでも)性能が向上する」ということ自体、
僅か3年かそこら前に開発された [cocolog-nifty.com]Bonanza以降の最大のブレイクスルーとも言えます。
数年前までコンピュータ将棋は並列計算に向いていないというのが定説でした。クラスタ並列はまさにGPSやボンクラーズが開拓したフロンティアであり、その事情が分かっていれば個人的には今回はコレでありなのかな、と思っています。勿論アルゴリズム自体の改革だって今後出てきて欲しいですし、今から3年後には、クラスタ禁止とか100W以下とか、コンピュータ側にハンデを付けて戦うのが当たり前になっててもいいかなと思いますが。
Re:公平なルールで (スコア:1)
変なハンデをつけるくらいなら、対戦しなきゃいいでしょ。
ルールをつけるならコンピュータ同士の対戦の場合のみ。
もう基本的には勝てないという前提で、普段は人間同士で戦って
たまに「コンピュータに挑戦!」って形にすれば良い。
Re:公平なルールで (スコア:3, 参考になる)
たとえば、αβ探索は並列化が難しいということが知られています。αβにおける枝刈りは前に読んだ部分の結果に依存するという性質があるためで、並列探索では単独の探索で刈れていた枝を刈れずにたくさん読むはめになるということが起こります。並列化を工夫しないと探索効率がかなり落ちてしまうのです。
また、還元手順の確率は低いと仰っておられますが、将棋では手順前後によって同一局面に到達する枝はかなり多いはずです。ある手の流れの中で、互いに依存していない手を入れ替えても到達する局面は同じだからです。そこはちゃんと対策しないと、やはり無駄な探索が大量に発生してしまいます。
Re:公平なルールで (スコア:2, 興味深い)
2・3局あたりは、体力・精神力的に負けていた感があるし、
4局も、入玉後のコンの指し手がアホだったから、体力等余裕あって
256手ルール無ければ、逆転勝ちの可能性もあった。
公平にするためにコンにハンディキャップってのも違和感あるし、
逆に人間側がベストパフォーマンス出せる様なルールにすれば
いいんじゃないだろうか。
2日制にして、初日土曜日はあまり進まないだろうから解説なしで
放送して、2日目日曜日を今回みたいに解説付で放送するとか。
あとは、人間側もクラスタでって話もある。手がまとまらないなら、
着手の最終決定者だけ決めて、控室の継ぎ盤で他の棋士の
意見を聞き放題ってのでも、人間側の英知を結集した事になって
クラスタ相当なのではないのかな。この場合は、控室もマシンや
通信等控える必要はありそうだが。
そもそも論として、人vsマシンは感情的には盛り上がるんだが、
本当の人の価値はそこじゃないと思う。人+マシンで、マシン単独で
できない事ができれば、産業的な価値としては十分なんだよね。
その意味では、第4局が一番参考になって、入玉まではマシン・
入玉後はマシンに代わってある程度のアマが指していれば、
塚田さんは手も足も出なかっただろう。(その前に入玉自体
目指さなかったろうが。)こういう意味で、人の価値を示す対決の場も
設けて欲しい気がするが、こっちは人vsマシンの決着がついてからかなぁ。
Re:公平なルールで (スコア:5, すばらしい洞察)
Puella αの開発者が持ち時間についてインタビューでコメントしたことがあります。
http://weekly.ascii.jp/elem/000/000/071/71892/ [ascii.jp]
個人的にも2日制は、悔いを残さず戦った気分を演出する意味はあるかもしれませんが、
更に消耗が激しくなる割に大して強くなるわけではないため、人間が不利な気がします。
あとクラスタ並列は「同一のアルゴリズムを並列に走らせること」ですから、ヒトのクラスタ並列は不可能です。
ヒトに可能なのは「違うアルゴリズムが結果だけ出しあう」という、「合議制」の方。
合議制はコンピュータ将棋でも「あから2010」や「文殊」で採用例があるのですが、
基本的には明らかな悪手やミスを防ぐというメリットで理解されています。当然ながら読み自体が急に深まるものではありません。
今回の5戦で人間側に合議なら防げるような明らかなポカが多かったとは聞いていないので、合議制ならもっと強かったはずというのも疑問です。
Re:公平なルールで (スコア:1)
もちろん、可能性であって確実なことは誰にもわからない。
最終的にやってみないと分からないと、伊藤さんも言っているわけで。
ただ、今回時間的な制約が人間側に不利に働いている様に見えたので、
そこは改善した方が、良い場になる気がするという感想ね。疲れや
空腹やトイレなどの生理現象のある人間に、昼から夜までずっと真剣
勝負させ続けて、しかも1分で決め続けろって、どう考えても
パフォーマンス落ちるでしょ。
クラスタの話は、合議との厳密な区別をしていない大雑把な話しね。
そういう厳密な話だと、GPSクラスタも、詰め専用ノード持ってたりするので、
厳密な意味ではハイブリッドなわけで。1手だけ出し合って、何らかの手法で
着手決定するなら、厳密な合議(というか投票)システムなんだけど、継ぎ盤の
検討でも、読み筋中に別の人の意見が入る事もあるわけだから、ハイブリッド
になると思われる。なので、個人的には厳密な区別は意味が薄いと思う。
クラスタにせよ、合議制にせよ、ミスが少なくなるという意味は大きくて、
機械と違って体力有限な人間だと、ミス無し縛りからある程度開放される
メリットは大きいんじゃないかな。非常に大雑把な例えとして、時速20kmの
自動車相手に、一人で走り続けるとその内絶対負けるが、駅伝なら
対抗できるでしょって話。時速60kmなら、そもそも絶対勝てないけど、
まだそこまでは行ってない様に見える。
Re:公平なルールで (スコア:1)
一分将棋については「まったく勝てない」ってことでプロが完全に白旗を上げているような状態です。
Re:公平なルールで (スコア:1)
みの「では会場のみなさん、ボタンをどうぞ」
Re:公平なルールで (スコア:1)
人とコンピュータは違うに決まってるんだから、コンピュータの内部構造にケチつけても仕方ないと思う。
Re:公平なルールで (スコア:1)
消費電力制限がいいんじゃなかろうか
Re:公平なルールで (スコア:1)
まあチェスはすでにスマホのプログラムがグランドマスターレベルらしいし、ほとんど時間稼ぎにもならない割により惨めになるだけだと思うよ。
Re:公平なルールで (スコア:2)
脳を一個と数えるからおかしい。
右脳,左脳、小脳、脳幹で4コアとか。
#冗談です
「ノイマン型コンピュータと、おそらく非ノイマン型である人間の頭脳を、
同じ「コア数」などという基準で測ろうというのがナンセンス」
という結論に落ち着くと思う。
将棋の内容 (スコア:2)
ざっと、第2回電王戦/第5局「三浦八段、相矢倉で完敗」|柔らかい手~個人的将棋ブログ [ameblo.jp]を見ただけですが、少しだけレポートします。
序盤は、矢倉の一種、脇システムになりました。
三浦先生の得意戦法でもあります。
中盤は、後手の角を先手の金でいじめるなど、抑えこみを図りましたが、結果は残念なことになったようです。
終盤は、一分将棋で苦しかったでしょうね。
持ち時間のルールも、これからの検討課題だと思います。
Re:将棋の内容 (スコア:5, 興味深い)
矢倉の先手番、しかも三浦八段の十八番である脇システムでの完敗でしたから、見ていて衝撃的でした。
終局後の三浦八段の「どこが悪かったのか正直よくわからない」というコメントが印象的で、この一局に関しては、大局観でコンピュータがプロを上回っていたように思います。
> 終盤は、一分将棋で苦しかったでしょうね。
一分将棋にはなっていませんよ。
最後に5分ほど残った時間を使い切って投了しましたが、あれは読んでいたというより、心を落ち着けるための時間でしょう。
三浦八段は時間の使い方は上手かったと思います。
Re:将棋の内容 (スコア:4, 興味深い)
中継の画面に出ていた、ボンクラーズの評価値は行ったり来たりでしたが、
GPS将棋自身の評価値は中盤以降は最後までGPS有利と出ていました。
検討室にいるプロは、互角か三浦八段が有利と評価する中、GPS将棋の評価値はどんどんGPS有利に傾いていきます。
終盤はプロでもコンピュータに敵わないのはすでに分かっていたことでしたが、
中盤でもコンピュータの形勢判断の方が正しいとすると、もう人間の手には負えない領域まで来てしまった。
人間の名人と対戦するなら、出し惜しみせず今年やっておくべきだった。
1年後なんて言ってると、コンピュータの進化に追いつけないかもしれない。
Re:将棋の内容 (スコア:2, 参考になる)
脇システム [wikipedia.org]のようにプロの研究がおそろしく進んでる戦形は、ソフト側は避けるのがセオリーと、多くの開発者は考えていたと思います。
定跡を全く使わなかったポナンザ・ツツカナはもちろん、普通に定跡を使ったプエラαでさえ、脇システムは避けるようプログラムしていました。
特に三浦八段は脇システムのスペシャリストで知られていて、プロの中でもこの戦形に最も精通した棋士だと思います。
GPSが脇システムに入っちゃった時、ポナンザ開発者の山本さんはこんな呟きをしていました。
結果として、脇システムを正面から受けて立って勝ったのですから、本当に驚くほかありません。
Re:将棋の内容 (スコア:1)
今後の将棋界 (スコア:2)
アレゲなサイトなのに、人間擁護のコメントが意外に多いのですが、総合的に見てもコンピューター将棋はトッププロと互角以上に戦えることがはっきりした、と言えるでしょう。
今後はコンピューター将棋がプロの実戦の定跡や新手を評価し、結論が数日で出てしまうことになるかと思います。
ゴキ中超速や藤井システムのような画期的な戦法も、コンピューターに評価させられていれば、ここまで怪物のように取り上げられる前に消えていたかもしれません。
人間が新手を編み出し、コンピューターが評価して、定跡の進化が今の数倍から数十倍に速まるのでしょう。
そしてすべての人間が定跡の進化についていけなくなったとき、プロ棋士は、ファンは、将棋界は、どうなるでしょうか。
駒落ち (スコア:2)
将棋の手合割 [wikipedia.org]
も少ししたらハンディキャップを付けて指して欲しい。
どこまでコンピュータは駒を落とせるかが興味深いですね。
コンピュータにも実力段位をつけて欲しい。
GPS将棋は現在十一段位か?
まだまだ… (スコア:1)
ここ数年で、CPUやGPUの性能も上がり、メモリ容量も格段に増えていると思いますが、
まだ600台以上使わないと人間には勝てないんですね....
まだまだ性能アップが必要ということでしょうか。
Re:まだまだ… (スコア:2, 参考になる)
対局後の三浦八段のコメントを聞く限り、600台だから負けた、とは思っていないようです。
おそらくですが、1台相手の練習将棋でもけっこう負けていたのではないかと。
たくさん対局すれば、台数の違いは勝率に現れると思いますが、一発対局では1台相手に負けても不思議はないと思います。
Re:まだまだ… (スコア:1)
ありがとうございます。
なるほど、勝率が変わってくるのですね。
さらなる強さですか、興味深いコメントです。
Re:まだまだ… (スコア:1)
> まだ600台以上使わないと人間には勝てないんですね....
GPS将棋以外にもコンピュータが2勝していて、Ponanzaは10台、ツツカナは1台構成だけど?
Re:まだまだ… (スコア:1)
人間のプロ棋士に最大の敬意を払ってるからこそ
「最高学府の680台のコンピュータを結集して、ようやく勝てた」
という形をきちんと演出しなきゃならんのです。
最初が肝心。
あとはハード性能向上でどんどん強く、お手軽になっていっても
プロ将棋とコンピュータ将棋は共存していける。
なぜ巨人IBMはわざわざ専用マシンを作って大仰にカスパロフに挑んだのか。
チェスの世界ではもはやスマホのレベルでも人類が勝てないといわれてますが、
ずーっとチャンピオンとは対戦せず、いきなりカスパロフ-スマホ戦やって人間負けたら
シャレにならんかったでしょう。
Re:まだまだ… (スコア:3, 参考になる)
それも通過点。
初期配置から終局まで、最善手を積み重ねるとどちらの勝ちになるのか、そしてその手順はどういうものか、答えを出すのが最終目標です。
「二人零和有限確定完全情報ゲーム」全般の完全解析ですね。
Re:まだまだ… (スコア:3)
二人零和有限確定完全情報ゲームの論理的なゴールと言えば,tamago915さん
の言うとおりの完全解析でしょう.これができてしまったら,その存在(コンピューター?)
に勝つことが絶対不可能になってしまうから.将棋の遷移状態の多さから,
これが達成されることは無いとは思いますが.
ACさんは勘違いしているかもしれないので補足すると,完全解析とは
>「その局面は先手の勝ちだよ」
>「なんで」
>「だってパターンXXXXXXX番目に「勝ち」って書いてあるもの」
これが,初手を指す前から決まってしまっていると言うこと.
Re:まだまだ… (スコア:2)
以前、羽生さんは「将棋は打ち歩詰めが無ければ先手必勝」って言ってたそうだけど(ホントかどうかは不明)
もし完全解析までいってしまったら、何らかのルール改正とかすることになるのかな?
※まさかの中将棋復活とかw
Re:まだまだ… (スコア:1)
何が終わるのか?ですが、コンピューターに駆逐された職業に、プロ将棋棋士が加わる可能性は低くないと思います。
プロ将棋棋士であるがゆえに起こった、例えば陣屋事件や聖の青春、LPSAの独立騒動など、人間くささのあるドラマも終わることになるのでしょう。
ちなみに、AC氏の考える最終目標も聞かせてもらえますか?
Re:まだまだ… (スコア:2)
仮にゲーム木が完全に探索されて、任意の局面の勝敗が一瞬でわかるようデータベースが作られたとしても、「なぜ」この局面は先手勝ちなのかという疑問に答えられないというのはその通りです。
でも、それとは別に、必勝手が判明してしまっている状況では、必勝手でない手は、勝つことを目的とするなら誤りです。プロ棋士同士の将棋の試合がエンターテインメントとして成功するかといったら、無理じゃないでしょうか。正解を覚えて実行するだけの将棋は見ていて面白くなさそうだし、勝つことを目的としない将棋も面白くなさそうなので。
Re:まだまだ… (スコア:3)
少しは数学のことをご存じのようですが,聞きかじりの知識のようですね.
四色定理は,NP完全であることが証明されていないので,もしかしたら
数え上げより効率の良い証明方法があるかもしれない,という希望が
あります.したがって研究にも意味はあるでしょう.
将棋は「指数時間完全」であることが証明されているので,全ての局面
を数え上げるのではない,エレガントな必勝法はありません.
数が膨大なので現実的ではありませんが,今はそれがもし起こってしまったら
という仮定の話をしています.すると,あらゆる研究はそのカタログを探す
作業に還元できるので,結局は「落ち穂拾い」に過ぎないと私は思うのです.
したがって,私は完全解析は将棋の論理としてのゴールという意見に賛成
です.
勝負としての将棋はこれとは別問題です.
Re:まだまだ… (スコア:1)
そうですね。
7年でそこまで行ってくれると楽しいですね。
演算性能を上げるために、できることはあると思うので。
ドワンゴ会長曰く、 (スコア:1)
「この対局を戦った“今のバージョンの”システムの保存」したいとのこと。
この提案には大賛成ですが、GPS将棋はどうするんでしょうかね。
Re:先攻した後手 (スコア:2)
「先」に「攻」め始めた、後手の GPS 将棋。
ですね。
見ていましたが、84銀あたりから三浦八段が一気に崩れていった印象ですね。
相矢倉でのあの攻め方は、プロ同士の対局でも表れそう。
Re:先攻した後手 (スコア:1)
先手、後手と先攻は別の概念
Re:四天王AA貼っておきますね (スコア:1)
様式美だと思えばいいんです
敢えてやるなら (スコア:1)
習甦がやられたようだな…[Ponanza]
フフフ…奴は四天王の中でも最弱…[ツツカナ]
人間ごときにやられるとは四天王の面汚しよ…[Deep Blue]
いや、あんた違うから。ルール違うから。[GPS将棋]
※ソフトとハードは違う等のツッコミは無しの方向でお願いします。
Re:次回将棋電王戦からは (スコア:1)
面白いね。
コンピュータに「え?なんで?」と聞けなくて、その手に対しても
憶測で議論せざるを得ないのでカオスになりそうw
結論としては「よく理解できないがコンピュータは強い」になるだろう。
Re:次回将棋電王戦からは (スコア:1)
コンピュータが予想した手に対して「この手はどうなの?」って聞いたらその結果予想される展開を数パターン表示してくれるようなソフトを開発しておけば、
何でその手を選ぶのかがある程度わかるようになるんじゃないでしょうか。
今でも640台のマシンが必要なシステムが、さらに大規模になっちゃうかもしれないですが。
Re:次回将棋電王戦からは (スコア:2)
>予想される展開を数パターン表示してくれるようなソフトを開発しておけば、
それらしきものが公開されているようです。
将棋電王戦2(先手: 三浦八段, 後手: GPS将棋) 探索木表示 [u-tokyo.ac.jp]
Re:次回将棋電王戦からは (スコア:2)
細かいが、KI とか GI とか KA とか読みづらいな
英語のウィキペディアの「将棋」でも、P, L, N, S, G, B, R, K で表してるんだから、そうすればいいのに
Re:素人にとっては気楽なコンピューター将棋のほうが良い。 (スコア:2)
東京大学GPS将棋サイト [u-tokyo.ac.jp]
内のコメント
質問:将棋プログラムの研究は将棋などのゲーム以外の分野にも応用できるか? [u-tokyo.ac.jp]
をみて、「なるほど」です。