Microsoft、麻雀AIで10段達成 18
ストーリー by hylom
人間が麻雀でも負ける時代が来るのか 部門より
人間が麻雀でも負ける時代が来るのか 部門より
日本のオンライン麻雀対戦プラットフォーム「天鳳」において麻雀AI「Suphx(Super Phoenix)」が今年6月に10段を達成しましたが、その開発元が中国・北京にある「Microsoft Research Asia(MSRA)」であることが世界人口知能会議で発表されました(麻雀ウォッチ、Microsoftの発表、PC Watch、Engadget日本版
「天鳳」での10段は最高位の天鳳位に次ぐ強さです。ユーザーが33万人いる中で、天鳳位は13人、10段は180人ほどだそうです。これまで麻雀AIとして天鳳で打っていた「爆打」「NAGA」も十段到達実績は無く、Suphxが初めての快挙となりました。
麻雀は不完全情報ゲームであるため、囲碁や将棋に比べて難易度が高いとされています。
補足 (スコア:3)
・4人のプレイヤーの順番が固定ではなく、途中の鳴きに変ってしまう
・囲碁やチェスのように盤上の駒が全て見える「完全情報ゲーム」ではなく「不完全情報ゲーム」である
-具体的には他のプレーヤーと自模られていない120牌の情報が得られない
・報酬メカニズムが複雑
-役が多く点数計算も複雑
-捨て牌に応じて、動的に役作りを変える必要がある
-単に上がることや振り込まないことだけではなく、意図的に振り込むこともある
(オーラスでトップの時に下位の相手に安い手を振り込んで、終局にして勝ちを確定させるときなど)
ということで、将棋や囲碁、チェスなどより難易度は高いと言われています。
Re: (スコア:0)
「作る」のは難しくても、「学ばせる」ほうならゲームのシステムだけ実装して
物量で勝負すりゃなんとかなるようになったってことだよなぁ
そこには「麻雀における強さの本質は何か」という問いへの答えなんてはひとかけらもないわけだが、
だからって人間が勝てるわけじゃないし、人間だってそんなこと分からないまま麻雀打ってる。
麻雀が廃れるくらい未来になってもずっと分からないままだろう。
Re:補足 (スコア:2)
そこには「麻雀における強さの本質は何か」という問いへの答えなんてはひとかけらもないわけだが、
だからって人間が勝てるわけじゃないし、人間だってそんなこと分からないまま麻雀打ってる。
麻雀が廃れるくらい未来になってもずっと分からないままだろう。
囲碁のAlphaGoのときも思ったけど、実は「我々人類が麻雀だと思っていたものは実は麻雀の一部分でしかなかった」というのがAIによって間接的に発見されるのはとても面白いね。そして天鳳のプレイヤーたちが「AIの牌譜で勉強する」と言ってるのが囲碁のAlphaGoと同じで面白い。
Re: (スコア:0)
元記事にも書いてあるけど、局単位での勝ちと半荘での勝ちは別物だから「学ばせる」のも難しい。
天鳳の昇段システムはドべが大量失点、それ以外は失点しない仕組みだから、ドべにならないAIなんだろうな。
賭け麻雀風に学習させると、違った打ち筋になるはず。
Re: (スコア:0)
>「麻雀における強さの本質は何か」
麻雀は勝った負けたで命のやりとりが発生するゲームなので、データさえあれば死なない
コンピュータは強いんじゃないでしょうか。
#近代麻雀とかヤングチャンピオンでしか麻雀知りません
Re: (スコア:0)
自らの手作りは基本確率の話なんでしょうが、捨て牌のほうは相手の手牌を読むってのが必要ですからねぇ
過去の傾向から相手の癖を読むとか。
Re: (スコア:0)
トッププロになればなるほど公開対局も多いから、癖を学習されてしまうのではないかと思います。
プロはその辺も加味して対局中の癖も制御してたりするんでしょうかね。
ポーカーフェイスはプロの基本でしょうけど。
Re: (スコア:0, フレームのもと)
不完全情報って難しいんですかね?
どうせ読みようがないから確率計算するしかないってことは、囲碁将棋チェスでの水平線効果みたいなのはあったとしても大分マイルドになりますよね
Re:補足 (スコア:1)
なにせ最善手がデジタル打ちとか呼ばれてセオリーから外れた特異な戦術扱いされる世界なんだから。
いくら確率統計を駆使しても、 無能な働き者を3人率いて戦争するようなもので、モデルの立てようすらないだろう。
Re:補足 (スコア:1)
>最善手からはるかにかけ離れた手
横道ですが、将棋のいわゆるハメ手を連想しました。将棋のAIでは
これに対応できてるんでしょうか?(詳しくないので)
将棋で対応できてるなら、麻雀の方も引っ掛け(筋引っ掛けとか)を読める?
-- う~ん、バッドノウハウ?
Re: (スコア:0)
やはり、いわゆる「最善手」をとると負けることが多いのでしょうか?
以前なんかの小説で、ゲーム理論では最善手ばかりを取っていると逆に手を読まれて
勝てない、とか書かれていた記憶があるので。
Re: (スコア:0)
いわゆる最善手だと、繰り返し打てば勝率は他より高くなるが、
キーとなるところ(これで上がれば逆転して終了、とか)では結局運任せ・・・
って感じになるのかも。
Re: (スコア:0)
どの項目も、とくに人間が有利って感じは無いな
ひとつひとつ機械にガチられたら人間に到底勝ち目なさそう
スーパーフェニックス (スコア:1)
スーパーフェニックスと聞くと、
どうしてもキン肉マンとビックリマンを思い出す。
あとフランスの高速増殖炉。
相手によって戦術を変える? 変えない? (スコア:1)
仲間内での話だが、
ある種の戦術が好きな人がいて、同じ卓に入ると、
その戦術に対して特に警戒したりする
AIは局面によってのみ打ち手を決めるのか
相手の打ち筋も考慮にいれるのか
トーキョーゲーム (スコア:0)
ローザのアプローチは正しかったんや!
//肉眼で見える星の数はたかだか6000個に過ぎぬ。文学的鑑賞に酔うのはやめ給え。
次は咲になろう (スコア:0)
スコア調整して終局でプラスマイナスゼロ(25000点持ち、30000点返しなら29600~30500点の範囲で収める)にする確率を10割に近づける方が勝つよりも難しそう
参考 (スコア:0)
一時は九段まで達した「爆打」の開発者インタビュー
https://www.itmedia.co.jp/news/articles/1802/23/news023_2.html [itmedia.co.jp]
3ページ目
>相手の待ち牌予測などに使えるのでやってみたいとは思いますが、ディープラーニングを使ってもまだそこまで強くならないと思います。
>あと、今課題になっている強さのボトルネックがそこではないと思っているので。
だそうです。