AIで作られた「勝つのが難しいほど弱い」オセロ 74
ストーリー by hylom
逆方向に強い 部門より
逆方向に強い 部門より
Suzuno曰く、
深層強化学習(ディープラーニング)技術を使って作られた、負けるのが難しいオセロという「最弱オセロ」なるオセロAIがGame*Sparkで取り上げられていました。
確かにロジック的には、相手の手に対応した「勝つための最善手」も「負けるための最善手」も計算コストは大差ないだろうことは想像できます。
でも実際に遊んでみると、強いオセロは「強い」という印象しかないのに対して、負けるオセロは「手のひらで転がされてる」ような気分がして、不思議なものです(あくまで個人の感想です)
オセロはわざと負けを狙ってもゲームが破綻しない (スコア:4, 参考になる)
・盤に石が増え続けるのみなので、不利な手を打っても(将棋や囲碁のように)取られたり減ったりしない。
まずこの特徴で、最弱オセロは通常のルール上でゲームが破綻しない。
そして、
・相手の石を返さないといけない(盤面上不可能な場合は除く)ため、不利な手はあっても直接に自虐する手は無い。
・相手が自分の石を返すことでのみ負けにつながるため、相手を「自分の石を返さざるを得ない」状況に追い込むことが求められる。
・オセロは終盤に向けて、相手の手を狭めていく戦法となる。
といった特徴から、「手のひらで転がされてる」ようなプレイ感に導かれる。
Re: (スコア:0)
黒か白の一色になって,途中で終了となる手もあるんだよね?
Re:オセロはわざと負けを狙ってもゲームが破綻しない (スコア:1)
このオセロは途中での終了と、打ち切って64子完敗のどっちを「より負けている」と認識しているのだろう?
SONTAKU MODULE (スコア:2)
接待業界から本当に求められているのはただ負けるAIだけじゃなく
僅差で負けるための選択だと思う
Re:SONTAKU MODULE (スコア:1)
HAL9000のチェスは、勝率50%になるように調整されていたそうで
人は気が付かないふりをしているのだった
Re: (スコア:0)
「かなりの強敵で前半では負けそうになってたんだけど、土壇場で大逆転したんだ。」
と思わせる接待麻雀AIとかどうだろう。
毎回同じように苦戦するとだめなので、苦戦のしかたも毎回パターンを変える。
これは難しいぞ
Re: (スコア:0)
忖度と言うより接待モードな気が。
接待と言えばマージャン。マージャンと言えばゲーセンの脱衣ってことで、接待モードが有ったら受けそう。
はっ。その辺を上手く使って客単価の最大化とかできるんじゃないかな。
強い人が弱く指している感じ (スコア:2, 興味深い)
強い人と指すと終盤は打てる場所がほぼ無くなり、途中からパス連続になったり、打てる時も1ヵ所しかなくて「打たされる」のだよね。
このオセロの場合も、こちらの打てる場所がほぼ無くなり「打たされる」状態になるので、勝っても「自分が強い」という気持ちにはなれそうにないなぁ。
Re:強い人が弱く指している感じ (スコア:1)
勝ち負けを反転したルールで考えて対局してみれば、なかなかの「強さ」であることがわかりますね。
Re: (スコア:0)
そういえば、AlphaGo や AlphaGo Zero、DeepZenGo など、人間に勝つ碁のプログラムは
いくつも出てきたが、こいつらは、ヒカルの碁で塔矢アキラがやったような、わざと持碁に
持って行くようなことはできるのだろうか。
アマチュアだと、普通に考えられないようなとんでもない悪手を打ったり、
深く考えずに好手を打ったりするので、相手の棋力を量って対応しないといけない。
棋士にはできても、コンピュータにはまだまだ難しいような気がするけど。
Re: (スコア:0)
囲碁のシステム上、盤面は見えている以上の過去の情報を覚えているわけじゃないから、アマチュアが打ったまぐれの一手も、プロが熟考の末に打った手も同じ手なら結果は同じだしね
Re: (スコア:0)
ところが囲碁は終盤になるほど自由度が減るので、相手の打った手に対して
持碁にする手を打つという戦略だと、どうやっても持碁にならなくなってくる。
例えば、一目差でこっちが勝っているとき、相手が一目得するような手を
こちらが打ったとしても、相手がそれに気がついてくれなければ、持碁に出来ない。
プロ棋士なんかが、持碁にしようとする場合、ヘボ相手なら見え見えの手で、
ある程度強い相手なら手筋を使うと持碁になるような形にするだろう。
このあたりは、コンピュータがそれまでに打った手から相手の強さを推し量り、
相手の考えを読むことが出来るようにならないと、出来るようにはならないのではないかな。
# ただし、相手の地に意味のない石を置くような、あからさまな手段をとるなら別
違うゲーム (スコア:2)
自分の色が最終的に少ないほうが勝ち
というルールのゲームである
と先に定義して、
競争して得たほうが「勝ち」という部分は変えないようにしないと、
負けを競うのではなくて、少ないほうが勝ちとすれば、
たんにそういう新しいルールで勝つAIという説明でシンプルに話せるのに。
と思った。
面白い (スコア:1)
オセロ強い人ならやってみれば分かるが序盤普通に定石打ってくる
初心者は勘違いしやすいがオセロ序盤は手数の取り合い
打てる箇所多い方が有利で石の数が多い方が有利じゃない
序盤は普通に勝つ動きをしていて自分の手数多くして中盤あたりから
自分が不利に打たせるように制限かけてくる印象だな
このへんの切り替えどうしてるのか気になる
印象が違うのは手数が重要と知らないからだと思う
俺からすると最初から強い動きの人と戦ってる感じ
Re: (スコア:0)
切り替えているわけではなくて、手数の多いほうが勝つにも負けるにも有利という点から、自然と序盤の定石は同じになったのでしょう。
Re: (スコア:0)
いやそれは分かってるよ
分かりづらくてすまんが
「切り替え」は中盤で悪手相当の手を打つわけだけど、そのタイミングをどう判定してるのかで言った
序盤の勝つ動きから中盤のどのタイミングで負けさせる動きに切り替えてるのか気になった
あと悪手の中でも良い悪手(石の返し最少で手数で勝ちつつ、相手に有利位置をとらせる)と
悪い悪手(石返しすぎて、手数の関係上、対戦相手に返されて最終的に自分が有利な位置とらされる)
がありそうだがその辺どう評価してるのかも気になる
Re: (スコア:0)
ディープラーニングのことよく知らなくてすみませんが、
「切り換え」とか「タイミング」とか「判定」とかあるんですかね?
Re: (スコア:0)
うん、通常ルールでの勝ち負けというより、少ない方が勝ちルールで遊んでいるような気分だった。
# あと、白番やらせろよ、と
Re:違うゲーム (スコア:1)
白番やらせたら、2窓でCPU同士を対戦させる人が大量に出て勝率のカウンタが破綻するから・・・
格闘マンガの刃牙シリーズにそんなの居た (スコア:2)
戦いには“愛”こそが必要
人を喜ばせることと倒すことは、相手の意図を読む事では表裏一体
Re: (スコア:0)
戦いには“愛”こそが必要
人を喜ばせることと倒すことは、相手の意図を読む事では表裏一体
まさにAI故に人は迷うのですね
なんでもディープラーニングは良くない (スコア:1)
オセロぐらいなら,ディープラーニングを使わなくても昔から強いAIが作れています.例えばMinMax法とかαβ法といったアルゴリズムを使うものです.
https://en.wikipedia.org/wiki/Minimax [wikipedia.org]
https://en.wikipedia.org/wiki/Alpha_beta_pruning [wikipedia.org]
最近よく「ディープラーニングを使いました」という話を聞きます.
しかし詳しく話を聞いてみると,とりあえずネットに落ちているライブラリやツールキットを組み合わせたら
なんだか良く分からないけど答えが出ました,AIができました,と言っているだけの場合が多々あります.
このオセロも「本当に最弱なのか?」「ディープラーニングを使うべきなのか?」をちゃんと考えるべきだと思います
AI事業を行う会社やその社員さんです
- 大域解をちゃんと探索する方法に対して,ディープラーニングは同等(またはそれ以上の)性能が出せるのか?
- そもそも本当に最弱のAIが実現できているのか?(αβ法の方がより弱いAIが作れるのではないか?)
と言った事はちゃんと考えて欲しいものです
少なくとも「とりあえずディープラーニング始めました」じゃその会社に未来はありません
Re:なんでもディープラーニングは良くない (スコア:5, 興味深い)
こんにちは、制作者の吉田です。
興味深い考察ありがとうございます。
おっしゃる通りなんでもかんでも深層学習はよくありませんね。
このことは私もいつも強調しております。
このオセロAIは私が大学時代に興味と勉強のために開発しました。
C++を用いて、ライブラリを使わずにスクラッチで全て組んでいます。
会社としてwebにリリースしたのはただの遊び心ですね。
因みにですが、私の知見では
オセロに関しては深層学習を使わない方が強いAIが誕生します。
また、深層学習を使う場合てもアルファベータ法などの探索は必要です。
Re: (スコア:0)
おお、製作者様降臨ですか。
技術的興味からですが、この処理系は動かすのにどのくらいの計算機資源
が必要なのでしょうか。
Re:なんでもディープラーニングは良くない (スコア:1)
これは1台家庭用パソコンがあれば今と同じ速度で動きます。
大量にリクエストを裁くので、それが数十台あるイメージですね。
実際はAWSのラムダで自動的に振り分けています
Re: (スコア:0)
宣伝戦略について文句を言っても仕方ないのですよ。
技術力があるふりをして素人顧客にアピールしたいのであって、本当に技術力が必要ではない案件なんて山ほどあるんですよ。
今頃になってAIとかディープラーニングとか言ってるのは99%中身不要の宣伝なので、実効性とか言っても無駄。
Re: (スコア:0)
個別の問題に特化したアルゴリズムを人間様が頭をひねって考えなくても、ありもののライブラリを組み合わせて学習結果を放り込むだけで最適の(少なくとも十分最適に近い)解を得られるのがまさにディープラーニングのご利益じゃないの?
Re: (スコア:0)
オセロだとロジステロを思い出すな
Re: (スコア:0)
べつにこの会社はオセロ勝負を追求してノウハウを蓄積したいわけじゃないからなあ
「昔からある強いAI」 vs 「ネットに落ちているライブラリやツールキット」
力説すればするほど、まんまと宣伝に乗せられたオールドスタイルに見える
Re: (スコア:0)
オセロぐらいだったら、全ての手を解析されてても良さそうな物ですが、まだ解析されていないんですね。
回転と反転を使えば全ての手の1/4で解析できる(最初に黒が1手打った状態からスタートすれば良い)から、そんなにリソース必要無い気もするけど。
Re: (スコア:0)
曽呂利新左衛門「81マスではあんまりということでしたら、80マスで結構でございます」
Re: (スコア:0)
ディープラーニングというと多層のニューラルネットを使った学習という意味しかないと認識しているが、
どうも強化学習やMCTSまで込めて呼んでる人たちがいるような
敗北を知りたい? (スコア:1)
無限に勝利を志向するAIの危険性はフィクションノンフィクション問わず何遍も説かれているが、では逆に無限に敗北を志向する接待AIの危険性ってのは存在するんだろうか?
#ただし、このAIにより"AI相手に無限に勝利を志向する
AI以下の人間が増え続ける"という問題については考慮しないものとする要はAIに場を支配されている (スコア:1)
序盤は普通の強いAIと変わらなくて、
気づいたら自分が4つ角を取れるように盤面が支配されている、という感じらしいです。
一人以外は全員敗者
それでもあきらめるより熱くなれ
参りました (スコア:0)
「負けるのが難しいほど弱い」オセロAIなんだろうけど、
どうしてタイトルは「勝つのが難しいほど弱い」になったのか。
Re:参りました (スコア:1)
「はい、こうしておりますと、時々コメントが倍に増えますので」
Re: (スコア:0)
「勝つのが難しいほど弱い」という文を理解しようとすると軽く発狂しそうになる。危険である。
この文を書いた人は軽く発狂しているのではとの疑念を抱く。心配である。
Re: (スコア:0)
一般人 → 誰でも勝てちゃう。負けるの難しい
hylom → なぜか勝てない
↓
「勝つのが難しいほど弱い」
Re: (スコア:0)
タレコミの時点ですでにそうだったから。
逆に考えるんだ。タレコミに妙な改ざんを加えなかったからおかしいのはタイトルだけで済んだと考えるんだ
どっち? (スコア:0)
タイトル>AIで作られた「勝つのが難しいほど弱い」オセロ
本文>負けるのが難しいオセロ
安定のhylomさんクオリティー
Re: (スコア:0)
「(人間が)負けるのが難しいほど弱い」
大安売り (スコア:0)
相手が勝ったり自分が負けたり
Re: (スコア:0)
「タレコミが間違えてる…?
いや、俺が直そうと思うってことは合ってるんだ。
あぶねぇあぶねぇ」
勝つのが難しいほど弱い (スコア:0)
「わたしえーあいちゃん。さんちゃい。まけるとないちゃうので、がんばる」
とか巧みに心理戦を仕掛けで勝つのは大人気ないという雰囲気を醸成する高度AIとかだろうか?
むかしむかし年刊AhSKI!に (スコア:0)
ロセオってゲームが掲載されてた。
自分の色が少ないほうが勝ち。四隅をお互い「どうぞどうぞ」と、相手になんとかして取ってもらおうとする。
最弱オセロで同じことできるね。
Re: (スコア:0)
MSX-FANで同じ作品があったけど、あれ移植だったのかなあ。
https://msx-fan-wiki.appspot.com/view/1278 [appspot.com]
Re: (スコア:0)
AhSKIなつかし.たった30年数年ぐらい前なんだよね.
AhSKIだったかな?他の雑誌だったかな?1手目を打った時点でマイコンに
あなたの負けです,みたいに宣言されるイラストが載ってた気がするけど,
昔は夢だったものが,30年ほどで本当に違う世界になった.
少年探偵団とか読んでても,ネットとスマホのない時代なんて今時の子どもは
想像できないんじゃないかな?
チート? (スコア:0)
打てる場所があるのに自分の順番を飛ばしてこちらに順手をまわしてきますねこれ
®メガハウス (スコア:0)
会社として商標の調査すらしないで公開しちゃうんだ…
乱数で打つと (スコア:0)
配置可能点を乱数で打つと、勝率はどのくらいになるんだろうね
意外にヘボ具合が丁度良かったりして