AIで作られた「勝つのが難しいほど弱い」オセロ

AIで作られた「勝つのが難しいほど弱い」オセロ 74

ストーリー by hylom 2019年07月29日 17時32分
逆方向に強い部門より

Suzuno曰く、

深層強化学習（ディープラーニング）技術を使って作られた、負けるのが難しいオセロという「最弱オセロ」なるオセロAIがGame*Sparkで取り上げられていました。

確かにロジック的には、相手の手に対応した「勝つための最善手」も「負けるための最善手」も計算コストは大差ないだろうことは想像できます。

でも実際に遊んでみると、強いオセロは「強い」という印象しかないのに対して、負けるオセロは「手のひらで転がされてる」ような気分がして、不思議なものです（あくまで個人の感想です）

AI関連事業を行うAVILENが公開したもので、「強いオセロ」も公開されている（開発者のTweet）。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索74コメント Log In/Create an Account

オセロはわざと負けを狙ってもゲームが破綻しない (スコア:4, 参考になる)

by minet (45149) on 2019年07月29日 18時06分 (#3660082) 日記

・盤に石が増え続けるのみなので、不利な手を打っても（将棋や囲碁のように）取られたり減ったりしない。
まずこの特徴で、最弱オセロは通常のルール上でゲームが破綻しない。
そして、
・相手の石を返さないといけない（盤面上不可能な場合は除く）ため、不利な手はあっても直接に自虐する手は無い。
・相手が自分の石を返すことでのみ負けにつながるため、相手を「自分の石を返さざるを得ない」状況に追い込むことが求められる。
・オセロは終盤に向けて、相手の手を狭めていく戦法となる。
といった特徴から、「手のひらで転がされてる」ようなプレイ感に導かれる。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  黒か白の一色になって，途中で終了となる手もあるんだよね？
  - Re:オセロはわざと負けを狙ってもゲームが破綻しない (スコア:1)
    
    by Anonymous Coward on 2019年07月29日 18時50分 (#3660102)
    
    このオセロは途中での終了と、打ち切って64子完敗のどっちを「より負けている」と認識しているのだろう？
    
    シェア
    
    親コメント
SONTAKU MODULE (スコア:2)

by kicchy (4711) on 2019年07月29日 17時35分 (#3660054)

接待業界から本当に求められているのはただ負けるAIだけじゃなく
僅差で負けるための選択だと思う
- Re:SONTAKU MODULE (スコア:1)
  
  by Anonymous Coward on 2019年07月29日 17時41分 (#3660062)
  
  HAL9000のチェスは、勝率50%になるように調整されていたそうで
  人は気が付かないふりをしているのだった
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  「かなりの強敵で前半では負けそうになってたんだけど、土壇場で大逆転したんだ。」
  と思わせる接待麻雀AIとかどうだろう。
  毎回同じように苦戦するとだめなので、苦戦のしかたも毎回パターンを変える。
  これは難しいぞ
- Re: (スコア:0)
  
  by Anonymous Coward
  
  忖度と言うより接待モードな気が。
  接待と言えばマージャン。マージャンと言えばゲーセンの脱衣ってことで、接待モードが有ったら受けそう。
  はっ。その辺を上手く使って客単価の最大化とかできるんじゃないかな。
強い人が弱く指している感じ (スコア:2, 興味深い)

by Anonymous Coward on 2019年07月29日 17時49分 (#3660070)

強い人と指すと終盤は打てる場所がほぼ無くなり、途中からパス連続になったり、打てる時も１ヵ所しかなくて「打たされる」のだよね。
このオセロの場合も、こちらの打てる場所がほぼ無くなり「打たされる」状態になるので、勝っても「自分が強い」という気持ちにはなれそうにないなぁ。
- Re:強い人が弱く指している感じ (スコア:1)
  
  by Anonymous Coward on 2019年07月29日 18時14分 (#3660089)
  
  勝ち負けを反転したルールで考えて対局してみれば、なかなかの「強さ」であることがわかりますね。
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  そういえば、AlphaGo や AlphaGo Zero、DeepZenGo など、人間に勝つ碁のプログラムは
  いくつも出てきたが、こいつらは、ヒカルの碁で塔矢アキラがやったような、わざと持碁に
  持って行くようなことはできるのだろうか。
  アマチュアだと、普通に考えられないようなとんでもない悪手を打ったり、
  深く考えずに好手を打ったりするので、相手の棋力を量って対応しないといけない。
  棋士にはできても、コンピュータにはまだまだ難しいような気がするけど。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    引き分けの評価点が高くなるような教師信号で学習させるだけじゃないの
    囲碁のシステム上、盤面は見えている以上の過去の情報を覚えているわけじゃないから、アマチュアが打ったまぐれの一手も、プロが熟考の末に打った手も同じ手なら結果は同じだしね
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      ところが囲碁は終盤になるほど自由度が減るので、相手の打った手に対して
      持碁にする手を打つという戦略だと、どうやっても持碁にならなくなってくる。
      例えば、一目差でこっちが勝っているとき、相手が一目得するような手を
      こちらが打ったとしても、相手がそれに気がついてくれなければ、持碁に出来ない。
      プロ棋士なんかが、持碁にしようとする場合、ヘボ相手なら見え見えの手で、
      ある程度強い相手なら手筋を使うと持碁になるような形にするだろう。
      このあたりは、コンピュータがそれまでに打った手から相手の強さを推し量り、
      相手の考えを読むことが出来るようにならないと、出来るようにはならないのではないかな。
      # ただし、相手の地に意味のない石を置くような、あからさまな手段をとるなら別
違うゲーム (スコア:2)

by kcg (26566) on 2019年07月29日 17時56分 (#3660077) ホームページ日記

自分の色が最終的に少ないほうが勝ち
というルールのゲームである
と先に定義して、
競争して得たほうが「勝ち」という部分は変えないようにしないと、
負けを競うのではなくて、少ないほうが勝ちとすれば、
たんにそういう新しいルールで勝つAIという説明でシンプルに話せるのに。
と思った。
- 面白い (スコア:1)
  
  by Anonymous Coward on 2019年07月29日 19時40分 (#3660123)
  
  オセロ強い人ならやってみれば分かるが序盤普通に定石打ってくる
  初心者は勘違いしやすいがオセロ序盤は手数の取り合い
  打てる箇所多い方が有利で石の数が多い方が有利じゃない
  序盤は普通に勝つ動きをしていて自分の手数多くして中盤あたりから
  自分が不利に打たせるように制限かけてくる印象だな
  このへんの切り替えどうしてるのか気になる
  印象が違うのは手数が重要と知らないからだと思う
  俺からすると最初から強い動きの人と戦ってる感じ
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    切り替えているわけではなくて、手数の多いほうが勝つにも負けるにも有利という点から、自然と序盤の定石は同じになったのでしょう。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      いやそれは分かってるよ
      分かりづらくてすまんが
      「切り替え」は中盤で悪手相当の手を打つわけだけど、そのタイミングをどう判定してるのかで言った
      序盤の勝つ動きから中盤のどのタイミングで負けさせる動きに切り替えてるのか気になった
      あと悪手の中でも良い悪手（石の返し最少で手数で勝ちつつ、相手に有利位置をとらせる）と
      悪い悪手（石返しすぎて、手数の関係上、対戦相手に返されて最終的に自分が有利な位置とらされる）
      がありそうだがその辺どう評価してるのかも気になる
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        ディープラーニングのことよく知らなくてすみませんが、
        「切り換え」とか「タイミング」とか「判定」とかあるんですかね？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  うん、通常ルールでの勝ち負けというより、少ない方が勝ちルールで遊んでいるような気分だった。
  # あと、白番やらせろよ、と
  - Re:違うゲーム (スコア:1)
    
    by Anonymous Coward on 2019年07月30日 8時56分 (#3660323)
    
    白番やらせたら、2窓でCPU同士を対戦させる人が大量に出て勝率のカウンタが破綻するから・・・
    
    シェア
    
    親コメント
格闘マンガの刃牙シリーズにそんなの居た (スコア:2)

by Takahiro_Chou (21972) on 2019年07月29日 21時27分 (#3660176) 日記

戦いには“愛”こそが必要
人を喜ばせることと倒すことは、相手の意図を読む事では表裏一体
- Re: (スコア:0)
  
  by Anonymous Coward
  
  戦いには“愛”こそが必要
  人を喜ばせることと倒すことは、相手の意図を読む事では表裏一体
  まさにAI故に人は迷うのですね
なんでもディープラーニングは良くない (スコア:1)

by annoymouse coward (11178) on 2019年07月29日 18時24分 (#3660092) 日記

オセロぐらいなら，ディープラーニングを使わなくても昔から強いAIが作れています．例えばMinMax法とかαβ法といったアルゴリズムを使うものです．
https://en.wikipedia.org/wiki/Minimax [wikipedia.org]
https://en.wikipedia.org/wiki/Alpha_beta_pruning [wikipedia.org]
最近よく「ディープラーニングを使いました」という話を聞きます．
しかし詳しく話を聞いてみると，とりあえずネットに落ちているライブラリやツールキットを組み合わせたら
なんだか良く分からないけど答えが出ました，AIができました，と言っているだけの場合が多々あります．
このオセロも「本当に最弱なのか？」「ディープラーニングを使うべきなのか？」をちゃんと考えるべきだと思います
AI事業を行う会社やその社員さんです
- 大域解をちゃんと探索する方法に対して，ディープラーニングは同等（またはそれ以上の）性能が出せるのか？
- そもそも本当に最弱のAIが実現できているのか？(αβ法の方がより弱いAIが作れるのではないか？)
と言った事はちゃんと考えて欲しいものです
少なくとも「とりあえずディープラーニング始めました」じゃその会社に未来はありません
- Re:なんでもディープラーニングは良くない (スコア:5, 興味深い)
  
  by Anonymous Coward on 2019年07月29日 22時17分 (#3660194)
  
  こんにちは、制作者の吉田です。
  興味深い考察ありがとうございます。
  おっしゃる通りなんでもかんでも深層学習はよくありませんね。
  このことは私もいつも強調しております。
  このオセロAIは私が大学時代に興味と勉強のために開発しました。
  C++を用いて、ライブラリを使わずにスクラッチで全て組んでいます。
  会社としてwebにリリースしたのはただの遊び心ですね。
  因みにですが、私の知見では
  オセロに関しては深層学習を使わない方が強いAIが誕生します。
  また、深層学習を使う場合てもアルファベータ法などの探索は必要です。
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    おお、製作者様降臨ですか。
    技術的興味からですが、この処理系は動かすのにどのくらいの計算機資源
    が必要なのでしょうか。
    - Re:なんでもディープラーニングは良くない (スコア:1)
      
      by Anonymous Coward on 2019年07月29日 23時50分 (#3660236)
      
      これは1台家庭用パソコンがあれば今と同じ速度で動きます。
      大量にリクエストを裁くので、それが数十台あるイメージですね。
      実際はAWSのラムダで自動的に振り分けています
      
      シェア
      
      親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  宣伝戦略について文句を言っても仕方ないのですよ。
  技術力があるふりをして素人顧客にアピールしたいのであって、本当に技術力が必要ではない案件なんて山ほどあるんですよ。
  今頃になってAIとかディープラーニングとか言ってるのは99％中身不要の宣伝なので、実効性とか言っても無駄。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  個別の問題に特化したアルゴリズムを人間様が頭をひねって考えなくても、ありもののライブラリを組み合わせて学習結果を放り込むだけで最適の(少なくとも十分最適に近い)解を得られるのがまさにディープラーニングのご利益じゃないの?
- Re: (スコア:0)
  
  by Anonymous Coward
  
  オセロだとロジステロを思い出すな
- Re: (スコア:0)
  
  by Anonymous Coward
  
  べつにこの会社はオセロ勝負を追求してノウハウを蓄積したいわけじゃないからなあ
  「昔からある強いAI」 vs 「ネットに落ちているライブラリやツールキット」
  力説すればするほど、まんまと宣伝に乗せられたオールドスタイルに見える
- Re: (スコア:0)
  
  by Anonymous Coward
  
  オセロぐらいだったら、全ての手を解析されてても良さそうな物ですが、まだ解析されていないんですね。
  回転と反転を使えば全ての手の1/4で解析できる(最初に黒が1手打った状態からスタートすれば良い)から、そんなにリソース必要無い気もするけど。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    曽呂利新左衛門「81マスではあんまりということでしたら、80マスで結構でございます」
- Re: (スコア:0)
  
  by Anonymous Coward
  
  ディープラーニングというと多層のニューラルネットを使った学習という意味しかないと認識しているが、
  どうも強化学習やMCTSまで込めて呼んでる人たちがいるような
敗北を知りたい？ (スコア:1)

by EnergyField (42789) on 2019年07月30日 0時34分 (#3660250) 日記

無限に勝利を志向するAIの危険性はフィクションノンフィクション問わず何遍も説かれているが、では逆に無限に敗北を志向する接待AIの危険性ってのは存在するんだろうか？
#ただし、このAIにより"AI相手に無限に勝利を志向する~~AI以下の~~人間が増え続ける"という問題については考慮しないものとする
要はAIに場を支配されている (スコア:1)

by EchoRelinquish (35648) <reversethis-{moc.liamg} {ta} {4492ohce}> on 2019年07月30日 11時10分 (#3660409) 日記

序盤は普通の強いAIと変わらなくて、
気づいたら自分が4つ角を取れるように盤面が支配されている、という感じらしいです。

--
一人以外は全員敗者
それでもあきらめるより熱くなれ
参りました (スコア:0)

by Anonymous Coward on 2019年07月29日 17時49分 (#3660071)

「負けるのが難しいほど弱い」オセロAIなんだろうけど、
どうしてタイトルは「勝つのが難しいほど弱い」になったのか。
- Re:参りました (スコア:1)
  
  by Anonymous Coward on 2019年07月29日 19時13分 (#3660110)
  
  「はい、こうしておりますと、時々コメントが倍に増えますので」
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  「勝つのが難しいほど弱い」という文を理解しようとすると軽く発狂しそうになる。危険である。
  この文を書いた人は軽く発狂しているのではとの疑念を抱く。心配である。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  一般人　→　誰でも勝てちゃう。負けるの難しい
  hylom　→　なぜか勝てない
  ↓
  「勝つのが難しいほど弱い」
- Re: (スコア:0)
  
  by Anonymous Coward
  
  タレコミの時点ですでにそうだったから。
  逆に考えるんだ。タレコミに妙な改ざんを加えなかったからおかしいのはタイトルだけで済んだと考えるんだ
どっち？ (スコア:0)

by Anonymous Coward on 2019年07月29日 17時50分 (#3660074)

タイトル＞AIで作られた「勝つのが難しいほど弱い」オセロ
本文＞負けるのが難しいオセロ
安定のhylomさんクオリティー
- Re: (スコア:0)
  
  by Anonymous Coward
  
  「(AIが)勝野が難しいほど弱い」
  「(人間が)負けるのが難しいほど弱い」
- 大安売り (スコア:0)
  
  by Anonymous Coward
  
  相手が勝ったり自分が負けたり
- Re: (スコア:0)
  
  by Anonymous Coward
  
  「タレコミが間違えてる…？
  　いや、俺が直そうと思うってことは合ってるんだ。
  　あぶねぇあぶねぇ」
勝つのが難しいほど弱い (スコア:0)

by Anonymous Coward on 2019年07月29日 17時59分 (#3660078)

「わたしえーあいちゃん。さんちゃい。まけるとないちゃうので、がんばる」
とか巧みに心理戦を仕掛けで勝つのは大人気ないという雰囲気を醸成する高度AIとかだろうか？
むかしむかし年刊AhSKI!に (スコア:0)

by Anonymous Coward on 2019年07月29日 18時01分 (#3660080)

ロセオってゲームが掲載されてた。
自分の色が少ないほうが勝ち。四隅をお互い「どうぞどうぞ」と、相手になんとかして取ってもらおうとする。
　
最弱オセロで同じことできるね。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  MSX-FANで同じ作品があったけど、あれ移植だったのかなあ。
  https://msx-fan-wiki.appspot.com/view/1278 [appspot.com]
- Re: (スコア:0)
  
  by Anonymous Coward
  
  AhSKIなつかし．たった30年数年ぐらい前なんだよね．
  AhSKIだったかな？他の雑誌だったかな？1手目を打った時点でマイコンに
  あなたの負けです，みたいに宣言されるイラストが載ってた気がするけど，
  昔は夢だったものが，30年ほどで本当に違う世界になった．
  少年探偵団とか読んでても，ネットとスマホのない時代なんて今時の子どもは
  想像できないんじゃないかな？
チート？ (スコア:0)

by Anonymous Coward on 2019年07月29日 21時34分 (#3660177)

打てる場所があるのに自分の順番を飛ばしてこちらに順手をまわしてきますねこれ
®メガハウス (スコア:0)

by Anonymous Coward on 2019年07月29日 22時51分 (#3660209)

会社として商標の調査すらしないで公開しちゃうんだ…
乱数で打つと (スコア:0)

by Anonymous Coward on 2019年07月29日 23時23分 (#3660229)

配置可能点を乱数で打つと、勝率はどのくらいになるんだろうね
意外にヘボ具合が丁度良かったりして

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

オセロはわざと負けを狙ってもゲームが破綻しない (スコア:4, 参考になる)

Re: (スコア:0)

Re:オセロはわざと負けを狙ってもゲームが破綻しない (スコア:1)

SONTAKU MODULE (スコア:2)

Re:SONTAKU MODULE (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

強い人が弱く指している感じ (スコア:2, 興味深い)

Re:強い人が弱く指している感じ (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

違うゲーム (スコア:2)

面白い (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:違うゲーム (スコア:1)

格闘マンガの刃牙シリーズにそんなの居た (スコア:2)

Re: (スコア:0)

なんでもディープラーニングは良くない (スコア:1)

Re:なんでもディープラーニングは良くない (スコア:5, 興味深い)

Re: (スコア:0)

Re:なんでもディープラーニングは良くない (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

敗北を知りたい？ (スコア:1)

要はAIに場を支配されている (スコア:1)

参りました (スコア:0)

Re:参りました (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

どっち？ (スコア:0)

Re: (スコア:0)

大安売り (スコア:0)

Re: (スコア:0)

勝つのが難しいほど弱い (スコア:0)

むかしむかし年刊AhSKI!に (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

チート？ (スコア:0)

®メガハウス (スコア:0)

乱数で打つと (スコア:0)