パスワードを忘れた? アカウント作成
13969322 story
ゲーム

AIで作られた「勝つのが難しいほど弱い」オセロ 74

ストーリー by hylom
逆方向に強い 部門より

Suzuno曰く、

深層強化学習(ディープラーニング)技術を使って作られた、負けるのが難しいオセロという「最弱オセロ」なるオセロAIがGame*Sparkで取り上げられていました。

確かにロジック的には、相手の手に対応した「勝つための最善手」も「負けるための最善手」も計算コストは大差ないだろうことは想像できます。

でも実際に遊んでみると、強いオセロは「強い」という印象しかないのに対して、負けるオセロは「手のひらで転がされてる」ような気分がして、不思議なものです(あくまで個人の感想です)

AI関連事業を行うAVILENが公開したもので、「強いオセロ」も公開されている(開発者のTweet)。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • ・盤に石が増え続けるのみなので、不利な手を打っても(将棋や囲碁のように)取られたり減ったりしない。
    まずこの特徴で、最弱オセロは通常のルール上でゲームが破綻しない。
    そして、
    ・相手の石を返さないといけない(盤面上不可能な場合は除く)ため、不利な手はあっても直接に自虐する手は無い。
    ・相手が自分の石を返すことでのみ負けにつながるため、相手を「自分の石を返さざるを得ない」状況に追い込むことが求められる。
    ・オセロは終盤に向けて、相手の手を狭めていく戦法となる。
    といった特徴から、「手のひらで転がされてる」ようなプレイ感に導かれる。

  • by kicchy (4711) on 2019年07月29日 17時35分 (#3660054)

    接待業界から本当に求められているのはただ負けるAIだけじゃなく
    僅差で負けるための選択だと思う

    • by Anonymous Coward on 2019年07月29日 17時41分 (#3660062)

      HAL9000のチェスは、勝率50%になるように調整されていたそうで
      人は気が付かないふりをしているのだった

      親コメント
    • by Anonymous Coward

      「かなりの強敵で前半では負けそうになってたんだけど、土壇場で大逆転したんだ。」
      と思わせる接待麻雀AIとかどうだろう。

      毎回同じように苦戦するとだめなので、苦戦のしかたも毎回パターンを変える。
      これは難しいぞ

    • by Anonymous Coward

      忖度と言うより接待モードな気が。

      接待と言えばマージャン。マージャンと言えばゲーセンの脱衣ってことで、接待モードが有ったら受けそう。
      はっ。その辺を上手く使って客単価の最大化とかできるんじゃないかな。

  • by Anonymous Coward on 2019年07月29日 17時49分 (#3660070)

    強い人と指すと終盤は打てる場所がほぼ無くなり、途中からパス連続になったり、打てる時も1ヵ所しかなくて「打たされる」のだよね。

    このオセロの場合も、こちらの打てる場所がほぼ無くなり「打たされる」状態になるので、勝っても「自分が強い」という気持ちにはなれそうにないなぁ。

    • by Anonymous Coward on 2019年07月29日 18時14分 (#3660089)

      勝ち負けを反転したルールで考えて対局してみれば、なかなかの「強さ」であることがわかりますね。

      親コメント
    • by Anonymous Coward

      そういえば、AlphaGo や AlphaGo Zero、DeepZenGo など、人間に勝つ碁のプログラムは
      いくつも出てきたが、こいつらは、ヒカルの碁で塔矢アキラがやったような、わざと持碁に
      持って行くようなことはできるのだろうか。

      アマチュアだと、普通に考えられないようなとんでもない悪手を打ったり、
      深く考えずに好手を打ったりするので、相手の棋力を量って対応しないといけない。
      棋士にはできても、コンピュータにはまだまだ難しいような気がするけど。

      • by Anonymous Coward
        引き分けの評価点が高くなるような教師信号で学習させるだけじゃないの
        囲碁のシステム上、盤面は見えている以上の過去の情報を覚えているわけじゃないから、アマチュアが打ったまぐれの一手も、プロが熟考の末に打った手も同じ手なら結果は同じだしね
        • by Anonymous Coward

          ところが囲碁は終盤になるほど自由度が減るので、相手の打った手に対して
          持碁にする手を打つという戦略だと、どうやっても持碁にならなくなってくる。

          例えば、一目差でこっちが勝っているとき、相手が一目得するような手を
          こちらが打ったとしても、相手がそれに気がついてくれなければ、持碁に出来ない。
          プロ棋士なんかが、持碁にしようとする場合、ヘボ相手なら見え見えの手で、
          ある程度強い相手なら手筋を使うと持碁になるような形にするだろう。

          このあたりは、コンピュータがそれまでに打った手から相手の強さを推し量り、
          相手の考えを読むことが出来るようにならないと、出来るようにはならないのではないかな。

          # ただし、相手の地に意味のない石を置くような、あからさまな手段をとるなら別

  • by kcg (26566) on 2019年07月29日 17時56分 (#3660077) ホームページ 日記

    自分の色が最終的に少ないほうが勝ち
    というルールのゲームである
    と先に定義して、
    競争して得たほうが「勝ち」という部分は変えないようにしないと、
    負けを競うのではなくて、少ないほうが勝ちとすれば、
    たんにそういう新しいルールで勝つAIという説明でシンプルに話せるのに。

    と思った。

    • by Anonymous Coward on 2019年07月29日 19時40分 (#3660123)

      オセロ強い人ならやってみれば分かるが序盤普通に定石打ってくる

      初心者は勘違いしやすいがオセロ序盤は手数の取り合い
      打てる箇所多い方が有利で石の数が多い方が有利じゃない

      序盤は普通に勝つ動きをしていて自分の手数多くして中盤あたりから
      自分が不利に打たせるように制限かけてくる印象だな
      このへんの切り替えどうしてるのか気になる

      印象が違うのは手数が重要と知らないからだと思う
      俺からすると最初から強い動きの人と戦ってる感じ

      親コメント
      • by Anonymous Coward

        切り替えているわけではなくて、手数の多いほうが勝つにも負けるにも有利という点から、自然と序盤の定石は同じになったのでしょう。

        • by Anonymous Coward

          いやそれは分かってるよ

          分かりづらくてすまんが
          「切り替え」は中盤で悪手相当の手を打つわけだけど、そのタイミングをどう判定してるのかで言った
          序盤の勝つ動きから中盤のどのタイミングで負けさせる動きに切り替えてるのか気になった

          あと悪手の中でも良い悪手(石の返し最少で手数で勝ちつつ、相手に有利位置をとらせる)と
          悪い悪手(石返しすぎて、手数の関係上、対戦相手に返されて最終的に自分が有利な位置とらされる)
          がありそうだがその辺どう評価してるのかも気になる

          • by Anonymous Coward

            ディープラーニングのことよく知らなくてすみませんが、
            「切り換え」とか「タイミング」とか「判定」とかあるんですかね?

    • by Anonymous Coward

      うん、通常ルールでの勝ち負けというより、少ない方が勝ちルールで遊んでいるような気分だった。
      # あと、白番やらせろよ、と

  • 戦いには“愛”こそが必要
    人を喜ばせることと倒すことは、相手の意図を読む事では表裏一体

    • by Anonymous Coward

      戦いには“愛”こそが必要

      人を喜ばせることと倒すことは、相手の意図を読む事では表裏一体

      まさにAI故に人は迷うのですね

  • オセロぐらいなら,ディープラーニングを使わなくても昔から強いAIが作れています.例えばMinMax法とかαβ法といったアルゴリズムを使うものです.
    https://en.wikipedia.org/wiki/Minimax [wikipedia.org]
    https://en.wikipedia.org/wiki/Alpha_beta_pruning [wikipedia.org]

    最近よく「ディープラーニングを使いました」という話を聞きます.
    しかし詳しく話を聞いてみると,とりあえずネットに落ちているライブラリやツールキットを組み合わせたら
    なんだか良く分からないけど答えが出ました,AIができました,と言っているだけの場合が多々あります.

    このオセロも「本当に最弱なのか?」「ディープラーニングを使うべきなのか?」をちゃんと考えるべきだと思います

    AI事業を行う会社やその社員さんです
    - 大域解をちゃんと探索する方法に対して,ディープラーニングは同等(またはそれ以上の)性能が出せるのか?
    - そもそも本当に最弱のAIが実現できているのか?(αβ法の方がより弱いAIが作れるのではないか?)
    と言った事はちゃんと考えて欲しいものです

    少なくとも「とりあえずディープラーニング始めました」じゃその会社に未来はありません

    • by Anonymous Coward on 2019年07月29日 22時17分 (#3660194)

      こんにちは、制作者の吉田です。
      興味深い考察ありがとうございます。
      おっしゃる通りなんでもかんでも深層学習はよくありませんね。
      このことは私もいつも強調しております。
      このオセロAIは私が大学時代に興味と勉強のために開発しました。
      C++を用いて、ライブラリを使わずにスクラッチで全て組んでいます。
      会社としてwebにリリースしたのはただの遊び心ですね。

      因みにですが、私の知見では
      オセロに関しては深層学習を使わない方が強いAIが誕生します。
      また、深層学習を使う場合てもアルファベータ法などの探索は必要です。

      親コメント
      • by Anonymous Coward

        おお、製作者様降臨ですか。
        技術的興味からですが、この処理系は動かすのにどのくらいの計算機資源
        が必要なのでしょうか。

    • by Anonymous Coward

      宣伝戦略について文句を言っても仕方ないのですよ。
      技術力があるふりをして素人顧客にアピールしたいのであって、本当に技術力が必要ではない案件なんて山ほどあるんですよ。
      今頃になってAIとかディープラーニングとか言ってるのは99%中身不要の宣伝なので、実効性とか言っても無駄。

    • by Anonymous Coward

      個別の問題に特化したアルゴリズムを人間様が頭をひねって考えなくても、ありもののライブラリを組み合わせて学習結果を放り込むだけで最適の(少なくとも十分最適に近い)解を得られるのがまさにディープラーニングのご利益じゃないの?

    • by Anonymous Coward

      オセロだとロジステロを思い出すな

    • by Anonymous Coward

      べつにこの会社はオセロ勝負を追求してノウハウを蓄積したいわけじゃないからなあ

      「昔からある強いAI」 vs 「ネットに落ちているライブラリやツールキット」

      力説すればするほど、まんまと宣伝に乗せられたオールドスタイルに見える

    • by Anonymous Coward

      オセロぐらいだったら、全ての手を解析されてても良さそうな物ですが、まだ解析されていないんですね。
      回転と反転を使えば全ての手の1/4で解析できる(最初に黒が1手打った状態からスタートすれば良い)から、そんなにリソース必要無い気もするけど。

      • by Anonymous Coward

        曽呂利新左衛門「81マスではあんまりということでしたら、80マスで結構でございます」

    • by Anonymous Coward

      ディープラーニングというと多層のニューラルネットを使った学習という意味しかないと認識しているが、
      どうも強化学習やMCTSまで込めて呼んでる人たちがいるような

  • 無限に勝利を志向するAIの危険性はフィクションノンフィクション問わず何遍も説かれているが、では逆に無限に敗北を志向する接待AIの危険性ってのは存在するんだろうか?

    #ただし、このAIにより"AI相手に無限に勝利を志向するAI以下の人間が増え続ける"という問題については考慮しないものとする

  • 序盤は普通の強いAIと変わらなくて、
    気づいたら自分が4つ角を取れるように盤面が支配されている、という感じらしいです。

    --
    一人以外は全員敗者
    それでもあきらめるより熱くなれ
  • by Anonymous Coward on 2019年07月29日 17時49分 (#3660071)

    「負けるのが難しいほど弱い」オセロAIなんだろうけど、
    どうしてタイトルは「勝つのが難しいほど弱い」になったのか。

    • by Anonymous Coward on 2019年07月29日 19時13分 (#3660110)

      「はい、こうしておりますと、時々コメントが倍に増えますので」

      親コメント
    • by Anonymous Coward

      「勝つのが難しいほど弱い」という文を理解しようとすると軽く発狂しそうになる。危険である。
      この文を書いた人は軽く発狂しているのではとの疑念を抱く。心配である。

    • by Anonymous Coward

      一般人 → 誰でも勝てちゃう。負けるの難しい
      hylom → なぜか勝てない

      「勝つのが難しいほど弱い」

    • by Anonymous Coward

      タレコミの時点ですでにそうだったから。
      逆に考えるんだ。タレコミに妙な改ざんを加えなかったからおかしいのはタイトルだけで済んだと考えるんだ

  • by Anonymous Coward on 2019年07月29日 17時50分 (#3660074)

    タイトル>AIで作られた「勝つのが難しいほど弱い」オセロ

    本文>負けるのが難しいオセロ

    安定のhylomさんクオリティー

    • by Anonymous Coward
      「(AIが)勝野が難しいほど弱い」
      「(人間が)負けるのが難しいほど弱い」
    • by Anonymous Coward

      相手が勝ったり自分が負けたり

    • by Anonymous Coward

      「タレコミが間違えてる…?
       いや、俺が直そうと思うってことは合ってるんだ。
       あぶねぇあぶねぇ」

  • by Anonymous Coward on 2019年07月29日 17時59分 (#3660078)

    「わたしえーあいちゃん。さんちゃい。まけるとないちゃうので、がんばる」
    とか巧みに心理戦を仕掛けで勝つのは大人気ないという雰囲気を醸成する高度AIとかだろうか?

  • by Anonymous Coward on 2019年07月29日 18時01分 (#3660080)

    ロセオってゲームが掲載されてた。
    自分の色が少ないほうが勝ち。四隅をお互い「どうぞどうぞ」と、相手になんとかして取ってもらおうとする。
     
    最弱オセロで同じことできるね。

    • by Anonymous Coward

      MSX-FANで同じ作品があったけど、あれ移植だったのかなあ。
      https://msx-fan-wiki.appspot.com/view/1278 [appspot.com]

    • by Anonymous Coward

      AhSKIなつかし.たった30年数年ぐらい前なんだよね.
      AhSKIだったかな?他の雑誌だったかな?1手目を打った時点でマイコンに
      あなたの負けです,みたいに宣言されるイラストが載ってた気がするけど,
      昔は夢だったものが,30年ほどで本当に違う世界になった.
      少年探偵団とか読んでても,ネットとスマホのない時代なんて今時の子どもは
      想像できないんじゃないかな?

  • by Anonymous Coward on 2019年07月29日 21時34分 (#3660177)

    打てる場所があるのに自分の順番を飛ばしてこちらに順手をまわしてきますねこれ

  • by Anonymous Coward on 2019年07月29日 22時51分 (#3660209)

    会社として商標の調査すらしないで公開しちゃうんだ…

  • by Anonymous Coward on 2019年07月29日 23時23分 (#3660229)

    配置可能点を乱数で打つと、勝率はどのくらいになるんだろうね
    意外にヘボ具合が丁度良かったりして

typodupeerror

目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond

読み込み中...