パスワードを忘れた? アカウント作成

Stable Diffusionなどの画像生成モデル、学習データとほぼ同じ画像を出力することもある」記事へのコメント

  • by Anonymous Coward

    この問題、対処は簡単です。

    AIが生成した画像をクエリにして学習データに似た画像があるかないか画像検索を行うモジュールを追加して、似た画像があればその画像はユーザに見せない、ってやるだけ。

    技術的には、画像検索のアルゴリズムなんていくらでもあって
    例えば20年ぐらい前に流行ったSIFT特徴量みたいな古典的なアルゴリズムを使うだけでも実用レベルで動作します。
    さらに古典的と言ってもハッシュベースの手法だから、クラウド使えば容易に負荷分散できる。スケールアウトできる。

    特許はチェックする必要があるだろうけど、技術的問題は既に全部解決していると言っても過言ではないでしょう。
    つまり、この話は問題提起としては成立しているけど、対処が簡単だから大した脅威にはならないです。

    • by Anonymous Coward on 2023年02月05日 12時54分 (#4405658)

      そう簡単ではない。
      使えば分かるが、対象オブジェクトの生成とレイアウトがどこかで大きく分岐しているので、
      対象オブジェクトは、ほぼどこかのコピペ、但しポーズやレイアウトだけは異なる、
      という二次創作画像が頻繁に生成される。
      「画像全体として似た画像」はなくても、「構成する要素はほぼ元ネタのまま」が出来るだけなので、
      似た画像をカットする手法だけでは、解決にならないと考えられる。

      さらに、手だけ変、みたいな一部分だけが元画像と異なるものも生成されやすく、
      「画像から切り出したオブジェクトデータベースと似たものを外していく」みたいなワークアラウンドだと、
      部分を構成する要素「だけ」が差し替えられていって、「似る」の閾値を超えないぎりぎりまで、
      パーツを変えて生成されていくだけになると想像できる。
      つまり、行きつく先はコラージュになる。
      そのコラージュがどこまで許されるか、というのは私には分からないが。

      以上の話、似た恰好の人物が多数登場する作品名を入力すると、単純ではないことが分かると思う。
      例えば「Dragon Ball Z」と入力してみればいい。

      • by Anonymous Coward

        別ACですが、おすすめの『 dragon ball z 』試してみましたが。。。苦笑いしかできない。

        やはり、特定の作品を指定すると同じものしか出てこないのは、当たり前のことで、『 munch scream 』や『 monalisa picasso 』でも似たような結果。

        毎回毎回違うので、同じ結果とは限りませんが、『 scream of munch, picasso style 』だと近いけれど少し違う。comic とか追加すると別物になった。

        作品名で同じ、似ているモノが出てくるのは避けられないかと。
        あまり似ていなければ、別物だと人間が認識してしまうだろう。

        #だた学習内容に偏りがるのか、日本語が得意で

        • by Anonymous Coward

          NARUTOもお勧め…は置いといて、
          学習内容に偏りがあるのは日本に限らず、
          Apple Logoはほぼそのまま出るのに、
          Power Buttonのアイコンなど、
          規格が決めているものにも関わらず、
          容易に出てこなかったりする。

          英文字はSONYとか容易に出るのに、
          かな漢字は一つも出ないとか、
          記号的なものがアルファベットに特化される形に
          過学習されてしまっている弊害も起きていそう。

      • by Anonymous Coward

        行き着く先と言うか構成要素が初手からコラージュなんでどうしようもない。
        特定がしやすいかしにくいか、それだけでしかない。
        3Dシーンデータ←→二次元画像の変換とかに特化させて、
        有意なシーンデータの生成とか画風の再現を行うシステムならどうにかなり得たけど、
        ディープフェイクに次ぐ高度なコラージュシステムなんてしょーもない物もてはやすからこうなる。
        変換レイヤ一枚足したらそりゃあ難易度も精度もだだ下がりするだろうけど、
        先が全く見えない絶望的難易度ってほどでもないだろうに……

        先走った結果生成系AIで唯一真っ先にクリーンな生成物出せるようになったかもしれない画像生成AI全部にケチがついた。3DCGの知見を活かせるから圧倒的に有利なはずなのに、勿体ない……

        文章系でPerplexity.aiとかは出典示す方向に舵切れてて大変素晴らしいけど、あとはだいたい品質も内容もデータソースもごまかして終わり。しょーもな……

        • by Anonymous Coward

          まだ学習コストが大幅に低減すれば技術としては再構築でなんとかなる可能性はあると思う
          むしろOpenAIやらがブチ込んだコストを回収できるアテがない方が問題かもしれない

          • by Anonymous Coward

            絵描きAIはヘビーに使いたい方には課金とか、GPTならGPTを使うAPIに課金とかしてるんじゃなかったっけ

            上手くやれば競合が乱立するまではボロ儲けできるやもだ

        • by Anonymous Coward

          例えば、どう見たってダリが描いてないだろな「ダリが描いたラーメン」とかは?
          ケチがついてるの?

          3DCGと言えば3Dモデルを出力できるのもあるし、まだまだ色々ある
          ネタはつきないが、もうケチがついた、終わったですとな

          権益面での話はトリアーエズ避けるが、技術面での今後の進歩は予想もつかない。論文フォローとか俺に出来るのかすら判らない位ザクザクある(AIの補助が欲しい)、芸術だけでなく材料とかの方面でも実用はゴリゴリ進んでいる

          俺的には有る意味特異点来てしまったよ。特異点がどうとかは嘲笑う方針だったんだけどね

          • by Anonymous Coward

            分野にも依るので一概には言えないが、
            例えば「John Bon Jovi」の絵を素材に使いたいと思ったとき、
            似顔絵なのか写真なのか、その贋作なのかで権利関係の処理がまったく異なってくる。
            #写真や肖像画には肖像権があるけどありだけど、特徴を捉えた似顔絵に肖像権はない。
             ただし、出版権などほかの権利が設定されている場合はある。
            …いや、Stable Diffusionの「John Bon Jovi」の出力が、本物そっくりなんだよ。
             多分、肖像権ひっかかるレベルで…。

            今回の話は、あくまで「Stable Diffusion」についてのみ、
            権利関係の処理を明確に区別するビジネスにて、
            版元不明な原本を

            • by Anonymous Coward

              調べなくて申し訳ないが、Stable Diffusion側は、出力された画像はStable Diffusion作成者に著作権があるとか、使ったユーザーに著作権があるとか言っているのかね?

              また、既に耳タコになってそうだが、街の絵描きにボンジョビ描いてと言ったら写真を元にスーパーリアルに描かれました、お金を払いました、とどう違うんだ?とか
              ボンジョビ画像を探せとググった場合とどう違うんだ?とか

              まあ街の絵描きではなくて、おおっぴらにネットサービスだから訴訟の対象にはなりそうだけど。

              ChatGPTに助言を頼んだ場合、それが何かのウェブサイトの完コピで、出典を明記していない場合は問題にはなり得るだろう。

              それは実際に起こり得るが、ChatGPT自体が言うように、ChatGPTは機械学習モデルだからなあ。OpenAI側は助言じゃなくて機械学習モデルの出力を表示させてるだけですよ、と言うのかも知れない。

              これでは俺には判断できないねえ。訴訟が出て判例がどうなるか、興味深く見守る事になるかな。

              • by Anonymous Coward

                Getty Imagesが英米で訴訟を開始したので、その結果待ちですね。
                著作物の複製と透かしの無断使用で。

                裁判の争点にはならなさそうですが、
                はたから見ても、少なくともStable Diffusionは複製画像に対して「出版権」を
                行使しているので(Webでサイトにイメージを表示した時点で”出版”となる)、
                著作権を持たないと主張するなら、
                それはそれで、他人の著作物を出版した行為を追及される感じでしょうか。

                街の絵描きは、写真を元にしたら、その写真の肖像権を持っていないなら違反。
                持っているなら、お咎めなし。
                買った人間はを絵描きに権利を有することを確認したか否か、
                確認してだまされたかor知ってて買ったか、などの違いで、
                善意の第三者かどうかが裁判(になったらそ)の争点になるでしょう。

                AIが関わったからといって、その過程で判決の見通しがすべて曖昧になるわけではありません。
                「モデル」の作成までに違法行為が認定されれば、「モデル」とその出力に使用停止命令が
                出るのは当然のことです。

              • by Anonymous Coward

                追記すると、Stable Diffusionの違法行為が認定されたとき、無料で使って得たコンテンツをバラまいたユーザーは、侵害コンテンツをダウンロードした形になり…つまり、今の著作権法では違法行為をしたことになります。
                だまされたと主張することで罰は逃れることが出来る可能性がありますが(…違法の可能性あり、と予見できないことが証明できれば…今回の論文を根拠にその主張は認められない可能性もある…)、ばらまいた先からのコンテンツを回収する命令が出るでしょう。その回収にかかる費用は、本来ならStable Diffusion側に請求するものになりますが

              • by Anonymous Coward

                まあ俺は使ってないですが

                https://gigazine.net/news/20221214-laion-5b-new-era-datasets/ [gigazine.net]

                元データの記事。さて、ここにボンジョビ元画像などがあるのだろうけど、これの配布はフェアユースになるのか?あるいは使用にあたっては研究用に限定しろとか、ただし書きがあるのか?

                stable diffusion側は、出力画像をどう使うべしと言っているんだろう?いずれにせよ、ネズミ帝国関連画像とかあったら何がなんでもネズミ帝国に訴訟に持ち込まれそうで

              • by Anonymous Coward

                続き:
                検索エンジンの場合はこのような議論があったそうですね。
                https://blogs.itmedia.co.jp/kurikiyo/2008/06/faq-127a.html [itmedia.co.jp]

              • by Anonymous Coward

                続き2:
                後は、一般ユーザーがstable diffusionの出力をばらまいた場合はどうなるか?

                「stable diffusionの出力に元画像ほぼそのものがある可能性がある」事を知っていたとして、それがどのくらいの頻度で起こっているのか?というところも争点になるのですかね?
                どんどんばら蒔けと言いたい訳ではないですが。

                加工せずにばらまいた一般人の場合は、そんなに厳しく追及されますかね?

                それより著作権的に問題のある「配布」はネット上に多々あるような気もしますし、それをまず取り締まれよ、とも思いますけれども

「科学者は100%安全だと保証できないものは動かしてはならない」、科学者「えっ」、プログラマ「えっ」

処理中...