アカウント名:
パスワード:
超解像度技術がAIによる類推より本物、ってのはどんな発想なんだろう?
超解像技術を魔法かなんかだと思ってるんだろうか
失われた情報は元には戻らん。実写を前提に時間軸方向も加味した上での単なる補完であって、復元じゃない。
> 失われた情報は元には戻らん。
モザイクだけじゃ復元できません.おっしゃるように情報が失われているからです.
しかし,学習データの形で「無修正画像」と「それにモザイクを掛けた画像」を用意し,その学習データの数を増やしていくと,つまり頑張ってディープラーニングをすると,失われた情報を補うことができるようになります.
これが機械学習によるモザイク除去(超解像)の仕組みです.
つまりモザイク除去アルゴリズムへの入力は(モザイク画像+膨大な学習用画像)なのです.学習用画像の分だけ情報量が増えているので,モザイクとして失われた情報が補える訳です.
お尻なら同一ソースで学習可能でしょうけど。学習対象を偏らせれば、好みの復元が出来るかも?# 学習データどうするんだ。
モザイクをかける側にもAIつかったらどうなるの?
そのうちにAIがAvつくってAIがAVにモザイクかけてAIがAVを販売してAIがAVを購入してAIがAVのモザイク除去してAIがAV見て人間はそんなAI見て興奮するようになるわけですね
だからそれは補完であって復元ではない。
このスレッドの大本で言ってるのは「超解像が類推より本物」かどうか、つまり本物か偽物か、という問題。補完か復元かで争うのは論点がずれてると思いますね。
あとは、以下は、今回のストーリーのソフトウェアが何をやっているかの話ではなく、技術的実現性の話として、「本当の超解像」が出力する画像が「本物か偽物か」についての話です。
たとえば「建物だけの写真」が欲しいけど、手前に通行人が映り込んだものしかなかった時に、人物に隠れた部分を、「他の箇所からコピペ」とか「似たような別の建物の写真からコピペ」したら、これは「偽物」でしょう。でも、別のタイミングで撮った、通行人が通りすぎた後の写真からコピペしてきたら、これは「本物」でしょう。
写真を主体に見れば、「本来の写真にないものを生み出す」という観点では「補完」だけど、建物を主体に見れば、1枚目にない情報を2枚目から「復元」したと言えるでしょう。これを「補完」と呼ぶのか「復元」と呼ぶのかで争うのは言葉遊びでしかないと思います。
で、モザイク復元のような超解像の場合でも、処理の流れは似たようなものです。動画の他のコマからだと動きがあるので、そのまま重ね合わせることはできないでしょうけど、拡縮や回転、パース変換などをかけて位置合わせをした、「同じ被写体の、さまざまなモザイクパターンの画像」をため込みます。そこまでできれば、あとは安直な「平均」をとるだけでも、モザイクの影響を減らした、本来の色に近いものが得られます。他の画素の影響を完全には排除できない(=ボケてる)でしょうけど、それでも「本物」に近づく。枚数が多ければ多いほど本物に近づけられますが、枚数が足りなくてもある程度の処理は可能。ここでうまく少ない枚数でも他の画素の影響を除去できる数式を作り出すのが「超解像技術」のキモ。
今回のストーリーにそって考えると、もし本物はモザイク越しの局部にほくろがあった場合、AI技術ベースとかだと、学習画像にほくろがなければ、出力画像にほくろはないでしょう。偽物です。本当の超解像技術を応用すれば、ほくろは復元できます。本物です。実用的かどうかはさておき、そういう「ほくろを復元できるような技術」は実在するのです。
変形が大きそうだから複数フレームを使う超解像では厳しい気がしないでもない
AIで戻すのも面倒なので、学習データの方をください
それならACの言っている「AIでの類推ではなく、超解像技術でのモザイク除去」ではなく、「AIでの類推による超解像技術でのモザイク除去」だろう。
ACが「超解像技術」についてなんか幻想を抱いているらしいというのは、まあ外れてはいないだろう。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家
疑問 (スコア:0)
超解像度技術がAIによる類推より本物、ってのはどんな発想なんだろう?
Re: (スコア:0)
超解像技術を魔法かなんかだと思ってるんだろうか
Re: (スコア:0)
失われた情報は元には戻らん。
実写を前提に時間軸方向も加味した上での単なる補完であって、復元じゃない。
Re:疑問 (スコア:2)
> 失われた情報は元には戻らん。
モザイクだけじゃ復元できません.おっしゃるように情報が失われているからです.
しかし,学習データの形で「無修正画像」と「それにモザイクを掛けた画像」を用意し,
その学習データの数を増やしていくと,つまり頑張ってディープラーニングをすると,失われた情報を補うことができるようになります.
これが機械学習によるモザイク除去(超解像)の仕組みです.
つまりモザイク除去アルゴリズムへの入力は(モザイク画像+膨大な学習用画像)なのです.
学習用画像の分だけ情報量が増えているので,モザイクとして失われた情報が補える訳です.
Re: (スコア:0)
お尻なら同一ソースで学習可能でしょうけど。
学習対象を偏らせれば、好みの復元が出来るかも?
# 学習データどうするんだ。
”矛盾” (スコア:0)
モザイクをかける側にもAIつかったらどうなるの?
Re: (スコア:0)
そのうちにAIがAvつくってAIがAVにモザイクかけてAIがAVを販売してAIがAVを購入して
AIがAVのモザイク除去してAIがAV見て人間はそんなAI見て興奮するようになるわけですね
Re: (スコア:0)
だからそれは補完であって復元ではない。
Re:疑問 (スコア:1)
このスレッドの大本で言ってるのは「超解像が類推より本物」かどうか、つまり本物か偽物か、という問題。補完か復元かで争うのは論点がずれてると思いますね。
あとは、以下は、今回のストーリーのソフトウェアが何をやっているかの話ではなく、技術的実現性の話として、「本当の超解像」が出力する画像が「本物か偽物か」についての話です。
たとえば「建物だけの写真」が欲しいけど、手前に通行人が映り込んだものしかなかった時に、
人物に隠れた部分を、「他の箇所からコピペ」とか「似たような別の建物の写真からコピペ」したら、これは「偽物」でしょう。
でも、別のタイミングで撮った、通行人が通りすぎた後の写真からコピペしてきたら、これは「本物」でしょう。
写真を主体に見れば、「本来の写真にないものを生み出す」という観点では「補完」だけど、
建物を主体に見れば、1枚目にない情報を2枚目から「復元」したと言えるでしょう。
これを「補完」と呼ぶのか「復元」と呼ぶのかで争うのは言葉遊びでしかないと思います。
で、モザイク復元のような超解像の場合でも、処理の流れは似たようなものです。動画の他のコマからだと動きがあるので、そのまま重ね合わせることはできないでしょうけど、拡縮や回転、パース変換などをかけて位置合わせをした、「同じ被写体の、さまざまなモザイクパターンの画像」をため込みます。そこまでできれば、あとは安直な「平均」をとるだけでも、モザイクの影響を減らした、本来の色に近いものが得られます。他の画素の影響を完全には排除できない(=ボケてる)でしょうけど、それでも「本物」に近づく。枚数が多ければ多いほど本物に近づけられますが、枚数が足りなくてもある程度の処理は可能。ここでうまく少ない枚数でも他の画素の影響を除去できる数式を作り出すのが「超解像技術」のキモ。
今回のストーリーにそって考えると、もし本物はモザイク越しの局部にほくろがあった場合、
AI技術ベースとかだと、学習画像にほくろがなければ、出力画像にほくろはないでしょう。偽物です。
本当の超解像技術を応用すれば、ほくろは復元できます。本物です。
実用的かどうかはさておき、そういう「ほくろを復元できるような技術」は実在するのです。
Re:疑問 (スコア:2)
変形が大きそうだから複数フレームを使う超解像では厳しい気がしないでもない
Re: (スコア:0)
AIで戻すのも面倒なので、学習データの方をください
Re: (スコア:0)
それならACの言っている「AIでの類推ではなく、超解像技術でのモザイク除去」ではなく、
「AIでの類推による超解像技術でのモザイク除去」だろう。
ACが「超解像技術」についてなんか幻想を抱いているらしいというのは、まあ外れてはいないだろう。