アカウント名:
パスワード:
ボケさせた画像と照合するということだが、ボケた画像を生成出来るのはボケのモデルがあるからで、モデルがあるということは一種の逆問題を解いてボケた画像から元の状態を復元出来るはずだがこの分野は専門外だが、ボケた画像の復元は割りとポピュラーな研究テーマになっているはずで、それらの従来手法を試しても駄目だったから新方式を考案したということなのか?
たぶん,画像認識の一番難しい部分を「人間の直観」に任せたところが認識率向上のポイントなのでしょう.
人間なら,ボケた画像の類似を直感的に判断できますが,ソフトウェアではそういった画像の類似の判断はまだ発展途上です.
ボケた画像が持つ情報をソフトウェアで復元するのではなく,ボケていない画像を,人間が認識しやすいように比較画像と同等にボケさせたところがポイントかと.
画像処理ソフトをそのためのプリプロセッサという位置づけにしたと考えれば,今回の手法の正当性が納得できます.
>人間なら,ボケた画像の類似を直感的に判断できますが,ソフトウェア>ではそういった画像の類似の判断はまだ発展途上です.
いや、このシステム、ぼかした画像の照合までソフトウェア上でやってるんですが……#そこから先を人間がさらに絞るわけでもない。
ボケる前の状態の復元は難しいです。ボケのモデルはいくらでも用意できますが、ボケた画像に対してどのモデルを適用するかが一意に定まりません。
そこで”数字のパターン”の組み合わせと、”ボケた入力画像”とを比較するのでは無くて、”数字のパターン”と”ボケのパターン”の全ての組み合わせと、”ボケた入力画像”を比較しましょう、というのが新方式のアイデアです。数字だけじゃなくてボケのパターンも同時に照合する点が新しいのです。
ただこのアイデアは画像処理の分野では古典的なものです。個人的には今頃ニュースになるなんてびっくりです。
1文字ずつボケた画像を比較すれば良くて、なんで「・・・1」から「9999」までの全パターンで比較するのかと思ったら、ボケが隣の文字や全ての文字と重なるぐらいの状態だと戻しようがないですね。パスワードをハッシュで比較するぐらいの逆転の発想でした…。
重箱の隅で申し訳ないが、パスワードを何で比較しようというのかとても心配です。
元記事にも2011年に導入したと書いてあるし、今頃!?ですね
全単射じゃないから元には戻せないと思うけど?
逆問題で問題元に戻せないのは、そのとおりだと思います。
ただナンバープレートは元の画像が1桁あたり10種類に限定されるので、画像として元に戻す必要はなくて、どの種類かの判別ができればいいだけです。実際は、0〜9のそれぞれと判定される確率を出すことになると思います。
元コメの指摘通りボケのモデルというのがあるので、撮影された画像、ボケのモデル、ナンバーの字体、を使ってこの確率を計算する問題なんですが、ナンバーの字体をボケのモデルでぼかして画像とマッチングという方法をとったのは、できあいのライブラリで簡単にできるからでしょうか。(それとも、新聞記者にわかりやすく説明するために簡単な手順に言い換えて言っただけで、ちゃんとした数学的なモデルがあって、もっと難しい計算をしているかもしれません)
~ナンバーの字体をボケのモデルでぼかして画像とマッチングという方法をとったのは、できあいのライブラリで簡単にできるからでしょうか。
それが理由として大きいような気がしますね値段やライセンスの制限のきつい高級なツールを使うのは予算の制約があるでしょうし、大学の研究室と研究して数学的なアルゴリズムから作り上げたものを実装するなんてのは実務で忙しいから無理なのでしょう自分で出来る手法と環境の範囲内で上手に工夫したという感じでしょうか
それ結局、元記事でやってることと同じにならね?
つい最近、TVで警察などでも使われているという画像処理ソフトが紹介されていたけど、そういうのじゃ駄目なんだろうか (たしかこれ [noritsu.co.jp])超解像なども出来るので、ナンバーを特定できると思うんだけど。
ただ記事を読むと、特定できるほど鮮明な画像が得られないときに、候補をリストアップしてすこしでも役立てる。という実用的な観点で作られたソフトって事みたいですね。これはこれでアリだと思うんですけど。(または、予算が無くて、いいソフトが使えない・・・って事かも)
(または、予算が無くて、いいソフトが使えない・・・って事かも)
記事にある、
09年、鑑定業務の合間を縫って研究を始めた。
っていうのが、いい味を出しているなーと。
観測できるデータ(画像)が複数あるなら、そのやり方でいわゆる「超解像」が出来ます。今回のケースだと、観測数が限られてて一方でテンプレートはいくらでも用意出来るという問題設定なので、劣化過程(ボケ+アフィン変換)を考慮した順モデルでテンプレートマッチしたという話です。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ
ボケる前の状態を復元しては駄目なのか (スコア:0)
ボケさせた画像と照合するということだが、ボケた画像を生成出来るのはボケのモデルがあるからで、モデルがあるということは一種の逆問題を解いてボケた画像から元の状態を復元出来るはずだが
この分野は専門外だが、ボケた画像の復元は割りとポピュラーな研究テーマになっているはずで、それらの従来手法を試しても駄目だったから新方式を考案したということなのか?
Re:ボケる前の状態を復元しては駄目なのか (スコア:2)
たぶん,画像認識の一番難しい部分を「人間の直観」に任せたところ
が認識率向上のポイントなのでしょう.
人間なら,ボケた画像の類似を直感的に判断できますが,ソフトウェア
ではそういった画像の類似の判断はまだ発展途上です.
ボケた画像が持つ情報をソフトウェアで復元するのではなく,
ボケていない画像を,人間が認識しやすいように比較画像と
同等にボケさせたところがポイントかと.
画像処理ソフトをそのためのプリプロセッサという位置づけにした
と考えれば,今回の手法の正当性が納得できます.
Re: (スコア:0)
>人間なら,ボケた画像の類似を直感的に判断できますが,ソフトウェア
>ではそういった画像の類似の判断はまだ発展途上です.
いや、このシステム、ぼかした画像の照合までソフトウェア上でやってるんですが……
#そこから先を人間がさらに絞るわけでもない。
Re:ボケる前の状態を復元しては駄目なのか (スコア:1)
ボケる前の状態の復元は難しいです。ボケのモデルはいくらでも用意できますが、ボケた画像に対してどのモデルを適用するかが一意に定まりません。
そこで”数字のパターン”の組み合わせと、”ボケた入力画像”とを比較するのでは無くて、
”数字のパターン”と”ボケのパターン”の全ての組み合わせと、”ボケた入力画像”を比較しましょう、というのが新方式のアイデアです。
数字だけじゃなくてボケのパターンも同時に照合する点が新しいのです。
ただこのアイデアは画像処理の分野では古典的なものです。個人的には今頃ニュースになるなんてびっくりです。
Re:ボケる前の状態を復元しては駄目なのか (スコア:1)
1文字ずつボケた画像を比較すれば良くて、なんで「・・・1」から「9999」までの全パターンで比較するのかと思ったら、ボケが隣の文字や全ての文字と重なるぐらいの状態だと戻しようがないですね。パスワードをハッシュで比較するぐらいの逆転の発想でした…。
Re: (スコア:0)
重箱の隅で申し訳ないが、パスワードを何で比較しようというのかとても心配です。
Re: (スコア:0)
元記事にも2011年に導入したと書いてあるし、今頃!?ですね
Re: (スコア:0)
全単射じゃないから元には戻せないと思うけど?
Re: (スコア:0)
逆問題で問題元に戻せないのは、そのとおりだと思います。
ただナンバープレートは元の画像が1桁あたり10種類に限定されるので、画像として元に戻す必要はなくて、どの種類かの判別ができればいいだけです。実際は、0〜9のそれぞれと判定される確率を出すことになると思います。
元コメの指摘通りボケのモデルというのがあるので、撮影された画像、ボケのモデル、ナンバーの字体、を使ってこの確率を計算する問題なんですが、ナンバーの字体をボケのモデルでぼかして画像とマッチングという方法をとったのは、できあいのライブラリで簡単にできるからでしょうか。
(それとも、新聞記者にわかりやすく説明するために簡単な手順に言い換えて言っただけで、ちゃんとした数学的なモデルがあって、もっと難しい計算をしているかもしれません)
Re:ボケる前の状態を復元しては駄目なのか (スコア:1)
~ナンバーの字体をボケのモデルでぼかして画像とマッチングという方法をとったのは、できあいのライブラリで簡単にできるからでしょうか。
それが理由として大きいような気がしますね
値段やライセンスの制限のきつい高級なツールを使うのは予算の制約があるでしょうし、大学の研究室と研究して数学的なアルゴリズムから作り上げたものを実装するなんてのは実務で忙しいから無理なのでしょう
自分で出来る手法と環境の範囲内で上手に工夫したという感じでしょうか
Re: (スコア:0)
それ結局、元記事でやってることと同じにならね?
Re: (スコア:0)
つい最近、TVで警察などでも使われているという画像処理ソフトが紹介されていたけど、
そういうのじゃ駄目なんだろうか (たしかこれ [noritsu.co.jp])
超解像なども出来るので、ナンバーを特定できると思うんだけど。
ただ記事を読むと、特定できるほど鮮明な画像が得られないときに、候補をリストアップして
すこしでも役立てる。という実用的な観点で作られたソフトって事みたいですね。
これはこれでアリだと思うんですけど。
(または、予算が無くて、いいソフトが使えない・・・って事かも)
Re:ボケる前の状態を復元しては駄目なのか (スコア:2)
記事にある、
っていうのが、いい味を出しているなーと。
Re: (スコア:0)
Re: (スコア:0)
観測できるデータ(画像)が複数あるなら、そのやり方でいわゆる「超解像」が出来ます。
今回のケースだと、観測数が限られてて一方でテンプレートはいくらでも用意出来るという問題設定なので、
劣化過程(ボケ+アフィン変換)を考慮した順モデルでテンプレートマッチしたという話です。