アカウント名:
パスワード:
ザックリと要点だけ日本語訳してるサイトもあるのでリンク張っとく。http://dailynewsagency.com/2013/08/05/xerox-scannersphotocopiers-rando... [dailynewsagency.com]
画像圧縮と展開の過程で画像が崩れるってんならよくわかるけど、文字が置き換わるってのはびっくり。今どきの画像圧縮は文字認識もある程度やっちゃうってことなのねまぁ、そのほうがデータが小さくなるのはわかります。
でも、結果として誤認識が起きてるんじゃだめじゃんねぇ
で、会社にある複合機のうち、最も新しいリコー MP C5503 の管理コンソールにログオンしてスキャナの圧縮設定を見てみましたMH、MR、MMR、JBIG2 の4段階が選べてデフォルトはMHでしたさすがに MH は古いなと思ったので MMR (CCITT Group4)にあげておきました
記事にある JBIG2 の問題は本当にアルゴリズムの問題なのか、それとも XEROX による実装によるものなのかはまだ分かんないんですよね?
機種が限られている事から(とりあえず今のところ他メーカーの報告がない、ないだけかもしれないが)、実装の問題じゃないですかね?(OCRの実装精度の問題)
とはいえ、そもそもJBIG2の規格自体にも無理ありそうですね。>原稿の内容を認識・パターンマッチさせ、文字や数字をくっきりさせる仕組みになっています。ってことは規格そのものが”OCRを含んでいる”って事で。誤認識でて当たり前のような。
ボケボケの写真から人の顔だけをくっきりと取り出すフィルターあるけど、それだとそういうことある>「何人か同じ人になる」
ピコーン!この方法で、モザイクを外すソフトを作れば、売れるに違いない。(これは、公知例です)
http://mc.matome-complate.com/archives/26119887.html [matome-complate.com]これですか?w
>文字が置き換わるってのはびっくり。そうかな?6と8とか、汚い字でかかれたら人間でも見分け付かないよ。#他にも1とlとか、0とOとか……
それこそ右側がくっついてたら8で、少しでも離れてたら6だ。その「少し」の隙間がノイズ扱いされちゃえば、6が8になったり、或いはその逆というのはありえると思う。
とはいえ、そういうアルゴリズムをコピー機に使うなとも思うけどね。
>>文字が置き換わるってのはびっくり。>そうかな?
ごめん、僕がもの知らずで、パターンマッチングをやってるとはつゆ知らなかったからなんです白黒画像の圧縮にそういう「判断」を入れるアルゴリズムが使われるとは知らなかったの
文字認識じゃなくて、あくまでも画像として似たようなパターンをまとめているってだけなんでしょう。文字として認識しているのなら置き換えなんて意味がないどころか悪影響ありまくりなことはしませんし。
画像として、解像度を落としてまで高圧縮を求めているならこれぐらい似てるパターンはまとめてもいいだろうという判断。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日本発のオープンソースソフトウェアは42件 -- ある官僚
英文読むのが面倒な人へ (スコア:5, 参考になる)
ザックリと要点だけ日本語訳してるサイトもあるのでリンク張っとく。
http://dailynewsagency.com/2013/08/05/xerox-scannersphotocopiers-rando... [dailynewsagency.com]
Re:英文読むのが面倒な人へ (スコア:2)
画像圧縮と展開の過程で画像が崩れるってんならよくわかるけど、文字が置き換わるってのはびっくり。
今どきの画像圧縮は文字認識もある程度やっちゃうってことなのね
まぁ、そのほうがデータが小さくなるのはわかります。
でも、結果として誤認識が起きてるんじゃだめじゃんねぇ
Re:英文読むのが面倒な人へ (スコア:5, 興味深い)
で、会社にある複合機のうち、最も新しいリコー MP C5503 の管理コンソールにログオンしてスキャナの圧縮設定を見てみました
MH、MR、MMR、JBIG2 の4段階が選べてデフォルトはMHでした
さすがに MH は古いなと思ったので MMR (CCITT Group4)にあげておきました
記事にある JBIG2 の問題は本当にアルゴリズムの問題なのか、それとも XEROX による実装によるものなのかはまだ分かんないんですよね?
Re: (スコア:0)
機種が限られている事から(とりあえず今のところ他メーカーの報告がない、ないだけかもしれないが)、
実装の問題じゃないですかね?(OCRの実装精度の問題)
とはいえ、そもそもJBIG2の規格自体にも無理ありそうですね。
>原稿の内容を認識・パターンマッチさせ、文字や数字をくっきりさせる仕組みになっています。
ってことは規格そのものが”OCRを含んでいる”って事で。誤認識でて当たり前のような。
Re:英文読むのが面倒な人へ (スコア:1)
Re: (スコア:0)
ボケボケの写真から人の顔だけをくっきりと取り出すフィルターあるけど、それだとそういうことある>「何人か同じ人になる」
Re:英文読むのが面倒な人へ (スコア:2, おもしろおかしい)
ピコーン!
この方法で、モザイクを外すソフトを作れば、売れるに違いない。
(これは、公知例です)
Re:英文読むのが面倒な人へ (スコア:2)
壁のシミや空の雲まで人の顔になってるとか
楽しい怖い写真になりそうですね。Re: (スコア:0)
http://mc.matome-complate.com/archives/26119887.html [matome-complate.com]
これですか?w
Re: (スコア:0)
>文字が置き換わるってのはびっくり。
そうかな?
6と8とか、汚い字でかかれたら人間でも見分け付かないよ。
#他にも1とlとか、0とOとか……
それこそ右側がくっついてたら8で、少しでも離れてたら6だ。
その「少し」の隙間がノイズ扱いされちゃえば、6が8になったり、
或いはその逆というのはありえると思う。
とはいえ、そういうアルゴリズムをコピー機に使うなとも思うけどね。
Re:英文読むのが面倒な人へ (スコア:2)
>>文字が置き換わるってのはびっくり。
>そうかな?
ごめん、僕がもの知らずで、パターンマッチングをやってるとはつゆ知らなかったからなんです
白黒画像の圧縮にそういう「判断」を入れるアルゴリズムが使われるとは知らなかったの
Re: (スコア:0)
文字認識じゃなくて、あくまでも画像として似たようなパターンをまとめているってだけなんでしょう。
文字として認識しているのなら置き換えなんて意味がないどころか悪影響ありまくりなことはしませんし。
画像として、解像度を落としてまで高圧縮を求めているならこれぐらい似てるパターンはまとめてもいいだろうという判断。