パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

スキャナで読み取った画像内の数字がランダムに置き換わる問題」記事へのコメント

  • by Anonymous Coward

    ザックリと要点だけ日本語訳してるサイトもあるのでリンク張っとく。
    http://dailynewsagency.com/2013/08/05/xerox-scannersphotocopiers-rando... [dailynewsagency.com]

    • 画像圧縮と展開の過程で画像が崩れるってんならよくわかるけど、文字が置き換わるってのはびっくり。
      今どきの画像圧縮は文字認識もある程度やっちゃうってことなのね
      まぁ、そのほうがデータが小さくなるのはわかります。

      でも、結果として誤認識が起きてるんじゃだめじゃんねぇ

      親コメント
      • で、会社にある複合機のうち、最も新しいリコー MP C5503 の管理コンソールにログオンしてスキャナの圧縮設定を見てみました
        MH、MR、MMR、JBIG2 の4段階が選べてデフォルトはMHでした
        さすがに MH は古いなと思ったので MMR (CCITT Group4)にあげておきました

        記事にある JBIG2 の問題は本当にアルゴリズムの問題なのか、それとも XEROX による実装によるものなのかはまだ分かんないんですよね?

        親コメント
        • by Anonymous Coward

          機種が限られている事から(とりあえず今のところ他メーカーの報告がない、ないだけかもしれないが)、
          実装の問題じゃないですかね?(OCRの実装精度の問題)

          とはいえ、そもそもJBIG2の規格自体にも無理ありそうですね。
          >原稿の内容を認識・パターンマッチさせ、文字や数字をくっきりさせる仕組みになっています。
          ってことは規格そのものが”OCRを含んでいる”って事で。誤認識でて当たり前のような。

      • by Anonymous Coward

        >文字が置き換わるってのはびっくり。
        そうかな?
        6と8とか、汚い字でかかれたら人間でも見分け付かないよ。
        #他にも1とlとか、0とOとか……

        それこそ右側がくっついてたら8で、少しでも離れてたら6だ。
        その「少し」の隙間がノイズ扱いされちゃえば、6が8になったり、
        或いはその逆というのはありえると思う。

        とはいえ、そういうアルゴリズムをコピー機に使うなとも思うけどね。

      • by Anonymous Coward

        文字認識じゃなくて、あくまでも画像として似たようなパターンをまとめているってだけなんでしょう。
        文字として認識しているのなら置き換えなんて意味がないどころか悪影響ありまくりなことはしませんし。

        画像として、解像度を落としてまで高圧縮を求めているならこれぐらい似てるパターンはまとめてもいいだろうという判断。

一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy

処理中...