パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

格安で「本をスキャンしてPDFに変換する」お手伝いはじまる」記事へのコメント

  • by Anonymous Coward on 2010年04月18日 12時54分 (#1750553)
    E社のスキャナ(3年前に購入)に付属していたOCR体験版の認識率は90%台前半、
    一時期フリーでも配布されていたOCRソフトでも認識率は98%止まりだった。
    100%が実現できないなら、いっそ画像としてスキャンしてくれたほうがいいかも。

    電子出版が広まらない日本ならではのサービス、なんてことにならなければいいのだけど。
    • Re:OCRの認識率 (スコア:3, 参考になる)

      by taka2 (14791) on 2010年04月18日 13時13分 (#1750557) ホームページ 日記

      > 100%が実現できないなら、いっそ画像としてスキャンしてくれたほうがいいかも。

      スキャン+OCRでは、PDF出力する場合は「透明テキスト」を使うのが基本です。

      画像としてスキャンした上に、OCRの認識結果を「透明な文字」として重ねるので、
      視覚上はスキャンした画像そのままに見えますが、「選択操作を行ってコピペ」すれば、OCRの認識結果を取得できます。
      誤認識があった場合も、画像で目でチェックが出来ます。

      親コメント

最初のバージョンは常に打ち捨てられる。

処理中...