maiaの日記: やさしくPDF OCR
日記 by
maia
商品名丸出しだけど、安いので買ってみた。基本的には、文書をスキャンして作ったPDFを、レイアウトを保ったまま、RTF、PDF等に変換できる(もちろん、テキストにも)。RTFだと、Wordが立ち上がるので、Wordで編集保存すれば、Wordファイルになる(ここで編集してからPDFにしてもよい…Acrobatがあるから出来るんだけど)。
認識率は全然問題ないように感じられる(新聞記事でも結構いける)。レイアウトは保たれるが、なぜか本文のフォントが6ポイントになった。実際には9ポイントくらいが適当。ま、その辺は何とでもなるだろう。文書中の画像が、沢山の特大文字に認識されたのには、ちょっと苦笑。キャプションの文字はちゃんと拾っている。
ScanSnapで作ったPDFと組み合わせて使うのだ。もちろん、文書を復元したい場合の話。通常は、Acrobat6のOCR機能で十分(というか、すごく便利…あくまで検索用)。Acrobat6のOCRも、やさしくPDF OCRも、必要になった時にいつでも行えるのがみそ。必要がなければ、スキャンPDFのままで、何もしない。
やさしくPDF OCR More ログイン