パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

原子力規制庁サイトの「目視では判別しづらい誤字」、原因はOCRソフトの誤認識」記事へのコメント

  • by Anonymous Coward

    OCRソフトって、ただ似ている字形をコード化してるだけなの? アルファベットの大文字小文字もけっこう上手に認識してたけど、日本語は辞書とか使って正しそうな文章を推定したりしてないの?

    • by Anonymous Coward

      OCRソフトは昔のしか使ったことが無いのだが、今は音声認識などはソフトが抱えてる大量のデータセットを元に高精度な処理を実現してるのだから、最新のOCRソフトがそうなっていなかったとしたら不思議で仕方ない

      • by Jubilee (20038) on 2014年06月10日 23時17分 (#2618941)

        話題になったPDFファイルのひとつを開いてプロパティを見ると「Acrobat Distiller 9.0.0」ってありましたよ。Acrobat9にもOCR機能はあったので、恐らくそれが使われたのではないでしょうか。2008年のソフトですね。国産でもないし、日本語認識が賢くなくてもまあ仕方ないかも知れません。

        ってか、「Acrobat9はサポート切れだから使用禁止」って触れて回っている身としては腰が砕けそう。

        --
        Jubilee
        親コメント
        • by Anonymous Coward on 2014年06月10日 23時55分 (#2618952)

          職場のPCに残ってるDocuworks 7同梱版のPDF Creation Addonは大丈夫だろうな、と調べてみたらアウトだったー! [fujixerox.co.jp]

          でもサポート情報の指示どおりDW 7.3xへのアップデートはしてるんだよな。
          これにより富士ゼロックスのPDF変換ツールに置き換えられると思ったんだが、文書のプロパティではAcrobat Elements 9.0.0と出る。
          Acrobat Elementsって随分前にディスコンしたはずだけど、OEMはこっそり続いてるのかしら。

          親コメント
        • by Anonymous Coward
          Xはデグレしてるわバグ満載だわで常用できる品質じゃないんだよね11で少しはよくなってんのかね

私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike

処理中...