patagonの日記: xdoc2txt
日記 by
patagon
メモ
いまさらだけど昨日知ったので
xdoc2txt
xdoc2txtはPDF,WORD,EXCEL,一太郎などの各種バイナリ文書から、テキスト要素を抽出する汎用テキストコンバータです。
ワープロ文書の種類は、拡張子から判別します。次の拡張子のファイルに対応しています。
http://www.forest.impress.co.jp/article/2003/11/19/xdoc2txt.html
まず、本ソフトのショートカットアイコンをデスクトップなどに作成し、起動オプションを“-f”と指定しよう。
ただしPDFの扱いは試してみるとそんなにうまくない。
PDFに関してはPDFDocTextの方が扱いがうまい。
xdoc2txt More ログイン