patagon (1453) の日記
メモ
いまさらだけど昨日知ったので
xdoc2txt
xdoc2txtはPDF,WORD,EXCEL,一太郎などの各種バイナリ文書から、テキスト要素を抽出する汎用テキストコンバータです。
ワープロ文書の種類は、拡張子から判別します。次の拡張子のファイルに対応しています。
http://www.forest.impress.co.jp/article/2003/11/19/xdoc2txt.html
まず、本ソフトのショートカットアイコンをデスクトップなどに作成し、起動オプションを“-f”と指定しよう。
ただしPDFの扱いは試してみるとそんなにうまくない。
PDFに関してはPDFDocTextの方が扱いがうまい。
この議論は賞味期限が切れたので、アーカイブ化されています。
新たにコメントを付けることはできません。