geln12の日記: できるかな:TeX文書をMSWord形式に変換
日記 by
geln12
これまで、ここに書いたような方法でTeX⇒html経由⇒wordファイルの変換をしてきたのですが、ひょんなことからAdobe AcrobatでPDFからRTFに変換できることを知りました。
ということで、レッツチャレンジ(動作確認はAcrobat5):
- itemize環境の再現はいまいち(字下げされていない)
- 表は要素だけが抽出
- 数式は駄目ぽ。下付き・上付きなどは変換後に手作業がいる
- includegraphicsで入れ込んだEPSのテキスト部分が抽出されている(軸のラベルとか)
うーん、いまいち。
PDFOCRという製品も見つけたので、(体験版で)ためしてみましたが期待通りにはいかず。
うーん。
#Wordでなくても、TeXソースからOOo形式にスクリプトで変換する、とかできそうなんだけどなぁ
できるかな:TeX文書をMSWord形式に変換 More ログイン