NyaNyaの日記: {りんく}:各種バイナリ文書からテキストを抽出
日記 by
NyaNya
解析と抽出。
patagonさんの日記経由、
Office文書やPDF/HTMLファイルのテキスト部分を
抽出できる「xdoc2txt」が公開(窓の杜)
解説とダウンロード(EB series support page)
ふみゅ面白そうですねー。
面白そうではあるんですが、わたしには使い道が無いかなー。
何せOfficeも一太郎も持ってませんし。
あーでもmhtとhtmlは使うかな?
まぁとりあえずDLはしますが。
patagonさんの日記経由、
Office文書やPDF/HTMLファイルのテキスト部分を
抽出できる「xdoc2txt」が公開(窓の杜)
解説とダウンロード(EB series support page)
ふみゅ面白そうですねー。
面白そうではあるんですが、わたしには使い道が無いかなー。
何せOfficeも一太郎も持ってませんし。
あーでもmhtとhtmlは使うかな?
まぁとりあえずDLはしますが。
{りんく}:各種バイナリ文書からテキストを抽出 More ログイン