アカウント名:
パスワード:
Adobe側の所謂問題なんだよなぁ、、、、
printed_in_edge_using_microsoft_print_to_pdf.pdf のフォントが汚いから気になって元の original_file.pdf のプロパティを見ると PDF 変換の所が GPL Ghostscript 8.15 と出ている。Ghostscript をエンジンに使って PDF 変換したファイルってプリンタにはそれらしい出力になるけれど、内容のテキストはコンピュータが相互に情報交換をする(例えば検索に利用する)ためには全く使えなくなっていた事があったな。
所謂問題?
突き詰めてみると、って事ね。pdfの仕様って、一見一直線一行の文字列でも文字幅や太さやフォントの切り替わりで内部的に(下手すると1文字ごとに!)ブロック分けていて、かつその仕様がいわゆるhtml的な物じゃなく、全て論理座標で指定する恰好になってるから、単純にpdfファイル内容パースしても「どこまでがひと続きの文字列なのか」ぱっと取り出せなかったりするもんね。結果、「人間が見ると間違いに見える」って言う訳わからん状態になったりする。
はい、pdfパーザ書いたことある私の実体験でした。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ナニゲにアレゲなのは、ナニゲなアレゲ -- アレゲ研究家
これ実はEdge側の問題ではなくて (スコア:0)
Adobe側の所謂問題なんだよなぁ、、、、
Re: (スコア:0)
printed_in_edge_using_microsoft_print_to_pdf.pdf のフォントが汚いから気になって元の original_file.pdf のプロパティを見ると PDF 変換の所が GPL Ghostscript 8.15 と出ている。
Ghostscript をエンジンに使って PDF 変換したファイルってプリンタにはそれらしい出力になるけれど、内容のテキストはコンピュータが相互に情報交換をする(例えば検索に利用する)ためには全く使えなくなっていた事があったな。
Re: (スコア:0)
所謂問題?
Re: (スコア:0)
突き詰めてみると、って事ね。
pdfの仕様って、一見一直線一行の文字列でも文字幅や太さやフォントの切り替わりで
内部的に(下手すると1文字ごとに!)ブロック分けていて、かつその仕様が
いわゆるhtml的な物じゃなく、全て論理座標で指定する恰好になってるから、
単純にpdfファイル内容パースしても
「どこまでがひと続きの文字列なのか」ぱっと取り出せなかったりするもんね。
結果、「人間が見ると間違いに見える」って言う訳わからん状態になったりする。
はい、pdfパーザ書いたことある私の実体験でした。