アカウント名:
パスワード:
MSゴシックで表示するとストーリーの「⾃⾦︖⽤⽬⼀」の字が気持ち悪い感じになる。消費者庁のpdfファイルの時点でこの文字コードになってるからコピペした結果だろう。消費者庁の人は中華IMEでも使って文書作成したのかね。まさか検索避けの意図などはあるまいが。
1) 多分直にpdf化せずに一旦紙に出してOCRしてる。2) その時使ったOCRがこなれてない/クセがある。とかじゃないのかな。以前そんな話を聞いたことがある。unicodeだと康煕部首の類は通常の文字より若い文字コードに割当てられてるのでコード順で先にヒットしてしまうとかなんとか。
3) 仮想プリンタ式のpdf作成ツールで通常文字と康煕部首が同じグリフ参照するフォント使用ってのもあったかな。アプリ側がプリンタに文字コードじゃなくグリフIDで出力するとpdf生成時に逆引きして文字コードにしようとして康煕部首がヒット。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
開いた括弧は必ず閉じる -- あるプログラマー
変なコード (スコア:2)
MSゴシックで表示するとストーリーの「⾃⾦︖⽤⽬⼀」の字が気持ち悪い感じになる。
消費者庁のpdfファイルの時点でこの文字コードになってるからコピペした結果だろう。
消費者庁の人は中華IMEでも使って文書作成したのかね。
まさか検索避けの意図などはあるまいが。
Re: (スコア:0)
1) 多分直にpdf化せずに一旦紙に出してOCRしてる。
2) その時使ったOCRがこなれてない/クセがある。
とかじゃないのかな。以前そんな話を聞いたことがある。
unicodeだと康煕部首の類は通常の文字より若い文字コードに割当てられてるので
コード順で先にヒットしてしまうとかなんとか。
Re: (スコア:0)
3) 仮想プリンタ式のpdf作成ツールで通常文字と康煕部首が同じグリフ参照するフォント使用
ってのもあったかな。
アプリ側がプリンタに文字コードじゃなくグリフIDで出力すると
pdf生成時に逆引きして文字コードにしようとして康煕部首がヒット。