kubotaの日記: 文字コード自動判別
日記 by
kubota
lv 国際化パッチ (4部作)
ですが、「まず UTF-8 テストを行い、合格すれば UTF-8 とみなす」というアルゴリズムは必ずしもうまく動かないようです。
日本語マニュアルページで、最初に日本語が現れる行はたいてい「名前」ですが、EUC-JP 表記の「名前」は UTF-8 テストを通ってしまうのです。
なんかいい方法はないでしょうか?
ちなみに、日本語だけに特化したアルゴリズムは限りなく却下に近いです。
文字コード自動判別 More ログイン