文字コード自動判別で、EUC-JP の「名前」がUTF-8 と誤認される問題ですが、じつはUTF-8 として正しいシーケンスではなかったということがわかりました。(坂本さんありがとうございます)というわけで、そのへんのチェックを厳しくした新パッチです。試してみてくださいませ。
文字コード自動判別パッチ (スコア:1)
Linux じゃなくて Solaris ですが, UTF-8/eucJP/SJIS の判別が,手元にあるデータの範囲内では正常動作することを確認しました.
ところで,いくつか問題を見つけたので報告します.
env LANG=xyzzy lv /etc/profile
のように,存在しないロケール名を環境変数に指定すると,core を吐いて死にます.
パッチは,別途メールでお送りします.
Re:文字コード自動判別パッチ (スコア:1)
ほんとうは、configure で nl_langinfo() の有無を調べるなどしたほうがいいのかもしれませんが、そのへん、どうでしょうか? もちろん、あったほうがいいのでしょうが、バグが混入したり、テストしきれなかったりするリスクとの比較で。