パスワードを忘れた? アカウント作成
452569 journal

kubotaの日記: 韓国語manpageとlv (実は groffの問題?)

日記 by kubota
lv (バージョン 4.49.5e) ですが、Debian Sid の ko_KR.eucKR 環境で韓国語 manpage を見たところ、自動判別に成功する場合と失敗する場合があることに気づきました。

EUC-KR の中の非 ASCII 文字が太字 (強調) で登場する場合に自動判別に失敗し、Shift_JIS と誤って判別されてしまいます。これは、「(文字)^H(文字)」となるところが、「(文字の1バイト目)^H(文字の1バイト目)(文字の2バイト目)^H(文字の2バイト目)」となっているためです。これでも各種ターミナル上ではきちんと表示されているのですが、lv の自動認識は失敗します。

なお、韓国語は空白で単語を区切るため、groff では -Tascii8 を使っていたはずです。(-Tnippon ではない)。

さて、これは groff が国際化するまで待たないといけないのでしょうか。それとも、lv のエンコーディング自動認識を強化しないといけないでしょうか。各種ターミナルがこれをきちんと表示する以上、lvも対応しないといけないかなあ。でも、どういうアルゴリズムで?

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond

読み込み中...