パスワードを忘れた? アカウント作成
452408 journal

kubotaの日記: ロケール自動判別 - lv編 1

日記 by kubota
ncursesw と dialog の国際化についても、だいたい方向が(とともに限界も)見えてきました。どちらも upstream developer は Thomas Dickey さんですが、マルチバイト文字・全角文字のサポートについては乗り気だし実際に作業も進行中なのですが、マルチバイトサポートをデフォルトで有効にするというということを、どうしても説得することができない。これでは、日本語(、韓国語、中国語)は「サポートに特別な配慮と追加作業が必要な、特別な言語」という地位を脱して「ふつうの言語のひとつ」になることができない。

まあとりあえず今のところ、落としどころとしてはこのへんで妥協するのがよかろうとも思ってますが。まだこれ以外にも課題は山積してるんだし。

というわけで、次の課題。

ja_JP.UTF-8 ロケールで作業していて気付くことは、lv がロケール自動判別ではないということ。これは何とかしないと。「日本人は正しい国際化と思ってるけど、じつは日本人にしか使えない国際化」の一例になってしまう。英文マニュアルまで用意されていて、脱「日本ローカル」路線を行く lv がこれではちょっと。

出力エンコーディングをロケール自動判別がデフォルトになるように変更してみた。たしかにうまく動くが、こんどは入力エンコーディングの自動判別も新しく書き起こさないといけないかも。かなり CJK にえこひいきした構成となっているっぽいので、ロケール情報も参考にすることで、もっと汎用的なものにできないだろうか。emacs の language environment みたいに、言語ごとに、エンコーディング候補の優先順位を変えてみたりとか。

しかしここでも、一番の問題は実装ではなくて開発者とのネゴシエーションにあるものと予想しています。nl_langinfo() または setlocale(LC_CTYPE,NULL) とかを使った、美しくない実装をするしかないだろうから。あと、MS-DOS でもコンパイルできるようにしておく必要があるっぽいのをどうするか。

なお、ほかにも groff を UTF-8 ready にするなどの課題があるけど (groff がなぜ重要かというと、マニュアルページの表示に使うから)、こっちは鵜飼さんにおまかせします。ぼくには難しすぎ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by gotom (5742) on 2003年07月27日 1時05分 (#366231)
    lv が locale に non-aware であるのはそのとおりです。既に TODO リストに入っています。また、nl_langinfo() や setlocale() を使わざろうえないと思います。もしパッチがあれば、がんがん取込んでいきたいと思います。MS-DOSサポートについては開発者の成田さん次第というところでしょうか。 ja_JP.UTF-8 についていえば、次の Debian JP sarge リリースの目標の一つに UTF-8 locale サポートを含めたいと考えています。以前のdebian-devel@jp の ja_JP.EUC-JP 関連スレッドに対する返信メールで、それについて述べようとしていました。これについては、後でメールしたいと思っていますので、そのときはバンバンつっこみを入れてくださいませ。 -- gotom
typodupeerror

Stableって古いって意味だっけ? -- Debian初級

読み込み中...