kubotaの日記: Unicode 以外は使用禁止!
それだったら別に CSI でも Unicode-hard-wired でもどっちでもできますよ。ユーザに必要なのは LANG=??_??.UTF-8 と書いておくことだけで、それも面倒だったら Linux だったらディストリビュータがその設定をデフォルトで書いておけばいい。
多言語を扱えるエンコーディングを用意する、ということについてはべつにだれも反対はしてないと思う。「だからなにができるんだよ」ってのは、ぼくの目標としては、UTF-8 も EUC-JP もユーザが好きなのを選んで使えるということ。デフォルトがどっちかというのはぼくにはあまり興味がなくて、べつに kanegon_p さんの意見の通り UTF-8 がデフォルトでも構わないと思う。
で、意見の相違は、それ以外のエンコーディングを使えなくしてしまうかどうか、ということですね。
世の中のエンコーディングがひとつだけなら、ものごとはもっと単純だっただろう、というのには合意します。でもそれは、世の中の自然言語がひとつだけなら、ものごとはもっと単純だっただろう、と言うのとあまり変わらない。
車輪の再発明を防ぐという意味なら、CSI 派は「最初からそのプログラムが CSI で書かれていりゃよかったんだよ」って言うだろうし、Unicode 派は「Unicode を使っていれば」って言うだろうし。目的から言うならどっちもいっしょなんです。
ちなみに、今ある 7bit / 8bit アプリケーションを書き直すという手間のことを考えると、Unicode だけをサポートにすると手間が減るかというと、必ずしもそうじゃない。そういう場合もあるけど。
期限を決めない将来目標というか将来の夢としてならともかく、いま、開発者の負担を減らすために UTF-8 限定というところを先取りしてしまうと、EUC-JP で今暮らしている人が困る。「開発者はユーザより偉いから、開発者はユーザに対してそういうことを強要しても構わない」と考えるのが Markus Kuhn さん。しかし、ぼくはそうは思わない。