アカウント名:
パスワード:
現在ある EUC の文書中のポンド記号を Unicode 変換時に互換文字に変換するとしたら、新しく Unicode で入力する文書にも、互換文字のポンド記号を入力したくなると思います。「その部分はまったく同一」な文書を作る必要があるときとか。
現在のシフト JIS や EUC においても、半角カナや全角英数の使用はあまりおすすめしない、ということになっていると思いますが、Unicode における互換文字の不使用もその程度の弱い「おすすめ」しかできないと思います。
どうしてもきれいな Unicode に移行したければ、移行過程のどこかで断絶を作る必要があります。が、それを要求するのはほぼ不可能でしょう。世界中がひとつの方式に従わないと、規格の意味がないですが、そんなことは不可能です。
互換文字を排除するかどうかについては、ぼく自身はどちらでもいいという意見です。「どちらか」という問題よりかは、「世界中がどちらかで統一される」という問題のほうがよっぽど重要なことです。「長いものに巻かれろ」に近い。そして、Unicode Consortium は「互換文字排除」の原則を緩めつつあるような印象をぼくは持っています。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
UNIXはシンプルである。必要なのはそのシンプルさを理解する素質だけである -- Dennis Ritchie
Re:ロケール自動認識 (スコア:1)
現在ある EUC の文書中のポンド記号を Unicode 変換時に互換文字に変換するとしたら、新しく Unicode で入力する文書にも、互換文字のポンド記号を入力したくなると思います。「その部分はまったく同一」な文書を作る必要があるときとか。
現在のシフト JIS や EUC においても、半角カナや全角英数の使用はあまりおすすめしない、ということになっていると思いますが、Unicode における互換文字の不使用もその程度の弱い「おすすめ」しかできないと思います。
どうしてもきれいな Unicode に移行したければ、移行過程のどこかで断絶を作る必要があります。が、それを要求するのはほぼ不可能でしょう。世界中がひとつの方式に従わないと、規格の意味がないですが、そんなことは不可能です。
互換文字を排除するかどうかについては、ぼく自身はどちらでもいいという意見です。「どちらか」という問題よりかは、「世界中がどちらかで統一される」という問題のほうがよっぽど重要なことです。「長いものに巻かれろ」に近い。そして、Unicode Consortium は「互換文字排除」の原則を緩めつつあるような印象をぼくは持っています。