Note that the PCS defines semantic, rather than visual, characters. That means, for example, that a character with the semantics of <backslash> must be supported, even if in some fonts, the backslash glyph has been replaced with a <Yen> sign, <c-cedilla>, or other glyph. A replacement glyph thus has two sets of semantics -- its own and that of the glyph it replaces. If a <Ye
えっと (スコア:1)
コードの話と文字の話がごっちゃになってるような気がします。
OSF CHARACTER AND CODE SET REGISTRY INTRODUCTION [opengroup.org]に
Re:えっと (スコア:1)
コメントありがとうございます. お返事が遅れて済みません.
実は,Big5 など,外国の文字エンコーディングには2バイト目が 0x40~0x7E になるようなものが存在していて, Linux の glibc やコマンド類は,そういものにも対応できているのです. もちろん,ASCII しか考えていないようなプログラムも多いでしょうが,そういうプログラムには,euc-jp を使おうが utf-8 を使おうが通りません.
で,glibc の開発者の Ulrich Drepper とか, 分かっている人たちはそういうことも理解した上で, なお shift_jis は難しいと言っているのですよ.
まあ,本当のところ,何が問題で shift_jis を排除されているのかは本人に聞いてみないと分かりませんが,私はそんなにはずしていないと思っています.