oldwaveの日記: 普通の日本人のためのUnicode 3
日記 by
oldwave
Unicodeを仕様通りにフルスペックで実装している処理系はおそらくない。結果として、Unicodeのサブセットがあちこちにあって、インピーダンスミスマッチがしばしば発生している。
Unicodeがなければ良いとは思わない。どんな文字コードもあらゆるニーズを満足させることはできないので、妥協・改訂は避けられない。Unicodeがなければないで別の問題が起きるだけのことだ(各論として個別の問題をどう捉えるかはまた別の話)。
しかし、いくらなんでもUnicodeは複雑過ぎる。多言語環境が必要な利用者はともかく、普通の日本人が利用する場合にはオーバースペックもいいところである。思うに、普通の日本人のためのUnicodeサブセットを標準化し、みんなでそれを使うようにした方がいいのではないか。
# と思って、シコシコ資料を作ってるんだけど、先は長いわ、こりゃ。
普通の日本語 (スコア:1)
いつまでも、トウ小平 [wikipedia.org]とか、深セン市 [wikipedia.org]なんて表記を新聞紙上で目にし続けている度にそう思います。
Copyright (c) 2001-2014 Parsley, All rights reserved.
Re:普通の日本語 (スコア:1)
僕の考えているコンセプトは以下の通りです。
これをMINIMUM-JA-UNICODEとでも名付けて、ポータブルな日本語Unicodeテキスト表現の基準とする、ということです。
もちろん、これでは不足する場合はあるでしょう。ここでのポイントは、すべてのプログラマーが習得すべき基礎教養としての文字列処理とはどういうものか?ということです。入出力や検索において、Unicode標準で許されるすべての表現をサポートすることは、ほとんどのプログラマーにとって苦痛でしょうし、しかもその必要がないケースは非常に多いと思うのです。必要なケースでだけ、この範囲を越える文字列表現をサポートすれば良い、と思うのです。
中国の人名・地名の問題などは、どこまでいっても万人を満足させる解はないと言えるので、そこはその都度苦労するしかないかな、と。
# 極論を言うと、&toushouhei;のような表現で個別対応することもできるわけですし。
ほぼ同意…ですが (スコア:1)
(なぜ「JIS準拠」<これも適当だが と言わなかったのだろうか)
と同じ方向を目指して一つのサブセットを作るという考え方はわかります。ただ、乱立すると「また」混乱の元になるので大きな声を出せる人のもとで大規模にやるのがいいのかな?と思ってしまいます。
Copyright (c) 2001-2014 Parsley, All rights reserved.