アカウント名:
パスワード:
まず、Unicode (UTF-8) のほうがいい理由。
これは、日本語人だけではなく全世界の人が被る問題なので、わかっててそうしているはずだと思います。にしても、どういうつもりなんでしょうね。たぶん、移行期の混乱の時代が終われば、どの字が実際よく使われ、どの字は事実上使われない、ということもなんとなく暗黙の了解みたいなのができてくると思うのですが、甘い期待なのかもしれません。
Unicode Consortium とか、Unicode のやることはみんな正しいと思ってるっぽい Markus Kuhn とかに聞いたらどんな答えが返ってくるのか、興味はありますが。
もうなんか書いても特定の人しかみてないよーな気もしますが(^^;、
あはははは.
仮にMozillaのように([moz-users:03965] 参照※)CP932ベースに統一するにしても、今度は「FULLWIDTH××って既存文字コードとの互換性のためにあるんじゃなかったけ。ということは将来的には『~』は「~」に変換されるのか?」とゆー疑問があったりします。(既に何らかの指針があるよーな気もしますが)
Unicode には Normalization forms という仕様があります.「同じ文字」(何をもって「同じ」とするかが,立場によって異なるのですが) に対して複数の表現形式があるので,データ処理に困る,ということから,「一つの形式に統一するための正規化規則を決めよう」という目的で考えられたものですが, これがまた4通りもあったりするのですね.
FULLWIDTH/HALFWIDTH 等の「互換文字」については, これも「互換文字は,対応する普通の文字に変換する」という方針のものと,そうでないものとがあります. (その他に,合成文字の扱いについて2種類あったりして,ややこしくなりますが.)
で,どういう場合にどの方針を取るとかいった 決まりがないので,結局は正規化をする人の考え次第 ということになります. まあ,混乱はこれからも続くということですね.
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
「毎々お世話になっております。仕様書を頂きたく。」「拝承」 -- ある会社の日常
Unicode 移行のメリットとデメリット (スコア:3, 参考になる)
まず、Unicode (UTF-8) のほうがいい理由。
Re:Unicode 移行のメリットとデメリット (スコア:1)
私はこれ、かなり疑問に思ってます。100% pure Unicodeな環境下で、IMEから「~」を入力した場合、それはWAVE DASHなんでしょうか? それともFULLWIDTH TILDEなんでしょうか? 「―」、「∥」、「-」についても同様の問題がありますよね。
# で、URLやNewsgroup名に「~」あったとしたら……(‥;
Re:Unicode 移行のメリットとデメリット (スコア:1)
これは、日本語人だけではなく全世界の人が被る問題なので、わかっててそうしているはずだと思います。にしても、どういうつもりなんでしょうね。たぶん、移行期の混乱の時代が終われば、どの字が実際よく使われ、どの字は事実上使われない、ということもなんとなく暗黙の了解みたいなのができてくると思うのですが、甘い期待なのかもしれません。
Unicode Consortium とか、Unicode のやることはみんな正しいと思ってるっぽい Markus Kuhn とかに聞いたらどんな答えが返ってくるのか、興味はありますが。
Re:Unicode 移行のメリットとデメリット (スコア:1)
> 甘い期待なのかもしれません。
甘い期待では(汗) 私が挙げた例だと、Windows環境とUNIX環境という二大メジャー(?)環境での相違だったりするわけで。
仮にMozillaのように([moz-users:03965]参照※)CP932ベースに統一するにしても、今度は「FULLWIDTH××って既存文字コードとの互換性のためにあるんじゃなかったけ。ということは将来的には『~』は「~」に変換されるのか?」とゆー疑問があったりします。(既に何らかの指針があるよーな気もしますが)
※これはこれでプラットフォームネイティブな要素(GUIのメニュー等)との整合性の問題が出ているようです。
> Unicode Consortium とか、Unicode のやることはみんな正しいと思ってるっぽい Markus Kuhn とかに聞いたらどんな答えが返ってくるのか、興味はありますが。
まさに「問い詰めたい。小一時間問い詰めたい」とゆーやつですねぇ。
Re:Unicode 移行のメリットとデメリット (スコア:1)
あはははは.
Unicode には Normalization forms という仕様があります.「同じ文字」(何をもって「同じ」とするかが,立場によって異なるのですが) に対して複数の表現形式があるので,データ処理に困る,ということから,「一つの形式に統一するための正規化規則を決めよう」という目的で考えられたものですが, これがまた4通りもあったりするのですね.
FULLWIDTH/HALFWIDTH 等の「互換文字」については, これも「互換文字は,対応する普通の文字に変換する」という方針のものと,そうでないものとがあります. (その他に,合成文字の扱いについて2種類あったりして,ややこしくなりますが.)
で,どういう場合にどの方針を取るとかいった 決まりがないので,結局は正規化をする人の考え次第 ということになります. まあ,混乱はこれからも続くということですね.