アカウント名:
パスワード:
まず、Unicode (UTF-8) のほうがいい理由。
次に、どちらでもいい、もしくは、どちらともいいがたい点。
最後に、Unicode に移行したほうが悪くなる点。
完全にユーザである (開発は一切おこなわない) のなら、対応ソフトウェアの状況で、移行するほうがいいかどうかを決めればいいと思います。
私はこれ、かなり疑問に思ってます。100% pure Unicodeな環境下で、IMEから「~」を入力した場合、それはWAVE DASHなんでしょうか? それともFULLWIDTH TILDEなんでしょうか? 「―」、「∥」、「-」についても同様の問題がありますよね。
JIS X 0208 の範囲だけでもそれだけ問題になる文字があるわけですが,Unicode に移行すると対象になる文字はさらに増えます.
たとえば「Å」は,JIS X 0208 の範囲なら U+212B ANGSTROM SIGN でしょうけれど,その限定をなくせば,
わけですから.他にも,Σやμは2つずつあるし(ギリシャ文字アルファベットとしてのものと,記号としてのものと),「中点のような文字」や「横棒のような文字」や「空白のような文字」に至っては,数えるのが嫌になるほどあります.
これは、日本語人だけではなく全世界の人が被る問題なので、わかっててそうしているはずだと思います。にしても、どういうつもりなんでしょうね。たぶん、移行期の混乱の時代が終われば、どの字が実際よく使われ、どの字は事実上使われない、ということもなんとなく暗黙の了解みたいなのができてくると思うのですが、甘い期待なのかもしれません。
Unicode Consortium とか、Unicode のやることはみんな正しいと思ってるっぽい Markus Kuhn とかに聞いたらどんな答えが返ってくるのか、興味はありますが。
もうなんか書いても特定の人しかみてないよーな気もしますが(^^;、
あはははは.
仮にMozillaのように([moz-users:03965] 参照※)CP932ベースに統一するにしても、今度は「FULLWIDTH××って既存文字コードとの互換性のためにあるんじゃなかったけ。ということは将来的には『~』は「~」に変換されるのか?」とゆー疑問があったりします。(既に何らかの指針があるよーな気もしますが)
Unicode には Normalization forms という仕様があります.「同じ文字」(何をもって「同じ」とするかが,立場によって異なるのですが) に対して複数の表現形式があるので,データ処理に困る,ということから,「一つの形式に統一するための正規化規則を決めよう」という目的で考えられたものですが, これがまた4通りもあったりするのですね.
FULLWIDTH/HALFWIDTH 等の「互換文字」については, これも「互換文字は,対応する普通の文字に変換する」という方針のものと,そうでないものとがあります. (その他に,合成文字の扱いについて2種類あったりして,ややこしくなりますが.)
で,どういう場合にどの方針を取るとかいった 決まりがないので,結局は正規化をする人の考え次第 ということになります. まあ,混乱はこれからも続くということですね.
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
最初のバージョンは常に打ち捨てられる。
Unicode 移行のメリットとデメリット (スコア:3, 参考になる)
まず、Unicode (UTF-8) のほうがいい理由。
次に、どちらでもいい、もしくは、どちらともいいがたい点。
最後に、Unicode に移行したほうが悪くなる点。
完全にユーザである (開発は一切おこなわない) のなら、対応ソフトウェアの状況で、移行するほうがいいかどうかを決めればいいと思います。
Re:Unicode 移行のメリットとデメリット (スコア:1)
私はこれ、かなり疑問に思ってます。100% pure Unicodeな環境下で、IMEから「~」を入力した場合、それはWAVE DASHなんでしょうか? それともFULLWIDTH TILDEなんでしょうか? 「―」、「∥」、「-」についても同様の問題がありますよね。
# で、URLやNewsgroup名に「~」あったとしたら……(‥;
Re:Unicode 移行のメリットとデメリット (スコア:2, 興味深い)
JIS X 0208 の範囲だけでもそれだけ問題になる文字があるわけですが,Unicode に移行すると対象になる文字はさらに増えます.
たとえば「Å」は,JIS X 0208 の範囲なら U+212B ANGSTROM SIGN でしょうけれど,その限定をなくせば,
わけですから.他にも,Σやμは2つずつあるし(ギリシャ文字アルファベットとしてのものと,記号としてのものと),「中点のような文字」や「横棒のような文字」や「空白のような文字」に至っては,数えるのが嫌になるほどあります.
Re:Unicode 移行のメリットとデメリット (スコア:1)
これは、日本語人だけではなく全世界の人が被る問題なので、わかっててそうしているはずだと思います。にしても、どういうつもりなんでしょうね。たぶん、移行期の混乱の時代が終われば、どの字が実際よく使われ、どの字は事実上使われない、ということもなんとなく暗黙の了解みたいなのができてくると思うのですが、甘い期待なのかもしれません。
Unicode Consortium とか、Unicode のやることはみんな正しいと思ってるっぽい Markus Kuhn とかに聞いたらどんな答えが返ってくるのか、興味はありますが。
Re:Unicode 移行のメリットとデメリット (スコア:1)
> 甘い期待なのかもしれません。
甘い期待では(汗) 私が挙げた例だと、Windows環境とUNIX環境という二大メジャー(?)環境での相違だったりするわけで。
仮にMozillaのように([moz-users:03965]参照※)CP932ベースに統一するにしても、今度は「FULLWIDTH××って既存文字コードとの互換性のためにあるんじゃなかったけ。ということは将来的には『~』は「~」に変換されるのか?」とゆー疑問があったりします。(既に何らかの指針があるよーな気もしますが)
※これはこれでプラットフォームネイティブな要素(GUIのメニュー等)との整合性の問題が出ているようです。
> Unicode Consortium とか、Unicode のやることはみんな正しいと思ってるっぽい Markus Kuhn とかに聞いたらどんな答えが返ってくるのか、興味はありますが。
まさに「問い詰めたい。小一時間問い詰めたい」とゆーやつですねぇ。
Re:Unicode 移行のメリットとデメリット (スコア:1)
あはははは.
Unicode には Normalization forms という仕様があります.「同じ文字」(何をもって「同じ」とするかが,立場によって異なるのですが) に対して複数の表現形式があるので,データ処理に困る,ということから,「一つの形式に統一するための正規化規則を決めよう」という目的で考えられたものですが, これがまた4通りもあったりするのですね.
FULLWIDTH/HALFWIDTH 等の「互換文字」については, これも「互換文字は,対応する普通の文字に変換する」という方針のものと,そうでないものとがあります. (その他に,合成文字の扱いについて2種類あったりして,ややこしくなりますが.)
で,どういう場合にどの方針を取るとかいった 決まりがないので,結局は正規化をする人の考え次第 ということになります. まあ,混乱はこれからも続くということですね.
Re:Unicode 移行のメリットとデメリット (スコア:0)
デメリットといったほうがよい気はしますが、
新規に開発されているフォント群は Unicode
エンコーディングのものばかりだったりとか、
もはや商業的なリソースの割き方は Unicode 側に
完全に倒れているので、そちら以外はつらいって
のもありそうですね。
あとはどのタイミングで見切るか、なのかも。