アカウント名:
パスワード:
これから UCS 正規化方式に切り替えるなら、UTF-16 ではなく UTF-32 を採用したほうがマシですかね。固定長ですし。現状で UTF-16 を採用するメリットって何も無いような…
UTF-32でも可変長が避けて通れない(日本に限ってもIVS [nikkeibp.co.jp]とか)なんていい加減常識になったと思ってたんだけど、なんでまだこんなこと言う人がいるの?
合成文字もありますしね。簡単な文字列処理ならともかく、エディタ等では合成された文字を1文字として認識できないとまずいですから。
大作:「立て、ジャイアントロボ!」GR:「ま゛っ」 ← U+309B : 独立した濁点GR:「ま゙っ」 ← U+3099 : 合成用濁点
ブラウザ次第ではありますが、上記のGRの台詞をマウスで選択したとき、上は「ま」と濁点が別々の文字、下は1つの文字として扱われているはず。
Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.6; ja; rv:1.9.3a4pre) Gecko/20100318 Minefield/3.7a4pre合字されました。
Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.6; ja-JP-mac; rv:1.9.2) Gecko/20100115 Firefox/3.6合字されましたが、濁点は文字の左上につきました。
Safari 4.0.5 (6531.22.7)合字されませんでした。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
吾輩はリファレンスである。名前はまだ無い -- perlの中の人
MANIFESTO (スコア:0)
思想の問題なら、もっと早い段階で判断すべきだったのでは? (スコア:0)
Re: (スコア:1)
これから UCS 正規化方式に切り替えるなら、UTF-16 ではなく UTF-32 を採用したほうがマシですかね。固定長ですし。
現状で UTF-16 を採用するメリットって何も無いような…
Re: (スコア:3, 参考になる)
UTF-32でも可変長が避けて通れない(日本に限ってもIVS [nikkeibp.co.jp]とか)なんていい加減常識になったと思ってたんだけど、なんでまだこんなこと言う人がいるの?
Re: (スコア:5, 参考になる)
合成文字もありますしね。簡単な文字列処理ならともかく、エディタ等では合成された文字を1文字として認識できないとまずいですから。
ブラウザ次第ではありますが、上記のGRの台詞をマウスで選択したとき、上は「ま」と濁点が別々の文字、下は1つの文字として扱われているはず。
Re: (スコア:0)
Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.6; ja; rv:1.9.3a4pre) Gecko/20100318 Minefield/3.7a4pre
合字されました。
Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.6; ja-JP-mac; rv:1.9.2) Gecko/20100115 Firefox/3.6
合字されましたが、濁点は文字の左上につきました。
Safari 4.0.5 (6531.22.7)
合字されませんでした。
Re:思想の問題なら、もっと早い段階で判断すべきだったのでは? (スコア:0)
> 合字されませんでした。
うちのSafari(同じversion)ではうまくいってます。
何が違うんだろ。