by
Anonymous Coward
on 2010年03月19日 17時48分
(#1735814)
現在Unicodeには「か」と合成済みの「が」と濁点が3種類も(合成用のU+3099、合成済みのU+309B、半角濁点)入ってますけど、これは正規化などの「問題」を引き起こすとしてむしろ非難されてますよね。ハングルも合成済みのと「合理的な」組み合わせ式のとKS X 1001互換用の3種類入ってました。 どうして単純にビット数を増やして何でもかんでも固定長に突っ込めばすべてが解決するという単純な頭の人が後を絶たないのか本当に不思議でなりません。すごい文字コード [srad.jp]でも使っててください。
MANIFESTO (スコア:0)
思想の問題なら、もっと早い段階で判断すべきだったのでは? (スコア:0)
Re: (スコア:1)
これから UCS 正規化方式に切り替えるなら、UTF-16 ではなく UTF-32 を採用したほうがマシですかね。固定長ですし。
現状で UTF-16 を採用するメリットって何も無いような…
Re: (スコア:3, 参考になる)
UTF-32でも可変長が避けて通れない(日本に限ってもIVS [nikkeibp.co.jp]とか)なんていい加減常識になったと思ってたんだけど、なんでまだこんなこと言う人がいるの?
Re: (スコア:2)
いっそ全面固定長のUTF-128を…
# zipでよく潰れそう
Re:思想の問題なら、もっと早い段階で判断すべきだったのでは? (スコア:0)
現在Unicodeには「か」と合成済みの「が」と濁点が3種類も(合成用のU+3099、合成済みのU+309B、半角濁点)入ってますけど、これは正規化などの「問題」を引き起こすとしてむしろ非難されてますよね。ハングルも合成済みのと「合理的な」組み合わせ式のとKS X 1001互換用の3種類入ってました。
どうして単純にビット数を増やして何でもかんでも固定長に突っ込めばすべてが解決するという単純な頭の人が後を絶たないのか本当に不思議でなりません。すごい文字コード [srad.jp]でも使っててください。
Re:思想の問題なら、もっと早い段階で判断すべきだったのでは? (スコア:2)
固定長であることとは関係しないのでは? たとえばUTF-32を一文字64bitの、余りは0埋めした固定長として扱う、とか。
Re: (スコア:0)
漢字も部首とかの部品を合成するようにすればいいんですよね。
漫画とかで漢字?っぽい必殺技が出てきても大丈夫だし。
Re:思想の問題なら、もっと早い段階で判断すべきだったのでは? (スコア:1)