パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Webで利用される文字コード、UTF-8がもうすぐ50%を突破 」記事へのコメント

  • 誤読した (スコア:-1, オフトピック)

    by Anonymous Coward on 2010年01月31日 12時25分 (#1711355)
    UTF-8のコードが不足してきたのかと思った

    もうちょっといい見出しつけてよ

    UTF-8の利用率が50%を越えたとか
    • by greentea (17971) on 2010年01月31日 15時37分 (#1711446) 日記

      UTF-8は符号化方法なので、もともとの文字コード表の仕様とちゃんと合うようにさえ選ばれていたら、足りなくなることはないはずです。

      そして、もともとの文字コード表については既に16bitじゃ足りなくなっていて1996年のUnicode 2.0で拡張されています。
      その規格は、一番最初の面を0面として、さらに追加で16面用意され、計17面用意されています。

      この中途半端な拡張は、UTF-8よりむしろUTF-16の都合によるもので、UTF-16でどうにか他の面の文字を参照する仕組みであるサロゲートペアが1024個の文字2つ=20bit=16bit*(2^4面)を利用するため、そういう制限になっています。

      UTF-8は、現行規格では有効な文字コードは第16面までと制限されていますが、その制限を取っ払えば、今と同じ方法で31bitまで表現できます。

      --
      1を聞いて0を知れ!
      親コメント
    • by Anonymous Coward

      いくらなんでも言掛かり
      あなたは自分の知識を疑った方がよいと思う

アレゲは一日にしてならず -- アレゲ見習い

処理中...