パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Webで利用される文字コード、UTF-8がもうすぐ50%を突破 」記事へのコメント

  • by Anonymous Coward

    UTF-16 は UTF-8 の上位互換ではないよ。というか、UTF-8 のほうがよりマシな状況も多々ある。
    もし表現できる文字数上限を気にしているなら、32bit以上で符号化すべきだし。

    • UTF-16はASCII互換じゃないから、Apacheの設定がいい加減でエンコードの指定をmetaタグに依存しているページの場合、文字化けしないのかなぁ。

      --
      1を聞いて0を知れ!
      • by Anonymous Coward on 2010年01月31日 15時26分 (#1711439)

        昔のIEはNUL文字を無視していた(文字通り存在しないかのように扱う)ので、ISO-8859-1の範囲内の文字しか使っていない分には文字化けは起きなかったようです。今はどうなってるか知りませんが。そんな連中が考えたからUTF-16の当初案 [srad.jp]はあんなすさまじい仕様だったんでしょうね。
        # この方式だとNUL文字を無視してUnicode BMPの文字しか使っていない限り、UCS-4のテキストでも文字化けが起きない。

        親コメント

ナニゲにアレゲなのは、ナニゲなアレゲ -- アレゲ研究家

処理中...