アカウント名:
パスワード:
UTF-16 は UTF-8 の上位互換ではないよ。というか、UTF-8 のほうがよりマシな状況も多々ある。もし表現できる文字数上限を気にしているなら、32bit以上で符号化すべきだし。
UTF-16はASCII互換じゃないから、Apacheの設定がいい加減でエンコードの指定をmetaタグに依存しているページの場合、文字化けしないのかなぁ。
昔のIEはNUL文字を無視していた(文字通り存在しないかのように扱う)ので、ISO-8859-1の範囲内の文字しか使っていない分には文字化けは起きなかったようです。今はどうなってるか知りませんが。そんな連中が考えたからUTF-16の当初案 [srad.jp]はあんなすさまじい仕様だったんでしょうね。# この方式だとNUL文字を無視してUnicode BMPの文字しか使っていない限り、UCS-4のテキストでも文字化けが起きない。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
Stay hungry, Stay foolish. -- Steven Paul Jobs
部門名:次はUTF-16?・・・ぉぃぉぃ (スコア:1, 参考になる)
UTF-16 は UTF-8 の上位互換ではないよ。というか、UTF-8 のほうがよりマシな状況も多々ある。
もし表現できる文字数上限を気にしているなら、32bit以上で符号化すべきだし。
Re:部門名:次はUTF-16?・・・ぉぃぉぃ (スコア:1)
UTF-16はASCII互換じゃないから、Apacheの設定がいい加減でエンコードの指定をmetaタグに依存しているページの場合、文字化けしないのかなぁ。
1を聞いて0を知れ!
Re: (スコア:0)
昔のIEはNUL文字を無視していた(文字通り存在しないかのように扱う)ので、ISO-8859-1の範囲内の文字しか使っていない分には文字化けは起きなかったようです。今はどうなってるか知りませんが。そんな連中が考えたからUTF-16の当初案 [srad.jp]はあんなすさまじい仕様だったんでしょうね。
# この方式だとNUL文字を無視してUnicode BMPの文字しか使っていない限り、UCS-4のテキストでも文字化けが起きない。