アカウント名:
パスワード:
自分のすべての HTML ファイルを Shift JIS で書いてるんですが、UTF-8 化するには何をどうすればよい?
以前は Content-Type の Charset を Shift_JIS から UTF-8 に変えただけの“対応”をしたペイジに出くわした事もあるけれど、今どきはさすがにないんでしょうか。
ファイルそのものの文字コードとContent-Typeを変えれば十分なのでは?UTF-8が「必要」と考えるならばその他の理由もあるでしょうから、その理由に対する変換をしてあげればいいだけで。「阿吽」を「阿呍」にするとか?# 別にShift_JISのファイルだってそのように表示はできるんだけどさ
ちなみに私もほぼ全てShift_JISで書いていますが、当分変えるつもりはありません。
Shift_JISのまま: メリット: 過去のブラウザでも読める デメリット: 別にないUTF-8: メリット: 別にない デメリット: 過去のブラウザで読めない
私にとってはこんな感じなので。過去のブラウザを気にしても意味のないシーンでは、Shift_JIS or UTF-8で扱いやすい方を扱ってます。
> UTF-8:> メリット: 別にない> デメリット: 過去のブラウザで読めないデメリット追加: ファイルサイズが150%ぐらい増加する。
すごくどうでもいいツッコミですが、増加するのは50%ですね。2バイト→3バイトですから。
さらに補足します.
UTF-8 では ASCII の範囲内は 1 バイトで表現できますから, HTMLファイルなら,よほど本文が長いものでない限り,50%も増えません.
極端な例では, slashdot.jp のトップページでは,8%の違いでした (UTF-8 の場合 79423 Byte,Shift_JIS (CP932) の場合 73499 Byte)個人サイトなどでスクリプトや広告が無い場合でも,ちゃんと必要なタグを書いてあるならば,大抵は 30% 以下の増加でしょう.
また,最近では HTML ファイルは圧縮転送される事が多いですが,圧縮した場合にはこの差はさらに縮みます.(大抵の場合は)
> また,最近では HTML ファイルは圧縮転送される事が多いですが,圧縮した場合にはこの差はさらに縮みます.(大抵の場合は)
理想的な圧縮状況であれば圧縮した結果はその文書が持つ情報量に依存するので、元の文字コードが何であれ、同じサイズになるはずですね。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
あと、僕は馬鹿なことをするのは嫌いですよ (わざとやるとき以外は)。-- Larry Wall
Shift JIS→UTF-8変換。 (スコア:1)
自分のすべての HTML ファイルを Shift JIS で書いてるんですが、UTF-8 化するには
何をどうすればよい?
以前は Content-Type の Charset を Shift_JIS から UTF-8 に変えただけの“対応”を
したペイジに出くわした事もあるけれど、今どきはさすがにないんでしょうか。
Re: (スコア:2, 興味深い)
ファイルそのものの文字コードとContent-Typeを変えれば十分なのでは?
UTF-8が「必要」と考えるならばその他の理由もあるでしょうから、その理由に対する変換をしてあげればいいだけで。「阿吽」を「阿呍」にするとか?
# 別にShift_JISのファイルだってそのように表示はできるんだけどさ
ちなみに私もほぼ全てShift_JISで書いていますが、当分変えるつもりはありません。
Shift_JISのまま:
メリット: 過去のブラウザでも読める
デメリット: 別にない
UTF-8:
メリット: 別にない
デメリット: 過去のブラウザで読めない
私にとってはこんな感じなので。過去のブラウザを気にしても意味のないシーンでは、Shift_JIS or UTF-8で扱いやすい方を扱ってます。
Re: (スコア:1, 興味深い)
> UTF-8:
> メリット: 別にない
> デメリット: 過去のブラウザで読めない
デメリット追加: ファイルサイズが150%ぐらい増加する。
Re:Shift JIS→UTF-8変換。 (スコア:1)
すごくどうでもいいツッコミですが、増加するのは50%ですね。2バイト→3バイトですから。
Re: (スコア:0)
さらに補足します.
UTF-8 では ASCII の範囲内は 1 バイトで表現できますから, HTMLファイルなら,よほど本文が長いものでない限り,50%も増えません.
極端な例では, slashdot.jp のトップページでは,8%の違いでした (UTF-8 の場合 79423 Byte,Shift_JIS (CP932) の場合 73499 Byte)
個人サイトなどでスクリプトや広告が無い場合でも,ちゃんと必要なタグを書いてあるならば,大抵は 30% 以下の増加でしょう.
また,最近では HTML ファイルは圧縮転送される事が多いですが,圧縮した場合にはこの差はさらに縮みます.(大抵の場合は)
Re: (スコア:0)
> また,最近では HTML ファイルは圧縮転送される事が多いですが,圧縮した場合にはこの差はさらに縮みます.(大抵の場合は)
理想的な圧縮状況であれば圧縮した結果はその文書が持つ情報量に依存するので、
元の文字コードが何であれ、同じサイズになるはずですね。