パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Webで利用される文字コード、UTF-8がもうすぐ50%を突破 」記事へのコメント

  • 自分のすべての HTML ファイルを Shift JIS で書いてるんですが、UTF-8 化するには
    何をどうすればよい?

    以前は Content-Type の Charset を Shift_JIS から UTF-8 に変えただけの“対応”を
    したペイジに出くわした事もあるけれど、今どきはさすがにないんでしょうか。

    • Re: (スコア:2, 興味深い)

      ファイルそのものの文字コードとContent-Typeを変えれば十分なのでは?
      UTF-8が「必要」と考えるならばその他の理由もあるでしょうから、その理由に対する変換をしてあげればいいだけで。「阿吽」を「阿呍」にするとか?
      # 別にShift_JISのファイルだってそのように表示はできるんだけどさ

      ちなみに私もほぼ全てShift_JISで書いていますが、当分変えるつもりはありません。

      Shift_JISのまま:
       メリット: 過去のブラウザでも読める
       デメリット: 別にない
      UTF-8:
       メリット: 別にない
       デメリット: 過去のブラウザで読めない

      私にとってはこんな感じなので。過去のブラウザを気にしても意味のないシーンでは、Shift_JIS or UTF-8で扱いやすい方を扱ってます。

      • Re: (スコア:1, 興味深い)

        by Anonymous Coward

        > UTF-8:
        >  メリット: 別にない
        >  デメリット: 過去のブラウザで読めない
        デメリット追加: ファイルサイズが150%ぐらい増加する。

        • すごくどうでもいいツッコミですが、増加するのは50%ですね。2バイト→3バイトですから。

          • by Anonymous Coward

            さらに補足します.

            UTF-8 では ASCII の範囲内は 1 バイトで表現できますから, HTMLファイルなら,よほど本文が長いものでない限り,50%も増えません.

            極端な例では, slashdot.jp のトップページでは,8%の違いでした (UTF-8 の場合 79423 Byte,Shift_JIS (CP932) の場合 73499 Byte)
            個人サイトなどでスクリプトや広告が無い場合でも,ちゃんと必要なタグを書いてあるならば,大抵は 30% 以下の増加でしょう.

            また,最近では HTML ファイルは圧縮転送される事が多いですが,圧縮した場合にはこの差はさらに縮みます.(大抵の場合は)

            • by Anonymous Coward on 2010年02月01日 8時22分 (#1711666)

              > また,最近では HTML ファイルは圧縮転送される事が多いですが,圧縮した場合にはこの差はさらに縮みます.(大抵の場合は)

              理想的な圧縮状況であれば圧縮した結果はその文書が持つ情報量に依存するので、
              元の文字コードが何であれ、同じサイズになるはずですね。

              親コメント

「毎々お世話になっております。仕様書を頂きたく。」「拝承」 -- ある会社の日常

処理中...