パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

文字エンコーディングはUTF8で本当に十分なのか?」記事へのコメント

  • by Anonymous Coward
    作り手が意識することなく扱えれば、それでいいんです。。。
    「~」の文字化け問題とかめんどくさー(;´Д`)
    • by Anonymous Coward
      文字化けはUTF-8をShift_JIS中継して下手に表示しようとするから起きるんでしょ。
      UTF-8しか無ければ問題ない。
      • UTF-8しか無ければ問題ない。
        Unicode 信者って必ずそういうけど、なんで?

        過去のデータはすべて捨てろってこと?

        • シフトJIS(Shift_JISやWindows-31J)、ISO-2022-JPやCP50220からUTF-8に変換してそれをUnicode対応のフォントで表示すればどっちに割り当てられようが両方表示されるから何の問題もない。
          UTF-8をShift_JISに変換すりゃ、ない文字は見えなくなるわな。
          いつまで日本の隅っこでシフトJISなんかつついてなきゃならんのだ。

          メールもUTF-8でうだうだ言ってくる人はいつまで古いソフト使ってるのかね。セキュリティ大丈夫? とか、Webで半角カナは使わないでくださいっていつの時代の文字コード判定だとか思うわけだ。コード判定がやりにくくなるというより、とりあえずまじないぐらいに思ってるんでしょな。
          いちいち全角半角指定してないで、それぐらいサーバ側で変換かけろ、とか、言いたいことは山のよう。
          • > Webで半角カナは使わないでくださいっていつの時代の文字コード判定だとか思うわけだ。

            は? いわゆる半角カナを使うべきでないというのは、文字コード判別とはまったく別の理由ですが。
            いわゆる全角アルファベットを使うべきでないというのと同じです。規格ぐらい読みなさい。
            • > は? いわゆる半角カナを使うべきでないというのは、文字コード判別とはまったく別の理由ですが。
              > いわゆる全角アルファベットを使うべきでないというのと同じです。規格ぐらい読みなさい。
              「全角アルファベットを使うべきでない」は初めて聞きました。
              どのあたりの規格か知りたいです。
              #気分の問題じゃなかったんだ…

              「半角カナを使うな」は、単純に文字コードの制限だったと思うんですが。
               8ビット目を使わないほうがいい(正しく処理できないサーバやクライアントが多かったから) → 7ビットで表現するISO-2022-JPを用意 → ISO-2022-JPには半角カナが定義されていない → 半角カナを使うな
              • 「全角アルファベットを使うべきでない」は初めて聞きました。
                どのあたりの規格か知りたいです。

                少なくともUnicode Standard、JIS X 0202、JIS X 0208、JIS X 0213には、そのへんの変な文字は使うなと明記されています。

              • JIS X 02~の仕様では互換性以外では「使用できない」ですよね。
                「全角アルファベットを使うべきでない」という仕様は無いと考えていいでしょうか?
                なんというか、MUST NOT(例外条件ありなのはMUST NOTにならないのかな?)ではなく、SHOULD NOTにあたる文言というか…

                因みに、Unicode Standardの「そのへんの変な文字は使うな」はJIS X 0221での禁止ということでしょうか?

                #探し方がへたなだけかなぁ
              • 「全角アルファベットを使うべきでない」という仕様は無いと考えていいでしょうか?

                本当にちゃんと探しましたか?

                6.5.1で規定する漢字集合とISO/IEC 646の国際基準版とを同時に用いる場合、ISO/IEC 646で規定される図形文字と同じ図形文字は用いてはならない。

                と書いてありますが。

                因みに、Unicode Standardの「そのへんの変な文字は使うな」はJIS X 0221での禁止ということでしょうか?

                Unicode StandardといえばUnicode Standard

              • そんなピンポイントで引用されると制限の真意がつかみかねると思うので、もうちょい先まで引用したものを。

                JIS X 0208
                7.2 ISO/IEC 646の国際基準版(IRV)と同時に用いる場合の符号

                6.5.1で規定する漢字集合とISO/IEC 646の国際基準版とを同時に用いる場合、ISO/IEC 646で規定される図形文字と同じ図形文字は用いてはならない。ただし、これまでの慣用的な利用との互換性を目的としてだけ、付随書5表2に規定する文字をISO/IEC 646で規定される文字とは異なった図形文字として用いてもよい。

                この「異なった図形文字として用いてもよい」という表現は、ISO/IEC 2022の翻訳規格であるJIS X 0202の下記の部分を受け

              • 要はJIS X 0208の方のラテン文字が変な文字だから使用禁止という訳ではなく、同じ文字が異なる符号で存在するので、どっちかに統一しましょうということが示されていたわけです。

                違いますよ。原因と結果が逆です。

                そもそも同じ名前のついた同じ文字なのだから、本当は内部での扱い(検索など)や表示で区別をしてはいけないんです。
                ところがその辺をよく分かってないエセ技術者が、別の文字として扱っちゃったわけですね。
                そういう世間の事情をくんで、JISでは1997年だったかの版で互換性のために代替名称として存在だけは認め、さらに『そういう変な文字は使うな』と明記したわけです。

                なのでもう「全角〜」「半角

              • そもそも同じ名前のついた同じ文字なのだから、本当は内部での扱い(検索など)や表示で区別をしてはいけないんです。
                ところがその辺をよく分かってないエセ技術者が、別の文字として扱っちゃったわけですね。
                そういう世間の事情をくんで、JISでは1997年だったかの版で互換性のために代替名称として存在だけは認め、さらに『そういう変な文字は使うな』と明記したわけです。

                両者は同じ文字であるといいつつ、わざわざJIS X 0208/0213の方の文字を「そういう変な文字」と、あたかもJIS X 0201の文字とは別の文字のように呼ぶ理由は何でしょう。規格内には「そういう変な文字」もしくはそれに類する表現は無いにも関わらずです。

              • by kanie (911) on 2007年03月14日 11時29分 (#1125836)
                あたかもJIS X 0201の文字とは別の文字のように呼ぶ理由は何でしょう。

                別の文字として扱う場合の話なのですから、別の文字として扱うことに何も問題はないですね。

                たとえば今やっている話みたいな両者の文字をあえて区別して扱わなければならない場合には、そういう呼び名を出すことに問題は無いですよね。

                だめですね。あなたはまだレイヤーが混ざっています。
                『代替名称を使って別の文字とみなす場合』だけではなく、『一つの符号化方式で複数の文字集合を扱った場合に、同じ文字が複数のコードポイントにあらわれる場合』があります。後者では半角・全角は不適です。

                親コメント
              • 別の文字として扱う場合の話なのですから、別の文字として扱うことに何も問題はないですね。

                同じ文字なのだから異なる扱いをしてはいけないのにエセ技術者が——という話だったような気がしますが、それはともかくとして。両者は同じ文字であるのでどちらが変な文字という分けでもないですし、一方の文字を用いてはならない理由もJIS X 0208/0213の方が変だからという訳でもありません。そのことを知っていて何故わざわざ「変な文字」と称するのでしょう?

                『代替名称を使って別の文字とみなす場合』だけではなく、『一つの符号化方式で複数の文字集合を扱った場合に、同じ

              • by kanie (911) on 2007年03月16日 13時27分 (#1127034)
                それらは分けて扱うことはできません。

                まったく別物ですよ。混同しているのでは?
                後者は『両者を異なった文字として用い』ない場合です。

                親コメント

ナニゲにアレゲなのは、ナニゲなアレゲ -- アレゲ研究家

処理中...