パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Windowsのメモ帳(notepad)に文字化けするバグ」記事へのコメント

  • 一応XP Home(SP2)のメモ帳でためしましたが、ファイル(F)→開く(O)で出てくるウィンドウには、文字コード選択の欄があります。
    確かに、4+3+3+5byteの文字列なテキストファイルをクリックして選択するとANSI→Unicodeに変わります(中を見て判別してるのでしょう)。
    そのまま開くと文字化けするのは当然ですが、明示的にANSIを指定して開けば問題なかったです。

    文字コードの自動判別を間違うソフトなんて山ほどあります(自分が愛用してるEmEditorもよく間違います)。
    ブラウザだってHTMLで明示的に文字コード指定されてない場合間違うことがあります。
    一々取り上げるようなネタではないのでは?
    • by Anonymous Coward on 2006年07月08日 5時10分 (#974838)
      >文字コードの自動判別を間違うソフトなんて山ほどあります(自分が愛用してるEmEditorもよく間違います)。
      >ブラウザだってHTMLで明示的に文字コード指定されてない場合間違うことがあります。
      >一々取り上げるようなネタではないのでは?

      単なるASCIIテキストを読み間違えて文字化けするようなソフトを他にご存知でしたら教えて下さい。
      親コメント
      • by Anonymous Coward on 2006年07月08日 11時49分 (#974896)
        > 単なるASCIIテキストを読み間違えて文字化けするようなソフトを他にご存知でしたら教えて下さい

        ASCIIと衝突するような文字コードが、今まであまり使われてこなかった
        ということじゃないでしょうか。EUCにしてもシフトJISにしても、
        その他ISO2022系やISO8859系の文字コードにしても、ASCIIの上位互換を
        保っていますので、これらの間でASCIIテキストを誤判別することはありえません。
        (ISO2022系で、シフト状態が欠落した場合などを除き)。

        ただ、UTF-16はそうではない、ということ。今までUTF-16はまじめに
        使われてきませんでしたが、今後、もしプレーンテキストにUTF-16が広く
        使われるようなことがあれば、文字化けが生じるかもしれません。もし
        そうだとしたら、今回はその"はしり"と言えるでしょう。もしそうでは
        なければ、UTF-16をサポートしたnotepadの判断ミスということになるのでしょう。

        # もしかしたら、EBCDICもASCIIと衝突する?
        # でも、EBCDICが実際に使われていた時代には、
        # 自動判別なんて、リソースがもったいなくて
        # やってられなかったのかもしれません。。。

        親コメント
      • KDEのエディタ(kateとkwrite)でEUCテキストの文字化けを経験したことがあります。ファイルの中身は(diff取ってもmd5sum取ってもバイナリエディタで開いても)同じなのに、名前を「setup5.txt」にすると化け、「setup5_.txt」にすると化けないという謎な症状でした。

        #ちゃんと検証する前にHDDがクラッシュして
        #バグレポートできませんでしたが。
        --
        yp
        親コメント

あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー

処理中...