アカウント名:
パスワード:
ASCIIと衝突するような文字コードが、今まであまり使われてこなかった ということじゃないでしょうか。EUCにしてもシフトJISにしても、 その他ISO2022系やISO8859系の文字コードにしても、ASCIIの上位互換を 保っていますので、これらの間でASCIIテキストを誤判別することはありえません。 (ISO2022系で、シフト状態が欠落した場合などを除き)。
ただ、UTF-16はそうではない、ということ。今までUTF-16はまじめに 使われてきませんでしたが、今後、もしプレーンテキストにUTF-16が広く 使われるようなことがあれば、文字化けが生じるかもしれません。もし そうだとしたら、今回はその"はしり"と言えるでしょう。もしそうでは なければ、UTF-16をサポートしたnotepadの判断ミスということになるのでしょう。
# もしかしたら、EBCDICもASCIIと衝突する? # でも、EBCDICが実際に使われていた時代には、 # 自動判別なんて、リソースがもったいなくて # やってられなかったのかもしれません。。。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
Stableって古いって意味だっけ? -- Debian初級
わざわざ取り上げるようなことなのでしょうか? (スコア:4, 興味深い)
確かに、4+3+3+5byteの文字列なテキストファイルをクリックして選択するとANSI→Unicodeに変わります(中を見て判別してるのでしょう)。
そのまま開くと文字化けするのは当然ですが、明示的にANSIを指定して開けば問題なかったです。
文字コードの自動判別を間違うソフトなんて山ほどあります(自分が愛用してるEmEditorもよく間違います)。
ブラウザだってHTMLで明示的に文字コード指定されてない場合間違うことがあります。
一々取り上げるようなネタではないのでは?
Re:わざわざ取り上げるようなことなのでしょうか? (スコア:0)
>ブラウザだってHTMLで明示的に文字コード指定されてない場合間違うことがあります。
>一々取り上げるようなネタではないのでは?
単なるASCIIテキストを読み間違えて文字化けするようなソフトを他にご存知でしたら教えて下さい。
Re:わざわざ取り上げるようなことなのでしょうか? (スコア:3, 参考になる)
ASCIIと衝突するような文字コードが、今まであまり使われてこなかった
ということじゃないでしょうか。EUCにしてもシフトJISにしても、
その他ISO2022系やISO8859系の文字コードにしても、ASCIIの上位互換を
保っていますので、これらの間でASCIIテキストを誤判別することはありえません。
(ISO2022系で、シフト状態が欠落した場合などを除き)。
ただ、UTF-16はそうではない、ということ。今までUTF-16はまじめに
使われてきませんでしたが、今後、もしプレーンテキストにUTF-16が広く
使われるようなことがあれば、文字化けが生じるかもしれません。もし
そうだとしたら、今回はその"はしり"と言えるでしょう。もしそうでは
なければ、UTF-16をサポートしたnotepadの判断ミスということになるのでしょう。
# もしかしたら、EBCDICもASCIIと衝突する?
# でも、EBCDICが実際に使われていた時代には、
# 自動判別なんて、リソースがもったいなくて
# やってられなかったのかもしれません。。。
Re:わざわざ取り上げるようなことなのでしょうか? (スコア:1)
#ちゃんと検証する前にHDDがクラッシュして
#バグレポートできませんでしたが。
yp
Re:わざわざ取り上げるようなことなのでしょうか? (スコア:0)
# んでもEUCテキストをEUC指定で読み込んで化けてたのはいまだに謎。
# スコア下げのためAC