Re:「Tiny Bug for nards」だと化けない (#974907) | Windowsのメモ帳(notepad)に文字化けするバグ

「Windowsのメモ帳(notepad)に文字化けするバグ」記事へのコメント

記事ページを表示すべてのコメント取得

検索131コメント Log In/Create an Account

「Tiny Bug for nards」だと化けない (スコア:5, 参考になる)

by patagon (1453)

「Tiny bug for nards」だと化ける。
「Tiny Bug for nards」だと化けない。

大文字2文字、2文字以上含まれていれば化けないのかな？

テストにしては少ないけど。
- Re:「Tiny Bug for nards」だと化けない (スコア:3, 参考になる)
  
  by Anonymous Coward
  
  文字コード判定アルゴリズムが垣間見える気がします。
  別コメントにもあるように、2バイトずつ区切ってリトルエンディアンの
  UTF-16として解釈するみたいだけど、「 B」(0x20,0x42→U+4220)はUnified
  CJK Ideographs(U+4E00 - U+9FBF)の範囲を逸脱し、CJK Ideographs
  Extension Aの範囲になってしまうので、Unicode文字列である可能性が
  ぐっと低くなるとみなされるのでしょう。
  どなたか、さらなる解析をお願いします。
  - Re:「Tiny Bug for nards」だと化けない (スコア:1, 興味深い)
    
    by Anonymous Coward
    
    UTF-16ってふつうBOMついてないか?
    UTF-8でも勝手にBOMつけるんだから先にそっちで判定すりゃいいのに。
    - Re:「Tiny Bug for nards」だと化けない (スコア:0)
      
      by Anonymous Coward
      
      BOMがついていたら、まっさきにそれで判別するでしょうが、
      ついていないファイルの場合、それ以外の特徴から類推するしかないでしょう。
      
      それに、BOMをつけるのはMSだけのローカルルールだったような気がします。
      Notepadが、MS製エディタで作られたファイルだけを読めればいいのなら、BOMだけを
      頼りに判別すればいいでしょうが。
      - Re:「Tiny Bug for nards」だと化けない (スコア:2, 参考になる)
        
        by keita (844) on 2006年07月08日 12時57分 (#974907) 日記
        
        > BOMをつけるのはMSだけのローカルルールだったような気がします。
        
        規格として定義されているのかは確認できませんが、
        RFC 2781 [rfc.net]の3.2 Byte order mark (BOM)、
        及びunicode.orgのFAQ、UTF-8, UTF-16, UTF-32 & BOM [unicode.org]
        でBOMについてふれらていますので、ローカルルールとまではいかない気がします。
        
        あとFAQでは、BOMはUTF16だけではなく、UTF32はもちろんUTF8でも付けられると書いてます。
        知らなかった...
        
        シェア
        
        親コメント
        
        Re:「Tiny Bug for nards」だと化けない (スコア:0)
        
        by Anonymous Coward
        
        > 規格として定義されているのかは確認できませんが、
        JIS X 0221の規格票 [jisc.go.jp]もUnicode 4.0 Book [unicode.org]も公開されているのに、どうして確認できないのですか?
        
        で、結論だけ言うとBOMは決してMicrosoftだけのローカルルールではありません。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

Windowsのメモ帳(notepad)に文字化けするバグ More ログイン

「Windowsのメモ帳(notepad)に文字化けするバグ」記事へのコメント

「Tiny Bug for nards」だと化けない (スコア:5, 参考になる)

Re:「Tiny Bug for nards」だと化けない (スコア:3, 参考になる)

Re:「Tiny Bug for nards」だと化けない (スコア:1, 興味深い)

Re:「Tiny Bug for nards」だと化けない (スコア:0)

Re:「Tiny Bug for nards」だと化けない (スコア:2, 参考になる)

Re:「Tiny Bug for nards」だと化けない (スコア:0)

スラド