#1124237のACですが、emkさんの言う通り、確かに「シグネチャとして付加しても良い」となってますね
表(Table2-3)でも「BOM Allowed?」に「yes」となってますから、BOMが付加されたUTF-8文書をはじくのは明確に違反ですね
しかし、「Use of a BOM is neither required nor recommended for UTF-8」ともあるわけだから
生成系のソフトでは、やっぱりBOMは付加しない方が良いし、BOMの存在を前提にしたソフトはいかんのではないでしょうか
まぁ、実態はemkさんの言う通り容認されているわけだし、だとすると使うソフトも出るんだろうな…とは思いますが
UTF-8は結構好きなんだけど・・・ (スコア:0)
あるならある、無いならないとはっきりとして欲しいな。
それ以外に関しては、検索も容易だし、文字とのマッピング以外はわかりやすいので、好きなんですけどね
Re:UTF-8は結構好きなんだけど・・・ (スコア:1)
Re:UTF-8は結構好きなんだけど・・・ (スコア:2, 参考になる)
まあ世間にはダメダメな実装があふれてるわけですが。
Re:UTF-8は結構好きなんだけど・・・ (スコア:2, 興味深い)
つい最近NTBACKUPを使おうとして、バックアップ選択ファイルを
自分で書いてみました。
notepadでUnicodeを選択しろと言うことだったのでそうしました。
1番目に書いたフォルダがバックアップされませんでした。
散々ごちゃごちゃやって
・notepadでUnicodeを選択するとUTF-16(little endian,BOM付)になる。
・NTBACKUPではUTF-16(little endian,BOMなし)でないとうまく動かない。
らしい(手元のWindows XPでの実験結果)、という結論になりました。
OS標準ツールの間ですらこんな感じですから、いわんや他の実装をや。
Re:UTF-8は結構好きなんだけど・・・ (スコア:1, 興味深い)
Re:UTF-8は結構好きなんだけど・・・ (スコア:1)
Re:UTF-8は結構好きなんだけど・・・ (スコア:1)
駄目なものを駄目なまま支持する人がいるから、いつまでたっても
開発者がしわ寄せを食らって泣き続けるんだ。
大体、UTF-8って文字コードの定義なのに、なぜファイル形式にまで
干渉しているんだ。この仕様をみて、誰もおかしいとは思わなかったんだろうか。
Lv5以下の社員全員にデスマーチ!
Re:UTF-8は結構好きなんだけど・・・ (スコア:0)
Re:UTF-8は結構好きなんだけど・・・ (スコア:0)
この文書で言ってるのは、BOMなんて不要だけど、取っちゃうと別の
ソフトで不具合が起きるから「無視するだけで削除はやめようね」と
言ってるだけなんじゃない?
それにプロトコルでBOM使用を前提にするのは禁止と書いてるようにみえる…
斜め読みだから間違ってるかもしれないけど
これをもってUTF-8へのBOM付加を容認する気にはなれんです
Re:UTF-8は結構好きなんだけど・・・ (スコア:1)
読み返してみましたが確かにプロトコルでBOMの使用を強制できるケースについては触れてませんね。そこは訂正します。
プロトコルが常にUTF-8を使うわけでもなく、文字コード識別の手段も提供していない場合に、UCSであることのシグネチャとして使える、と書いてあります。もちろん100%確実に識別できるわけではありませんがそれはそもそも識別の手段を提供していないプロトコルのせいです。
あなたが個人的に嫌うのは勝手ですが、BOMが来る可能性があるときに弾くのを正当化するのはやめてくださいね。
ちなみにUnicode [unicode.org]も、ISO/IEC 10646 [dkuug.dk]もUTF-8へのBOMの付加を容認しています。
Re:UTF-8は結構好きなんだけど・・・ (スコア:0)
表(Table2-3)でも「BOM Allowed?」に「yes」となってますから、BOMが付加されたUTF-8文書をはじくのは明確に違反ですね
しかし、「Use of a BOM is neither required nor recommended for UTF-8」ともあるわけだから
生成系のソフトでは、やっぱりBOMは付加しない方が良いし、BOMの存在を前提にしたソフトはいかんのではないでしょうか
まぁ、実態はemkさんの言う通り容認されているわけだし、だとすると使うソフトも出るんだろうな…とは思いますが
Re:UTF-8は結構好きなんだけど・・・ (スコア:0)
Request For Comments だから、「公認」いうのはチョト違うのでは…?
Re:UTF-8は結構好きなんだけど・・・ (スコア:1)
という、ところの解釈はともかく、
> Request For Comments だから、「公認」いうのはチョト違うのでは…?
RFCのstateとかstatusについて学びましょう。
一応、standard trackに乗ってるRFCだしね。