#1124237のACですが、emkさんの言う通り、確かに「シグネチャとして付加しても良い」となってますね
表(Table2-3)でも「BOM Allowed?」に「yes」となってますから、BOMが付加されたUTF-8文書をはじくのは明確に違反ですね
しかし、「Use of a BOM is neither required nor recommended for UTF-8」ともあるわけだから
生成系のソフトでは、やっぱりBOMは付加しない方が良いし、BOMの存在を前提にしたソフトはいかんのではないでしょうか
まぁ、実態はemkさんの言う通り容認されているわけだし、だとすると使うソフトも出るんだろうな…とは思いますが
私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike
UTF-8は結構好きなんだけど・・・ (スコア:0)
あるならある、無いならないとはっきりとして欲しいな。
それ以外に関しては、検索も容易だし、文字とのマッピング以外はわかりやすいので、好きなんですけどね
Re:UTF-8は結構好きなんだけど・・・ (スコア:1)
Re:UTF-8は結構好きなんだけど・・・ (スコア:2, 参考になる)
まあ世間にはダメダメな実装があふれてるわけですが。
Re:UTF-8は結構好きなんだけど・・・ (スコア:0)
この文書で言ってるのは、BOMなんて不要だけど、取っちゃうと別の
ソフトで不具合が起きるから「無視するだけで削除はやめようね」と
言ってるだけなんじゃない?
それにプロトコルでBOM使用を前提にするのは禁止と書いてるようにみえる…
斜め読みだから間違ってるかもしれないけど
これをもってUTF-8へのBOM付加を容認する気にはなれんです
Re:UTF-8は結構好きなんだけど・・・ (スコア:1)
読み返してみましたが確かにプロトコルでBOMの使用を強制できるケースについては触れてませんね。そこは訂正します。
プロトコルが常にUTF-8を使うわけでもなく、文字コード識別の手段も提供していない場合に、UCSであることのシグネチャとして使える、と書いてあります。もちろん100%確実に識別できるわけではありませんがそれはそもそも識別の手段を提供していないプロトコルのせいです。
あなたが個人的に嫌うのは勝手ですが、BOMが来る可能性があるときに弾くのを正当化するのはやめてくださいね。
ちなみにUnicode [unicode.org]も、ISO/IEC 10646 [dkuug.dk]もUTF-8へのBOMの付加を容認しています。
Re:UTF-8は結構好きなんだけど・・・ (スコア:0)
表(Table2-3)でも「BOM Allowed?」に「yes」となってますから、BOMが付加されたUTF-8文書をはじくのは明確に違反ですね
しかし、「Use of a BOM is neither required nor recommended for UTF-8」ともあるわけだから
生成系のソフトでは、やっぱりBOMは付加しない方が良いし、BOMの存在を前提にしたソフトはいかんのではないでしょうか
まぁ、実態はemkさんの言う通り容認されているわけだし、だとすると使うソフトも出るんだろうな…とは思いますが