アカウント名:
パスワード:
次はデフォルトの文字コードに手を付けてくれたまへ
Windowsの文字コードって複数あるの?
メモ帳のだぞデフォルトだとANSIになってる他にUnicode、Unicode big endian、UTF-8が使える
最近はHTMLやソースコード関連がUTF-8推奨なのでデフォルトをUTF-8に変えても良さそう
BOMは文字エンコーディングやエンディアンを確実に判別できるという重要な役割を果たしているわけなんだけどそれが無かったら判別のためにテキスト全文を読んで、どの文字コードだと解釈すれば矛盾が無いかを評価しなくてはならず非常に負荷が高いその上、本文が短い場合には複数の文字コードで矛盾が生じないケースもあって、自動判別が不可能な場合まである
複数のファイルを結合して問題が生じる?いや、BOMはファイルの先頭以外では無視しなければならない(幅0の空白文字)仕様なんだから不具合が生じる方がおかしい
そして、BOMのせいで動作しないアプリケーションはUnico
> BOMは文字エンコーディングやエンディアンを確実に判別できるという重要な役割を果たしているわけなんだけどUTF-8 にエンディアン関係ないじゃん。文字エンコーディングの判別に BOM を使うとか意味が分からない。SJISやEUC,JISにもBOMが付いてるとでも思ってるの?BOMが付いてる->Unicodeかな?くらいしか判別できないじゃん。
#3407358と同じACですか?
UTF-8自体にエンディアンは関係ありませんがUTF-8を処理するアプリケーションがどちらのCPUで動くかは関係あります。1byteずつ処理すると効率が悪いですから。勿論それはBOMの本来機能ではありません(むしろ目的の逆の使い方です)が本来機能を支障しない限りどう使おうとアプリケーション側の自由です。
BOMが付いてる->Unicodeかな?くらいしか判別できないじゃん。
そうですね。でも100%正しく判定できる手段が存在しないことは自明なので普通は「実用上十分」くらいの意味に捉えるんじゃないでしょうか。
あとこの議論は散々なされて新しい建設的で実際的なアイデアなど生まれる余地はないのでメモ帳の記事でおしゃべりするのはもう止めませんか?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
コンピュータは旧約聖書の神に似ている、規則は多く、慈悲は無い -- Joseph Campbell
いいぞ (スコア:0)
次はデフォルトの文字コードに手を付けてくれたまへ
Re: (スコア:0)
Windowsの文字コードって複数あるの?
Re: (スコア:0)
メモ帳のだぞ
デフォルトだとANSIになってる
他にUnicode、Unicode big endian、UTF-8が使える
最近はHTMLやソースコード関連がUTF-8推奨なので
デフォルトをUTF-8に変えても良さそう
Re: (スコア:5, すばらしい洞察)
BOM は重要 (スコア:1)
BOMは文字エンコーディングやエンディアンを確実に判別できるという重要な役割を果たしているわけなんだけど
それが無かったら判別のためにテキスト全文を読んで、どの文字コードだと解釈すれば矛盾が無いかを評価しなくてはならず
非常に負荷が高い
その上、本文が短い場合には複数の文字コードで矛盾が生じないケースもあって、自動判別が不可能な場合まである
複数のファイルを結合して問題が生じる?
いや、BOMはファイルの先頭以外では無視しなければならない(幅0の空白文字)仕様なんだから不具合が生じる方がおかしい
そして、BOMのせいで動作しないアプリケーションはUnico
Re:BOM は重要 (スコア:0)
> BOMは文字エンコーディングやエンディアンを確実に判別できるという重要な役割を果たしているわけなんだけど
UTF-8 にエンディアン関係ないじゃん。
文字エンコーディングの判別に BOM を使うとか意味が分からない。
SJISやEUC,JISにもBOMが付いてるとでも思ってるの?
BOMが付いてる->Unicodeかな?くらいしか判別できないじゃん。
Re: (スコア:0)
#3407358と同じACですか?
UTF-8自体にエンディアンは関係ありませんが
UTF-8を処理するアプリケーションがどちらのCPUで動くかは関係あります。
1byteずつ処理すると効率が悪いですから。
勿論それはBOMの本来機能ではありません(むしろ目的の逆の使い方です)が
本来機能を支障しない限りどう使おうとアプリケーション側の自由です。
そうですね。
でも100%正しく判定できる手段が存在しないことは自明なので
普通は「実用上十分」くらいの意味に捉えるんじゃないでしょうか。
あとこの議論は散々なされて新しい建設的で実際的なアイデアなど生まれる余地はないので
メモ帳の記事でおしゃべりするのはもう止めませんか?