アカウント名:
パスワード:
とりあえずはBOM付きでもいいとにかくShift_JISをデフォルトから外してほしい
プライベートなら適当にエディタを使うからいいけど、仕事だとメモ帳で扱って問題が出ないかがポイントになったりするからなぁ
UTF-8のデフォルトはBOM無しにしてほしい。あとLFにも対応してくれたらそれで十分
>UTF-8のデフォルトはBOM無しに
逆だろunixがBOM付きUTF-8をサポートするのが正解
Unix関係ないよ
いやほんとそれ。BOMはUNICODE仕様に定められた正式な表現なんだから対応してほしい。
CR も LF も UNICODE どころか ASCII から存在するがWindows は CR+LF 、 Unix 系は LF Only なのは別に良いのだろうか。
それともあらゆるシステムが CR+LF と LF Only の両方に対応すべきと言い出す?
>BOMはUNICODE仕様に定められた正式な表現UNICODE 仕様では UTF-8 の BOM を通さないシステムがあることも認めているし、どちらが正しいなんてことは一言も言っていないよ。
BOMってZERO WIDTH NO-BREAK SPACEを先頭に置くってだけだよ。「サポート」って何のことを言ってる?ZERO WIDTH NO-BREAK SPACEとして扱うなって言ってる?
shebang で BOM 部分を飛ばして判定するようにしてくれってことだろ。BOM有りで困るケースってのは、それぐらいしか思いつかん。
xxx.d/*.conf を include するような設定ファイル形式は多数あるけどBOM付いてるとだいたい死ぬ
それはinclude指定でBOMを正しく処理出来ないバグ。UNICODE仕様対応モレですね。
>BOMを正しく処理出来ない何をもって『正しい』とするのか。UNICODEの規格ではBOMの存在を許容してはいるが、『BOMを適切に無視する』ことのみが正しいとあらゆるシステムに対して強制しているわけではない。
UTF-8の利点はASCII互換なのにBOMはそれを破壊してるからね
> UTF-8の利点はASCII互換ここが厄介で、基本ASCIIの設定ファイルなんかにちょろっと非ASCIIのコメントを付けたりするとエンコーディングの自動判別に失敗しやすい。他にもASCII互換のエンコーディングは多いから、そっちに誤判定されることがある。BOMがあると、その点失敗したことがないので個人的には歓迎。
なるほどね〜文字コード判定を確実なモノに出来るのか。思いつかなかった。
まあ判定しなきゃアカン状況がそもそも問題ですが。。。
BOM有りで困るケースってのは、それぐらいしか思いつかん。
昔、PHPでは散々苦しめられた。
>「サポート」って何のことを言ってる?
BOM付きutf-8でも、shbangでエラー吐かないようにする。
Unicodeの仕様では、UTF-8でBOMを使うことを禁止はしていないが、使わない方が望ましいとしている。メモ帳の実装がよくない。UTF-16では逆。
正直コイツに感しては「ルールの一貫性が欠けてるのが悪い」と思わんでもない。
BOM付きUTF8をきちんと処理できるよう、不完全なソフトを改修すればよろし
BOMがあるとどういうときに困るんです?
PHPとunix系のスクリプトは間違いなく死ぬ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy
デフォルトの文字コードをUTF-8にして欲しい (スコア:0)
とりあえずはBOM付きでもいい
とにかくShift_JISをデフォルトから外してほしい
プライベートなら適当にエディタを使うからいいけど、
仕事だとメモ帳で扱って問題が出ないかがポイントになったりするからなぁ
Re:デフォルトの文字コードをUTF-8にして欲しい (スコア:0)
UTF-8のデフォルトはBOM無しにしてほしい。
あとLFにも対応してくれたらそれで十分
Re: (スコア:0)
>UTF-8のデフォルトはBOM無しに
逆だろ
unixがBOM付きUTF-8をサポートするのが正解
Re: (スコア:0)
Unix関係ないよ
Re: (スコア:0)
いやほんとそれ。BOMはUNICODE仕様に定められた正式な表現なんだから対応してほしい。
Re: (スコア:0)
CR も LF も UNICODE どころか ASCII から存在するが
Windows は CR+LF 、 Unix 系は LF Only なのは
別に良いのだろうか。
それともあらゆるシステムが CR+LF と LF Only の両方に
対応すべきと言い出す?
Re: (スコア:0)
>BOMはUNICODE仕様に定められた正式な表現
UNICODE 仕様では UTF-8 の BOM を通さないシステムがあることも認めているし、
どちらが正しいなんてことは一言も言っていないよ。
Re: (スコア:0)
BOMってZERO WIDTH NO-BREAK SPACEを先頭に置くってだけだよ。
「サポート」って何のことを言ってる?
ZERO WIDTH NO-BREAK SPACEとして扱うなって言ってる?
Re: (スコア:0)
shebang で BOM 部分を飛ばして判定するようにしてくれってことだろ。
BOM有りで困るケースってのは、それぐらいしか思いつかん。
Re: (スコア:0)
xxx.d/*.conf を include するような設定ファイル形式は多数あるけどBOM付いてるとだいたい死ぬ
Re: (スコア:0)
それはinclude指定でBOMを正しく処理出来ないバグ。
UNICODE仕様対応モレですね。
Re: (スコア:0)
>BOMを正しく処理出来ない
何をもって『正しい』とするのか。
UNICODEの規格ではBOMの存在を許容してはいるが、
『BOMを適切に無視する』ことのみが正しいと
あらゆるシステムに対して強制しているわけではない。
Re: (スコア:0)
UTF-8の利点はASCII互換なのにBOMはそれを破壊してるからね
Re: (スコア:0)
> UTF-8の利点はASCII互換
ここが厄介で、基本ASCIIの設定ファイルなんかにちょろっと非ASCIIのコメントを付けたりするとエンコーディングの自動判別に失敗しやすい。他にもASCII互換のエンコーディングは多いから、そっちに誤判定されることがある。
BOMがあると、その点失敗したことがないので個人的には歓迎。
Re: (スコア:0)
なるほどね〜文字コード判定を確実なモノに出来るのか。思いつかなかった。
まあ判定しなきゃアカン状況がそもそも問題ですが。。。
Re: (スコア:0)
BOM有りで困るケースってのは、それぐらいしか思いつかん。
昔、PHPでは散々苦しめられた。
Re: (スコア:0)
>「サポート」って何のことを言ってる?
BOM付きutf-8でも、shbangでエラー吐かないようにする。
Re: (スコア:0)
Unicodeの仕様では、UTF-8でBOMを使うことを禁止はしていないが、
使わない方が望ましいとしている。メモ帳の実装がよくない。
UTF-16では逆。
Re: (スコア:0)
正直コイツに感しては「ルールの一貫性が欠けてるのが悪い」と思わんでもない。
Re: (スコア:0)
BOM付きUTF8をきちんと処理できるよう、不完全なソフトを改修すればよろし
Re: (スコア:0)
BOMがあるとどういうときに困るんです?
Re: (スコア:0)
PHPとunix系のスクリプトは間違いなく死ぬ