パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Windows 10のメモ帳、CRLF以外の改行コードサポート追加へ」記事へのコメント

  • by Anonymous Coward

    次はデフォルトの文字コードに手を付けてくれたまへ

    • by Anonymous Coward

      Windowsの文字コードって複数あるの?

      • by Anonymous Coward

        メモ帳のだぞ
        デフォルトだとANSIになってる
        他にUnicode、Unicode big endian、UTF-8が使える

        最近はHTMLやソースコード関連がUTF-8推奨なので
        デフォルトをUTF-8に変えても良さそう

        • Re: (スコア:5, すばらしい洞察)

          notepadだど強制的にBOM付というところも改善してほしいところ。
          • by Anonymous Coward

            BOMは文字エンコーディングやエンディアンを確実に判別できるという重要な役割を果たしているわけなんだけど
            それが無かったら判別のためにテキスト全文を読んで、どの文字コードだと解釈すれば矛盾が無いかを評価しなくてはならず
            非常に負荷が高い
            その上、本文が短い場合には複数の文字コードで矛盾が生じないケースもあって、自動判別が不可能な場合まである

            複数のファイルを結合して問題が生じる?
            いや、BOMはファイルの先頭以外では無視しなければならない(幅0の空白文字)仕様なんだから不具合が生じる方がおかしい

            そして、BOMのせいで動作しないアプリケーションはUnico

            • by Anonymous Coward on 2018年05月13日 9時26分 (#3407371)

              > BOMは文字エンコーディングやエンディアンを確実に判別できるという重要な役割を果たしているわけなんだけど
              UTF-8 にエンディアン関係ないじゃん。
              文字エンコーディングの判別に BOM を使うとか意味が分からない。
              SJISやEUC,JISにもBOMが付いてるとでも思ってるの?
              BOMが付いてる->Unicodeかな?くらいしか判別できないじゃん。

              親コメント
              • by Anonymous Coward

                #3407358と同じACですか?

                UTF-8自体にエンディアンは関係ありませんが
                UTF-8を処理するアプリケーションがどちらのCPUで動くかは関係あります。
                1byteずつ処理すると効率が悪いですから。
                勿論それはBOMの本来機能ではありません(むしろ目的の逆の使い方です)が
                本来機能を支障しない限りどう使おうとアプリケーション側の自由です。

                BOMが付いてる->Unicodeかな?くらいしか判別できないじゃん。

                そうですね。
                でも100%正しく判定できる手段が存在しないことは自明なので
                普通は「実用上十分」くらいの意味に捉えるんじゃないでしょうか。

                あとこの議論は散々なされて新しい建設的で実際的なアイデアなど生まれる余地はないので
                メモ帳の記事でおしゃべりするのはもう止めませんか?

コンピュータは旧約聖書の神に似ている、規則は多く、慈悲は無い -- Joseph Campbell

処理中...