パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

新元号の発表は今年の年末以降に」記事へのコメント

  • 2文字なのは確定してるんだから、設定で変えられるようにしてテストしろよ
    まさか、埋め込んでるの!?

    • by Anonymous Coward

      葛城市の「葛城」(U+845B U+E0100 U+57CE)みたいにIVSを含んでいたりしたら大変です!
      漢字2文字と言いつつ、UCSで3文字、UTF-16で4ワード、UTF-8では10バイトもあります。2文字だから大丈夫なんて、甘い甘い。

      • by Anonymous Coward

        10バイトだと何が困るのかさっぱりわからんのだが。むしろ10バイトだと対応できないような柔軟性のないコードで許される現場って、どんだけ甘いんだ。

        • by Anonymous Coward

          すごい自信ですね。データベースのバイト長制限とか、帳票のレイアウトとか、文字コード変換とか、入力文字数のバリデーションとか、全文検索の異体字対応とか、思いつくことなんていくらでもあると思いますが・・・。
          そこまで十分に考えきっているシステムはほとんどないですね。同じUTF-8ですら、IVSのU+E0100を、いったんUTF-16のサロゲートペアにしてからUTF-8にして6バイトにしてしまう(それを正しいと定義している)処理系もありますからね。

          • by Anonymous Coward

            まったく意味不明。挙げた例のすべてで年号変更が無関係。

            データベースのバイト長制限 →もしかして、「平成」をUTF-8で表現すると10バイトになることを知らない人?
            帳票のレイアウト →表示が2文字のままで変わらないのだからレイアウトは影響ない
            文字コード変換 →意味不明。自分の言ってることわかってる?
            入力文字数のバリデーション →あなたのシステムは「平成」がバリデーションエラーになってたわけか
            全文検索の異体字対応 →文字単位の異体字対応なら年号無関係だし、そもそも極めて優先順位が低い

            • >「平成」をUTF-8で表現すると10バイトになることを知らない人?

              6バイトになると思っていたのですが、10バイトの場合には具体的にどのようなコードになるのでしょうか?
              --
              Leshade Entis
              親コメント
              • by Anonymous Coward

                u5e73-ue0101とかだったらおもしろいな。そんなの見たことないけど。

              • by Anonymous Coward
                バイトオーダーマークと平成と末尾のNULに決まってるだろ
              • by Anonymous Coward

                バイトオーダーマークって1バイトでは無いよね…?
                NULLは入らないんじゃ無いかな
                UTF8ではBOMはそもそも必要ないけど

              • by Anonymous Coward

                Pascal フォーマットで Length が32ビット
                なら10バイトになるかも。

                UTF-8でPascalフォーマットでの保存ってシステムって見たことはないけど、世の中にはあるんだろうな。

海軍に入るくらいなら海賊になった方がいい -- Steven Paul Jobs

処理中...