アカウント名:
パスワード:
2文字なのは確定してるんだから、設定で変えられるようにしてテストしろよまさか、埋め込んでるの!?
葛城市の「葛城」(U+845B U+E0100 U+57CE)みたいにIVSを含んでいたりしたら大変です!漢字2文字と言いつつ、UCSで3文字、UTF-16で4ワード、UTF-8では10バイトもあります。2文字だから大丈夫なんて、甘い甘い。
10バイトだと何が困るのかさっぱりわからんのだが。むしろ10バイトだと対応できないような柔軟性のないコードで許される現場って、どんだけ甘いんだ。
すごい自信ですね。データベースのバイト長制限とか、帳票のレイアウトとか、文字コード変換とか、入力文字数のバリデーションとか、全文検索の異体字対応とか、思いつくことなんていくらでもあると思いますが・・・。そこまで十分に考えきっているシステムはほとんどないですね。同じUTF-8ですら、IVSのU+E0100を、いったんUTF-16のサロゲートペアにしてからUTF-8にして6バイトにしてしまう(それを正しいと定義している)処理系もありますからね。
まったく意味不明。挙げた例のすべてで年号変更が無関係。
データベースのバイト長制限 →もしかして、「平成」をUTF-8で表現すると10バイトになることを知らない人?帳票のレイアウト →表示が2文字のままで変わらないのだからレイアウトは影響ない文字コード変換 →意味不明。自分の言ってることわかってる?入力文字数のバリデーション →あなたのシステムは「平成」がバリデーションエラーになってたわけか全文検索の異体字対応 →文字単位の異体字対応なら年号無関係だし、そもそも極めて優先順位が低い
バイトオーダーマークって1バイトでは無いよね…?NULLは入らないんじゃ無いかなUTF8ではBOMはそもそも必要ないけど
Pascal フォーマットで Length が32ビットなら10バイトになるかも。
UTF-8でPascalフォーマットでの保存ってシステムって見たことはないけど、世の中にはあるんだろうな。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
物事のやり方は一つではない -- Perlな人
いやいや、馬鹿すぎだろ (スコア:0)
2文字なのは確定してるんだから、設定で変えられるようにしてテストしろよ
まさか、埋め込んでるの!?
Re: (スコア:0)
葛城市の「葛城」(U+845B U+E0100 U+57CE)みたいにIVSを含んでいたりしたら大変です!
漢字2文字と言いつつ、UCSで3文字、UTF-16で4ワード、UTF-8では10バイトもあります。2文字だから大丈夫なんて、甘い甘い。
Re: (スコア:0)
10バイトだと何が困るのかさっぱりわからんのだが。むしろ10バイトだと対応できないような柔軟性のないコードで許される現場って、どんだけ甘いんだ。
Re: (スコア:0)
すごい自信ですね。データベースのバイト長制限とか、帳票のレイアウトとか、文字コード変換とか、入力文字数のバリデーションとか、全文検索の異体字対応とか、思いつくことなんていくらでもあると思いますが・・・。
そこまで十分に考えきっているシステムはほとんどないですね。同じUTF-8ですら、IVSのU+E0100を、いったんUTF-16のサロゲートペアにしてからUTF-8にして6バイトにしてしまう(それを正しいと定義している)処理系もありますからね。
Re: (スコア:0)
まったく意味不明。挙げた例のすべてで年号変更が無関係。
データベースのバイト長制限 →もしかして、「平成」をUTF-8で表現すると10バイトになることを知らない人?
帳票のレイアウト →表示が2文字のままで変わらないのだからレイアウトは影響ない
文字コード変換 →意味不明。自分の言ってることわかってる?
入力文字数のバリデーション →あなたのシステムは「平成」がバリデーションエラーになってたわけか
全文検索の異体字対応 →文字単位の異体字対応なら年号無関係だし、そもそも極めて優先順位が低い
Re: (スコア:1)
6バイトになると思っていたのですが、10バイトの場合には具体的にどのようなコードになるのでしょうか?
Re: (スコア:0)
Re:いやいや、馬鹿すぎだろ (スコア:0)
バイトオーダーマークって1バイトでは無いよね…?
NULLは入らないんじゃ無いかな
UTF8ではBOMはそもそも必要ないけど
Re: (スコア:0)
Pascal フォーマットで Length が32ビット
なら10バイトになるかも。
UTF-8でPascalフォーマットでの保存ってシステムって見たことはないけど、世の中にはあるんだろうな。