アカウント名:
パスワード:
>ITmediaの別記事によると、英数字などは2文字で1文字とカウントされる仕様になっているという。
いっそ単純に、入力データをバイト数で表示したら楽そう。
> 入力データをバイト数で
UTF-8のバイト数を想像する人と、シフトJISのバイト数を想像する人が出そう。twitterはUTF-8であろうと思うけど。
1byteカナで書いたら280文字行けるのかと思ったら、1byteカナで書いても140文字までだった。ドイヒー。
おじいちゃん、それ1byteじゃないのよ
半角カナはEUCで2バイト、UTFでは3バイトだっけ。
> UTFでは3バイトだっけ。
UTF-8 では3オクテット、UTF-16 では2オクテット、UTF-32 では4オクテットですね。
えっ、マイナスモデナのこれ?心が狭いなぁ
なんで1byteカナなら行けると思ったんだ?(そもそも今時カナが1byteの可能性は低いし)日本語は対象外だって書いてあるだろ。
Unicode文字プロパティ見ればそのへん(英数字なの漢字なのか/全角なのか半角なのかなどなど)の判別は簡単にできるんですよ。
でもTwitterの判定はUnicodeプロパティと全然関係ないみたいだし、そもそも「CJKのレガシーエンコーディング由来の文字か」という極めて恣意的な基準で決められているのであまり役に立たない(罫線素片のうちJISに含まれるものだけが全角とか)。emojiはEastAsianWidthにかかわらずだいたい全角でデザインされるし。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ソースを見ろ -- ある4桁UID
ただし日本語は対象外 (スコア:1)
>ITmediaの別記事によると、英数字などは2文字で1文字とカウントされる仕様になっているという。
いっそ単純に、入力データをバイト数で表示したら楽そう。
Re:ただし日本語は対象外 (スコア:1)
> 入力データをバイト数で
UTF-8のバイト数を想像する人と、シフトJISのバイト数を想像する人が出そう。
twitterはUTF-8であろうと思うけど。
Re:ただし日本語は対象外 (スコア:1)
1byteカナで書いたら280文字行けるのかと思ったら、1byteカナで書いても140文字までだった。
ドイヒー。
Re:ただし日本語は対象外 (スコア:3, すばらしい洞察)
おじいちゃん、それ1byteじゃないのよ
Re:ただし日本語は対象外 (スコア:1)
半角カナはEUCで2バイト、UTFでは3バイトだっけ。
Re:ただし日本語は対象外 (スコア:2)
> UTFでは3バイトだっけ。
UTF-8 では3オクテット、UTF-16 では2オクテット、UTF-32 では4オクテットですね。
Re:ただし日本語は対象外 (スコア:1)
走召糸色木亥火暴
Re: (スコア:0)
えっ、マイナスモデナのこれ?
心が狭いなぁ
Re: (スコア:0)
Re: (スコア:0)
なんで1byteカナなら行けると思ったんだ?(そもそも今時カナが1byteの可能性は低いし)
日本語は対象外だって書いてあるだろ。
Re: (スコア:0)
Unicode文字プロパティ見ればそのへん(英数字なの漢字なのか/全角なのか半角なのかなどなど)の判別は簡単にできるんですよ。
Re:ただし日本語は対象外 (スコア:1)
でもTwitterの判定はUnicodeプロパティと全然関係ないみたいだし、そもそも「CJKのレガシーエンコーディング由来の文字か」という極めて恣意的な基準で決められているのであまり役に立たない(罫線素片のうちJISに含まれるものだけが全角とか)。emojiはEastAsianWidthにかかわらずだいたい全角でデザインされるし。