アカウント名:
パスワード:
つめれば12byteはさすがにいらないとは思いますが、 内部処理上では、基本コード+異体字用コード+オプションで、 4×3=12ってのはありそうな話ですね。 Unicode でも、サロゲート、コード本体、異体字タグ前後、 異体字コードとか駆使することになると、可変長で最大 そのくらいいきそうです。
大半の文字はそういった異体字は不要なわけで、変に全部を とりこもうとするコード体系を使うよりも、XMLでもなんでも 良いですが「タグづけ」を行ってアプリケーションレベルで 処理してしまうほうのが得策でしょう。 OSレベル(すなわち一般
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
UNIXはシンプルである。必要なのはそのシンプルさを理解する素質だけである -- Dennis Ritchie
あらゆる漢字を扱えること (スコア:1, 興味深い)
知り合いの印刷屋から聞いた話ですけど,例えば銀行からの
ダイレクトメールの場合,顧客に失礼がないように顧客の名前を
「忠実に」漢字で印刷しなければならないそうです。ちょっと
前まで戸籍登録の際に使用できる漢字には制限がなかったそうで,
そのために誤字までもが正式な名前に使用される漢字
Re:あらゆる漢字を扱えること (スコア:1, 興味深い)
つめれば12byteはさすがにいらないとは思いますが、 内部処理上では、基本コード+異体字用コード+オプションで、 4×3=12ってのはありそうな話ですね。 Unicode でも、サロゲート、コード本体、異体字タグ前後、 異体字コードとか駆使することになると、可変長で最大 そのくらいいきそうです。
大半の文字はそういった異体字は不要なわけで、変に全部を とりこもうとするコード体系を使うよりも、XMLでもなんでも 良いですが「タグづけ」を行ってアプリケーションレベルで 処理してしまうほうのが得策でしょう。 OSレベル(すなわち一般
Re:あらゆる漢字を扱えること (スコア:1)
SJISに存在しない文字(JEF文字)は4バイト文字で表現してますよ。
渡辺、斉藤、吉田、何でもこいってkanji
#はしご高とかのIBM選定文字は、SJISに存在しないとみなされて
#4バイト文字の領域を勝手に使われるので、激しくイヤです。
それ以前に読めなきゃ、、、 (スコア:0)
特に関東地方在住の方、その辺の違いが知りたいです。
俺が東京のデパートに逝った時、行き成り「佐賀県からお越しの中島(ナカジマ)様、、、」という可愛らしい女性のアナウンスがかかってきて一瞬誰かと疑ったよ。
まあ、佐賀県だから俺しか居なかった訳だけど、、、(w
あっ、因みに俺は佐賀県出身です。
俺
Re:それ以前に読めなきゃ、、、 (スコア:0)
濁ることが不自然ではないから。