パスワードを忘れた? アカウント作成
748409 journal

kubotaの日記: Unicode 3.1.1

日記 by kubota

Unicode 3.1.1 Betaが出ています。

変更点のひとつに、EastAsianWidth.txt更新があります。このファイルは Unicode Standard Annex #11 East Asian Width の付属データで、どの文字を「全角」「半角」と扱うべきかを定めています。

で、どんなふうに変更されたかを調べてみたら、

  • U+00AE ® REGISTERED SIGN
  • U+014B ŋ LATIN SMALL LETTER ENG
  • U+02C4 ˄ MODIFIER LETTER UP ARROWHEAD
  • U+02DF ˟ MODIFIER LETTER CROSS ACCENT
  • U+2022 • BULLET
  • U+2024 ․ ONE DOT LEADER
  • U+203E ‾ OVERLINE
  • U+2116 № NUMERO SIGN
  • U+2153 ⅓ VULGAR FRACTION ONE THIRD
  • U+215C ⅜ VULGAR FRACTION THREE EIGHTS
  • U+215D ⅝ VULGAR FRACTION FIVE EIGHTS
  • U+21B8 ↸ NORTH WEST ARROW TO LONG BAR
  • U+21B9 ↹ LEFTWARDS ARROW TO BAR OVER RIGHTWARDS ARROW TO BAR
  • U+21E7 ⇧ UPWARDS WHITE ARROW

がすべて、N→A に変更されています。つまり、「アジア文字じゃあない」から「文脈によっては全角」に変更されたわけです。

にしても、このなかで、 CJK 文字コードとの相互運用に関係するのは

  • U+00AE (JIS X 0212 0x226e)
  • U+014B (JIS X 0212 0x294b)
  • U+2022 (Big5 0xa145)
  • U+203E (Shift_JIS 0x7e, JIS X 0208 0x2131, Big5 0xA1C2)
  • U+2116 (JIS X 0212 0x2271)

だけ。上記「CJK 文字コードとの相互運用」に挙げられている多数の問題点のほんのごく一部。

いったいなにを考えてるのだろう。

typodupeerror

コンピュータは旧約聖書の神に似ている、規則は多く、慈悲は無い -- Joseph Campbell

読み込み中...