kubotaの日記: Unicode 3.1.1
日記 by
kubota
Unicode 3.1.1 Betaが出ています。
変更点のひとつに、EastAsianWidth.txt の更新があります。このファイルは Unicode Standard Annex #11 East Asian Width の付属データで、どの文字を「全角」「半角」と扱うべきかを定めています。
で、どんなふうに変更されたかを調べてみたら、
- U+00AE ® REGISTERED SIGN
- U+014B ŋ LATIN SMALL LETTER ENG
- U+02C4 ˄ MODIFIER LETTER UP ARROWHEAD
- U+02DF ˟ MODIFIER LETTER CROSS ACCENT
- U+2022 • BULLET
- U+2024 ․ ONE DOT LEADER
- U+203E ‾ OVERLINE
- U+2116 № NUMERO SIGN
- U+2153 ⅓ VULGAR FRACTION ONE THIRD
- U+215C ⅜ VULGAR FRACTION THREE EIGHTS
- U+215D ⅝ VULGAR FRACTION FIVE EIGHTS
- U+21B8 ↸ NORTH WEST ARROW TO LONG BAR
- U+21B9 ↹ LEFTWARDS ARROW TO BAR OVER RIGHTWARDS ARROW TO BAR
- U+21E7 ⇧ UPWARDS WHITE ARROW
がすべて、N→A に変更されています。つまり、「アジア文字じゃあない」から「文脈によっては全角」に変更されたわけです。
にしても、このなかで、 CJK 文字コードとの相互運用に関係するのは
- U+00AE (JIS X 0212 0x226e)
- U+014B (JIS X 0212 0x294b)
- U+2022 (Big5 0xa145)
- U+203E (Shift_JIS 0x7e, JIS X 0208 0x2131, Big5 0xA1C2)
- U+2116 (JIS X 0212 0x2271)
だけ。上記「CJK 文字コードとの相互運用」に挙げられている多数の問題点のほんのごく一部。
いったいなにを考えてるのだろう。