yasuokaの日記: 大漢和1337「兀」と7542「兀」と7538「尢」と7539「尢」は別字なのか 4
日記 by
yasuoka
一昨日と昨日の私(安岡孝一)の日記の続きなのだが、では、大漢和辞典の1337「兀」と7542「兀」と7538「尢」と7539「尢」は別字なのか。1337は音がゴツ、7542と7538はオウ、7539はユウらしいので、何となく同形異字が妙なバッティングを起こしているように見える。
JIS X 0208は1997年の改正で、49区26点「兀」に「M1337」と「M7542」を、53区87点「尢」に「M7538」と「M7539」を、それぞれ示している。つまり、JIS X 0208では、大漢和1337と7542は見分けられないし、大漢和7538と7539も見分けられない、ということだ。これに対し戸籍統一文字は、「兀」を015460と085690に、「尢」を085670と085680に、それぞれ分けて収録している。変態的なのがCNS 11643で、「兀」は1-4442にまとめられているが、「尢」は1-4452と4-2134に分けられていて、噂によればBIG5の呪いがかかっているらしい。
では、ISO/IEC 10646はと言うと、1337「兀」と7542「兀」はU+5140とU+FA0Cに、7538「尢」と7539「尢」はU+5C22とU+2F875に、それぞれ収録されている。端的には、「書」と「書」同様の扱いであり、字形で分けて互換漢字、というのが、とりあえずは既定路線なのだろう。ただ、U+FA0Cに対応するIVSが<U+5140 U+FE00>、U+2F875に対応するIVSが<U+5C22 U+FE00>、となっている点については、もう少し議論が必要だと思う。
ろすとあふたーのーまらいぜーしょん (スコア:1)
「兀」と「兀」が両方ともU+5140、「尢」と「尢」が両方ともU+5C22 (ついでに言うと2日前の「書」と「書」も両方U+66F8) になっているのは意図的なのでしょうか。
Re:ろすとあふたーのーまらいぜーしょん (スコア:3)
スラッシュドットの日記のタイトルにU+2Fxxxを使おうとすると、その文字が消えてしまうのです。で、/xxx;とか書くと、今度は検索時に微妙なことになるみたいなのです。うーむ。
Re:ろすとあふたーのーまらいぜーしょん (スコア:1)
あとUTS#37 [unicode.org]の定義
によると<U+5140 U+FE00>や<U+5C22 U+FE00>や<U+66F8 U+FE00>をIVSと呼ぶのは正しくないような気がします。
Re:ろすとあふたーのーまらいぜーしょん (スコア:2)
はい、私もそう思います。というか、ちゃんとしたIVSがほしいので、あえてそう書いてるわけです。