パスワードを忘れた? アカウント作成
10822806 journal
日本

yasuokaの日記: 大漢和13928「書」と14294「書」は別字なのか

日記 by yasuoka

IVS vs UCS』(東洋学へのコンピュータ利用, 第24回研究セミナー(2013年3月15日), pp.75-90)の読者から、大漢和辞典の13928「書」と14294「書」は別字なのか、という趣旨の御質問をいただいた。13928は「𦘙」の省画、14294は「𦘠」の省画だということになっている。大雑把に異体字を考えると、13928の方が「𦘙・晝・書・昼」のグループで、14294の方が「𦘠・書」のグループということなので、まあ、同形異字と呼ばれるヤツだ。その意味では別字とも言えるが、だからといって、文字コード上かならずしも別々に扱うべきというわけでもない。

JIS X 0208は1997年改正で、29区81点「書」に、「M13928」と「M14924」を両方とも挙げた。つまり、29区81点は、大漢和13928と14924の両方を包摂していて、これらを区別しないということだ。これに対し戸籍統一文字は、156680156730という別々の文字コードに、これらをそれぞれ割り当てていて、実質上区別している。台湾のCNS 11643も同様で、6-3836と1-5573という別々の文字コードになっている。微妙なのがISO/IEC 10646で、U+2F8CCとU+66F8に一応、別々に割り当てられてはいるのだが、U+2F8CCはU+66F8の互換漢字扱いなので、別々ではないという言い方もできる。

ただ、このU+2F8CCをIVSで扱う際に、<U+66F8 U+FE00>で我慢できるかどうか、というのは微妙なセンだろう。私(安岡孝一)個人としては、あえて<U+665D U+E010x>に「書」を追加要求、という大技も考えなくはないのだが、これはこれでかなり危険なので無理すべきではないと思う。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

身近な人の偉大さは半減する -- あるアレゲ人

読み込み中...