パスワードを忘れた? アカウント作成
12830598 journal
中国

yasuokaの日記: 通用規範漢字表とGB 2312における漢字の配列

日記 by yasuoka

ネットサーフィンしていたところ、辻田正雄の『「通用規範漢字表」について』(佛教大学文学部論集, 第100号(2016年3月), pp.27-42)という論文に行き当たった。2013年に「通用規範漢字表」が出来上がるまでのスッタモンダが描かれており、個人的には楽しく読めたのだが、文字コード屋の私(安岡孝一)としては、どうしても納得できかねる部分があった。

「通用規範漢字表」の各級内の配列は 一 丨 ノ ヽ 乙 の形序配列である。これは、《GB13000.1字符集汉字字序(笔画序)规范》に従ったものである。その理由は多音字や定音未決定字等の存在から音序は不都合であり、形序の唯一性を重視したことである(39)

(39) 王敏、陈双新《字表中的字是如何排序的?》《语言文字周报》2015年4月22日。《GB13000.1 字符集汉字字序(笔画序)规范》は《GB 2312-80信息处理交换用汉字编码字符集・基本集》(1981年5月1日実施)の配列と基本的に同じである。「通用規範漢字表」がコンピュータ処理をも考慮したものであることはこの配列からも窺うことができる。

GB 2312-80における漢字の配列は、第一級漢字(16-01~55-89)がピンインのアルファベット順、第二級漢字(56-01~87-94)が簡化字の部首画数順である。「形序配列」ではない。また、GB 13000は、いわゆるCJKの康煕字典順であり、やはり「形序配列」ではない。その一方でGF 3003-1999は、確かに「形序配列」ではあるものの、CJK統合漢字20902字のみを並べ直したものであり、「通用規範漢字表」を議論するには不十分だ。

もちろん、「通用規範漢字表」がコンピュータ処理をも考慮したものであることは、現時点においては間違いない。ただしそれは、問題となっていた6774「⿰土夅」・7146「⿰石达」・7373「⿰钅麦」の3字が、ISO/IEC 10646:2014 Amendment 2 (2016年5月1日制定)において、それぞれU+9FCD・U+9FCE・U+9FCFに収録されたからであり、そのための努力を中国その他が惜しまなかったからである。「通用規範漢字表」が「形序配列」になっているのは確かに事実なのだろうが、残念ながらそれは、現代的なコンピュータ処理とは全く無関係である。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

計算機科学者とは、壊れていないものを修理する人々のことである

読み込み中...