
yasuokaの日記: 戸籍統一文字559970「⿺辶鳥」はUCSに追加されるのか 2
昨日および2017年12月26日の日記の読者から、戸籍統一文字559970「⿺辶鳥」はUCSに追加されるのか、という趣旨の質問をいただいた。私(安岡孝一)の知る限り、デジタル庁からも法務省からも、そういう話は出ていない。デジタル庁が考える文字情報基盤の「整備」にも書いたが、もう一度、地方公共団体情報システムデータ要件・連携要件標準仕様書【第1.0版】を見てみよう。
(2) 文字符号化方式
各標準準拠システムの間の連携のための符号化方式については、UTF-8とする。
なお、標準準拠システム内の符号化方式はUTF-8またはUTF-16とする。(3) 外字の取扱い
標準準拠システムを導入する前に地方公共団体がそれぞれ独自に作成した文字、いわゆる「外字」については、戸籍システムにおいて当該「外字」を文字情報基盤として整備された文字と同定した文字を利用することにより、他の標準準拠システムは、当該「外字」を利用しない。仮に、「外字」を文字情報基盤の文字と同定する取組みを行った上でも、なお「外字」を利用せざるを得ない場合においては、戸籍システムにおいて文字情報基盤の文字とは別の文字コード(デジタル庁が指定したものに限る。以下同じ)に対応させたものを利用することにより、他の標準準拠システムは、当該「外字」を利用しない*。
文字情報基盤の文字セット及び文字情報基盤の文字とは別の文字セットを合わせた文字セット(以下「文字情報基盤として整備された文字セット」という。)については、デジタル庁が法務省と協力して整備する。
ここで「文字情報基盤として整備された文字セット」を「デジタル庁が法務省と協力して整備する」と書いていて、しかも当該「文字セット」に対する「文字コード」は「デジタル庁が指定したものに限る」とまで言っているわけである。だったら、戸籍統一文字559970「⿺辶鳥」に対する「文字コード」は、デジタル庁と法務省がUCSに追加提案して、ちゃんと「UTF-8またはUTF-16」で使えるようにするというのが、「文字コード」としてのスジだと思うのだ。でも、私の知る限り、デジタル庁からも法務省からも、そういう話は出ていない。いったい、どうするつもりなんだろ。
戸籍統一文字559970「⿺辶鳥」はExt.I候補のSATM-90367なのでは (スコア:1)
戸籍統一文字559970「⿺辶鳥」はExt.I候補のSATM-90367 [jsecs.org]と同じなので例示にふさわしくない(デジタル庁や法務省が何もしなくてもUnicodeに追加される可能性が高い)ように思われます。
例示する文字としては戸籍統一文字554300「⿱欶女」や戸籍統一文字554630「⿱刃工」の方が適切だと思います。
Re:戸籍統一文字559970「⿺辶鳥」はExt.I候補のSATM-90367なのでは (スコア:2)
はい、実は、そこが味噌なのです。とすると、UCSに追加されるまでの間「デジタル庁が指定したものに限る」はどうすべきで、UCSに追加された後どうすべきか、というのがなかなか楽しいことになるのです。なので、デジタル庁が主導的に追加する(たとえば緊急追加)しか、実はマトモな方策は無いと思うのです。