パスワードを忘れた? アカウント作成
13348487 journal
数学

yasuokaの日記: 電子行政におけるJIS第1・第2・第3・第4水準漢字

日記 by yasuoka

私(安岡孝一)の2014年8月28日の日記の読者から、榎並利博の「数字は語る 縦割り行政の弊害 人名や地名で 増え過ぎた漢字」(週刊ダイヤモンド, 第105巻, 第25号 (2017年7月1日), p.26)を読んでみてほしい、との御連絡をいただいた。読んでみたのだが、「数字は語る」というタイトルなのに、出てくる数字がどうもおかしいものばかりで、かなり閉口した。

アルファベットが26文字なのに対して、日本の漢字はいったい幾つあるのだろうか。その答えは誰にも分からない。

「アルファベットが26文字」ということは、小文字その他を数えなくていいということだから、それなら「日本の漢字」も、常用漢字2136字を基本とすればいいと思う。

それでは漢字を電子的に扱うことができないため、漢字をコード化して整理したのがJIS第一水準と第二水準である。

第3水準漢字や第4水準漢字もあるんだけど、あれは「漢字をコード化して整理した」ものじゃないの?

JISでは全ての漢字を約6000字に絞ったため、似た字形も同じコードが付けられた。例えば、しめすへんは「示」と「ネ」という書き方があるが、それを使った漢字は、同じ漢字とみなされた。

「約6000字に絞った」って何の話? たとえば「神」と「神」には、JIS X 0213では別のコード(1-89-28と1-31-32)が付けられているんだけど?

住民基本台帳ネットワークシステムの構築時、全国の住民基本台帳の漢字が住基統一文字として整理され、その数は1万9563字であった。

『住民基本台帳ネットワーク統一文字とその問題点』にも書いたけど、住基統一文字の漢字数は、運用開始時点では19434字だった。その後、2012年に入管漢字131字が増えて、現在の漢字数は19565字。榎並の言う19563字って何なんだろう?

さらに、戸籍法改正で戸籍がデジタルデータ化され、戸籍で使用される漢字が戸籍統一文字として整理された。その数は5万5269字もある。

2012年4月16日の日記にも書いたが、戸籍統一文字の漢字数は、現在55271字。その前は2010年11月30日に、55267字から55270字へと、3字が同時に追加されている。

つまり漢字を表現するコード体系としてJIS、住基統一文字、戸籍統一文字の3種類が存在し、これは経済産業省、総務省、法務省という省庁縦割りをそのまま反映している。その3種類のコード体系を統合し重複を省いたのが、5万8712字に整理された文字情報基盤である。

だったら、省庁縦割りが解消されたんだから、それでいいと思うんだけど。ただし、文字情報基盤の漢字数は、現在は58861字。

私たちは税金で約6万字の漢字を維持管理していることに関心を払うべきではないだろうか。電子行政における莫大な漢字を、使い慣れたJIS第一水準と第二水準の範囲に法的に制限するように改める時期が来ている。

いや、そんな時期は来てないと思うし、それに、第3水準漢字や第4水準漢字もあるんだけど。私が3年ほど前に書いた『電子行政における第3・第4水準漢字』が、よっぽど気に障ったのかしら?

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

「毎々お世話になっております。仕様書を頂きたく。」「拝承」 -- ある会社の日常

読み込み中...