ベンダー・自治体がばらばらに割り当てた戸籍のための文字コードを標準化する『MJ+』 90
ストーリー by nagazou
四度手間 部門より
四度手間 部門より
河野太郎デジタル担当大臣のサイトによると、官報には「官報文字」というものがあるそう。この中には渡辺さんの「辺」の異体字に対応するため140文字の登録がされているという。しかし、実際の戸籍では、使用して良い文字は5万5270文字もあることから、政府は全ての国民の氏名をコンピュータで扱えるようになることを目指し、これらを網羅した「文字情報基盤」(MJ)を2011年に策定、それにあわせたフォントを作成して無償で提供しているそうだ(河野太郎公式サイト、地方公共団体情報システムにおける文字要件の運用に関する検討会(第2回))。
ところがMJを全庁的に採用している自治体は、川口市などごく一部だけだという。多くの自治体は、システムにない漢字を「外字」として作成し使っている。このため自治体ごとに同じ文字に違うコードが割り振られる問題が多発している。現在デジタル庁主導で、自治体ごとのシステムからMJに移行しようと自治体がベンダーに依頼して作成した外字163万字を法務省で精査、その結果、MJ上の文字とは違うものが15万字ほど発見されたという。
この中から重複分を取り除いた結果、9198字が実際に戸籍で使われていることが判明した。これまでのMJに9198字を加えたMJ+を用意することで、ベンダーを気にせずに、戸籍上の自分の名前を戸籍システムで正確に表記できるようになるとしている。
ところがMJを全庁的に採用している自治体は、川口市などごく一部だけだという。多くの自治体は、システムにない漢字を「外字」として作成し使っている。このため自治体ごとに同じ文字に違うコードが割り振られる問題が多発している。現在デジタル庁主導で、自治体ごとのシステムからMJに移行しようと自治体がベンダーに依頼して作成した外字163万字を法務省で精査、その結果、MJ上の文字とは違うものが15万字ほど発見されたという。
この中から重複分を取り除いた結果、9198字が実際に戸籍で使われていることが判明した。これまでのMJに9198字を加えたMJ+を用意することで、ベンダーを気にせずに、戸籍上の自分の名前を戸籍システムで正確に表記できるようになるとしている。
へぇ (スコア:2)
どっちかといえばJISなんとか水準までで表せる字しか使っちゃダメ、とかにしてもらったほうがいいんじゃないか。
と思ってたらフォント作ってたんですね。知らなかった。
Re:へぇ (スコア:1)
判断できる情報が無くて必要性はよく分からないけど、日本企業がシステム開発で失敗するパターンによく似てるね。
細かい例外まで全部追加実装させて開発コストが膨れ上がり、しかもユーザ側の業務も全く整理されないままになるやつ。
Re: (スコア:0, すばらしい洞察)
こういう目の前の小さな利益だけしか見えない人々が漢字廃止論とか言い出したんだよね。
そしてこの手の人々に共通するのが、歴史を知らず当然歴史に学ばないこと。
Re: (スコア:0, 荒らし)
Re: (スコア:0)
失敬な、墨が垂れただけだ。
Re: (スコア:0)
自分の母の名前が役所の誤字で異体字になっているそうです。
捏造ではなく少なくとも1件はありますよ。
Re: (スコア:0)
誤字は文化。
スラドのタレコミを見ているだけでわかる。
Re: (スコア:0)
そもそも、異体字って誰かが書き間違えて発生しちゃった文字がいっぱいあるって話じゃなかったっけ。
Re:へぇ (スコア:1)
不思議な漢字と日本語──異体字の謎 [tenki.jp]
実は、意味も発音も同じなのに異なった字形の漢字は、紀元前約1600年前に中国で誕生した、漢字の原型である「甲骨文字」からあります。
このことはなにを示しているかというと、異体字は主に手書きの文字だからこそ生まれるということです。手書きであれば、点画が短いとか長いとか、おさえるとか払うとか表現が人によって変わってしまうことは当然ですね。それまで使われていた文字があるときにちょっと異なったふうに書かれて、それが誤字となって消えてしまうのではなく、多くの人がそう書くようになってある程度定着してしまう…しかも前の書き方も生きている…。これが異体字の源泉です。楷書、行書などの漢字のスタイルである「書体」も関係しています。
異体字は人名や地名に多いですね。
地名については、言ってみれば「なまり」のようなものだといってもいいかもしれません。人名であれば、漢字の字形の差が自分の個性のようなものと感じられて「渡邊」と書かれないと、自分ではないような気がする、といったことも起こってきます。
文字は社会のなかで共有されているものですから、自分勝手に書いていいというものではありません。ただ異体字だからといって、「間違っている文字」というわけでもないのです。正字・旧字・本字・俗字…といった区別は、漢字の使われ方を標準化するためにある社会・時代で便宜的に決められた「正しさ」の基準ですから、時代によって変わることもあります。日本でも当用漢字、常用漢字、人名漢字などとしょっちゅう漢字の枠組みが変化していることはご存知でしょう。
現在ではコンピューターや携帯電話などで表示できる漢字の数が飛躍的に増えたことで、この枠組がまた変化しています。時代の変化とともに、そして技術との関係で漢字はどんどん変化するものなのです。
Re: (スコア:0)
そういうときは「僕たちだけが関係する歴史のことだけど知ってくださいよ〜」って言ったほうがいいですよ。
かかるコストと効果のバランス。
JISの仕事 (スコア:1)
そういう色んな文字コードや外字をまとめて規格化するのってJISが昔からやってることだと思ったが、規格化前の調査は各省庁や学者がやったりするか。
この色んな文字を調査して統合させるみたいな作業は黎明期のJIS漢字コード感があって面白い。
JIS基本漢字とか少々の作業ミスのせいで幽霊文字とか生じてるけど、基本問題なくみんな今まで受け継がれてるのは大したもんだ。
当時犯した今に響く重大なミスってのは特に思い浮かばない。
ところでこの機会にJIS X 0208のWikipedia記事を覗いたらスラドの日記でよくぶらぶらしてる安岡氏の名前がちらほら文中に載ってる。
Re: (スコア:0)
良くも悪くもあの人の日記にこのストーリーをはるかに超える密度と情報量の情報が載るのだろうという気はする。
Re:JISの仕事 (スコア:2)
そんな人はもう直してんじゃ…
それも簡単ではないのかな
知らない人とかもいそうだし一度確認するのはええかも
無駄無駄無駄 (スコア:1)
相続で法定相続情報証明制度を利用したのですが、申請に必要な法定相続情報一覧図を作成して法務局に提出したとき、戸籍上の名前に異体字が使われていたために、わざわざ法務局でゼロから作り直していました。高いお金をもらっているだろう人がなんともつまらない仕事に時間をかけているのだなと思ってしまいました。
異体字は既に入っている字体だけにしましょうよ...
官報の目的 (スコア:1)
官報は「国が出す広報資料」のはずで、
「異字体を正確に表示すること」が求められているわけではないと思う。
専用フォントをインストールしないと読めないような異字体で
広報資料を作成する必要性がどれくらいあるんだろう。
まずは、新しい官報を一般的なフォントで作成するように切り替えて、
どうしても古い文字が必要なものだけ、備考欄に画像ファイルを張り付ける
程度にすれば、古臭いシステムを維持する必要はなくなると思う。
異字体って、昔のキラキラネームみたいなもので、
文字の一部を変えて目立つようにしたもの... と考えると、
官報のために、無駄な費用をかけて日本全国でサポートする意味は無いと思う。
文字を作った人からすれば、「俺が作った」は大事なんだろうけど。
Re: (スコア:0)
「どうしても古い文字が必要なものだけ、備考欄に画像ファイルを張り付ける」なんてそんな面倒なことをしなくていいようにするために、文字として、Unicode(IVS含)の枠内で扱えるようにしようという取り組みではないでしょうか。
あと、どうせ今の官報の電子版はPDFなので、読者は特別なフォントのインストール不要です。PDFで公開することの良しあしは別として。
Re: (スコア:0)
官報には人名が載るんだから必要なんだが。
少しは考えてみなよ。
しかも異体字がキラキラネームって知らないなら黙ってろって感じ。
Re: (スコア:0)
そうだね仲の悪い親戚があいつと同じ字は嫌だとか言って変えたりもしてるからDQNネームのほうが近いね。
工業規格化して (スコア:0)
MJ/MJ+ に関しては unicode に登録申請するのは当然として、とっと JIS 規格化すべきだと思う。
必要な資料が入手しやすくならなないと。
Re:工業規格化して (スコア:4, 興味深い)
MJは異体字セレクタで登録済み。MJ+は当然まだで、UnicodeのPUP(私用面)を使う案が出てたけど当然のようにベンダーから強く反対された模様
Re: (スコア:0)
PUAとか正気じゃないなと思ってたけど、ベンダーが正気で安心した。
Re:工業規格化して (スコア:2, 興味深い)
MJでは、JIS規格化はしていないものの、ウェブでデータを見れる( https://moji.or.jp/mojikibansearch/detail [moji.or.jp] ) ようにしたり、フォント(IPAmj明朝)を作ったり、データの公開にも気を使われていたという印象。MJ+でも同程度のことは期待できると思う。
Re:工業規格化して (スコア:1)
こういうのって、Unicodeに適合するのかな?
異字体の集合だから、文字コード割り当てるものでもないし、異字体セレクタの領域だよね。
でも異字体セレクタも勝手に追加して良いものではなさげだし、Unicodeコンソーシアムって動き鈍い印象がある(絵文字以外)ので、はたして登録されるんだろか…
「スマホなど、MJ+を使えないシステムに向けては、MJ+をJIS第四水準のどの文字に代替するかを定めた代替マップも提供します」
とのことなので、異字体セレクタ的な取り組みはできそうではあるんだけどね。
Re: (スコア:0)
こういうのって、Unicodeに適合するのかな?
異字体の集合だから、文字コード割り当てるものでもないし、異字体セレクタの領域だよね。
アルファベット圏のリガチャ(合字)扱いにしても旧字体フュージョンは厳しそう
Re: (スコア:0)
でもまあ日本政府ならなんとかできるのでは。
問題になるのは結局みんな大好きいつものCJK系か。
Re:工業規格化して (スコア:1)
フォントが対応する異体字のコレクションをAdobe-Japan1だけではなくMoji_Johoにも対応してもらう。
異体字セレクタを扱えないシステムは官公庁では発注しない。
現行の異体字セレクタの機能に収まるよう工夫して欲しいな。
Re: (スコア:0)
必要な資料が入手しやすくならなないと。
外字でのベンダーロックインができなくなったわけで
ベンダーが上納金がケチった結果でしょうから
今からでも出せば形骸化させちゃうんじゃないですかね
# 正しさとは力関係のことである
「辺」の異体字に対応するため140文字の登録 (スコア:0)
これ、入力とか検索とかどうするんですかね?
保険証とマイナンバーの紐づけすらまともに行えないのに、こんな異体字データ正しく扱えるとはとても思えない。
本人に確認させたら、この異体字じゃないって言われるケースめっちゃ多そう。
Re: (スコア:0)
外字が作られる理由の一つに検索できない(作ったほうが早い)というのがあるのよね。ちゃんと検索システム整備しないと使われない文字が増えるだけ
Re: (スコア:0)
まー今ならコンピューターリソースが充実して画像検索もできるので、
カナ漢変換して普通のフォントにした後に、
見た目が似たような字(あいまい)も候補に出すとか。
あーでも形は似てるけど、字源が違うから置き換えできない字はあるのだろう。
Re: (スコア:0)
フリガナでもふりがなでもFURIGANAでもhuriganaでもなんでもあるだろう。
もしかして渡邉?などもあるとなおよい。
Re: (スコア:0)
そういうのは各地方自治体が戸籍デジタル化した時にもう乗り越えた問題だろ
今回はそれを国レベルで統一するって話で、重複文字の洗い出しまで済んでるのに、今更入力だ検索だなんかが問題になるもんかね
Re: (スコア:0)
ホントに乗り越えてんの? ホントに?
引っ越ししたらだめですで乗り越えてるって言えんの? 言ってるんだろうなぁ (´・ω・`)
そういうのを切り捨てて標準システムにあわせてこそのDXなんじゃ...
だいたい本人でも140種類のどれかってわからんとおもうし、面倒すぎて確認したくもないだろ。
サイゼリアじゃないんだから。
なんかベンダーが悪いみたいに読み取れそうだけど (スコア:0)
全然そんなことはなく、国の出すシステム標準に対して地方自治体でそれぞれシステム作らなきゃ行けない(地方自治のため)
だから、行政別に様々なことやってただけなので行政側がどうするのか考えず
手書きのままでコンピュータシステム化しただけの話なので
ベンダーが悪いっていうのはやめましょう
Re: (スコア:0)
いわゆる現場の運用にシステムを合わせるの典型例かと。
DXを本気でやるなら、多少乱暴でも渡辺さんはJISにあわせてもらうしかない。
それができなきゃDXなぞうそっぱち。
引っ越ししたらダメとか結局のところ意味ないよ。
先祖の書き間違いとかでしょ。異体字って。140種類はねーよ。
オーディオヲタ (スコア:0)
つまりデジタル省がデジタル音楽に特化した「無線と実験+」を発刊するということだな
MJと聞いて「無線と実験」 (スコア:2)
MJと聞いて「無線と実験」「マイケルジャクソン」「みかんジュース」「マイケルジョーダン」
のどれを選ぶか、であなたの買うべきWi-Fiルータが決まるそうです。(ホンマかいな)
Re:MJと聞いて「無線と実験」 (スコア:1)
MJといえばスパイダーマンの正ヒロイン。
Re: (スコア:0)
MJD?
Re: (スコア:0)
日経MJもあるんです
読んでみたら意外と面白かったですね
日経は本紙はいまいちなとこはあるけど専門誌は面白いのが多い
Re:MJと聞いて「無線と実験」 (スコア:1)
日経BPの専門誌は、普通の本屋に売ってないやつがおすすめ。
日経 Automotive とか 日経コンストラクションとか。
きりがないからトーフマークで (スコア:0)
必ず読み仮名併記して御勘弁
Re: (スコア:0)
角に頭をぶつけて出直せと?
Re: (スコア:0)
MJ++の後にMJ++++…とならずに、MJ#になるから待ってて
え?トーフマークって#じゃない?
名前には厳しいのに名字にはフリーダムなのはなぜか (スコア:0)
ローカル漢字は手書き年賀状とお墓の文化だけで十分だろう
異体字はすべて行政からは廃止して統一してくれよ
Re: (スコア:0)
ローカル漢字は手書き年賀状とお墓の文化だけで十分だろう
では墓石に✟二つ名✟を刻みましょう(ヤメタゲテー
マイナンバーで一元管理したらいいのでは? (スコア:0)
もう名前表記なんかやめて、マイナンバーで一元管理したらいいと思う。
本人確認はカードのICチップで行えるし、名前表記は署名という位置付けにして、顔画像と一緒に画像でマイナンバーに紐づければフォントなんて要らない。
Re: (スコア:0)
もう名前表記なんかやめて、マイナンバーで一元管理したらいいと思う。
ACはの名前表記です勝手に使わないでください
こうですね
Re: (スコア:0)
ICチップを体に埋め込めば無くさない!
# 満員電車で勝手に読み取らないでください。
Re:標準化が正義って思いがちだけど (スコア:1)
そんなもん日本人(法人自然人問わず)が負担するにきまってるだろう。
インボイス制やマイナンバーや住基ネット対応の費用をだれが負担したと思ってるんだ。