パスワードを忘れた? アカウント作成
16588955 story
Digital

ベンダー・自治体がばらばらに割り当てた戸籍のための文字コードを標準化する『MJ+』 90

ストーリー by nagazou
四度手間 部門より
河野太郎デジタル担当大臣のサイトによると、官報には「官報文字」というものがあるそう。この中には渡辺さんの「辺」の異体字に対応するため140文字の登録がされているという。しかし、実際の戸籍では、使用して良い文字は5万5270文字もあることから、政府は全ての国民の氏名をコンピュータで扱えるようになることを目指し、これらを網羅した「文字情報基盤」(MJ)を2011年に策定、それにあわせたフォントを作成して無償で提供しているそうだ(河野太郎公式サイト地方公共団体情報システムにおける文字要件の運用に関する検討会(第2回))。

ところがMJを全庁的に採用している自治体は、川口市などごく一部だけだという。多くの自治体は、システムにない漢字を「外字」として作成し使っている。このため自治体ごとに同じ文字に違うコードが割り振られる問題が多発している。現在デジタル庁主導で、自治体ごとのシステムからMJに移行しようと自治体がベンダーに依頼して作成した外字163万字を法務省で精査、その結果、MJ上の文字とは違うものが15万字ほど発見されたという。

この中から重複分を取り除いた結果、9198字が実際に戸籍で使われていることが判明した。これまでのMJに9198字を加えたMJ+を用意することで、ベンダーを気にせずに、戸籍上の自分の名前を戸籍システムで正確に表記できるようになるとしている。
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by mars12 (28939) on 2023年05月15日 18時19分 (#4460389) 日記

    どっちかといえばJISなんとか水準までで表せる字しか使っちゃダメ、とかにしてもらったほうがいいんじゃないか。
    と思ってたらフォント作ってたんですね。知らなかった。

    • by Anonymous Coward on 2023年05月15日 22時25分 (#4460541)

      判断できる情報が無くて必要性はよく分からないけど、日本企業がシステム開発で失敗するパターンによく似てるね。
      細かい例外まで全部追加実装させて開発コストが膨れ上がり、しかもユーザ側の業務も全く整理されないままになるやつ。

      親コメント
    • Re: (スコア:0, すばらしい洞察)

      by Anonymous Coward

      こういう目の前の小さな利益だけしか見えない人々が漢字廃止論とか言い出したんだよね。
      そしてこの手の人々に共通するのが、歴史を知らず当然歴史に学ばないこと。

      • Re: (スコア:0, 荒らし)

        by Anonymous Coward
        役場の係官の筆が滑っただけの誤字に歴史も何もねぇよwww
        • by Anonymous Coward

          失敬な、墨が垂れただけだ。

      • by Anonymous Coward

        そういうときは「僕たちだけが関係する歴史のことだけど知ってくださいよ〜」って言ったほうがいいですよ。
        かかるコストと効果のバランス。

  • by Anonymous Coward on 2023年05月15日 18時24分 (#4460394)

    そういう色んな文字コードや外字をまとめて規格化するのってJISが昔からやってることだと思ったが、規格化前の調査は各省庁や学者がやったりするか。
    この色んな文字を調査して統合させるみたいな作業は黎明期のJIS漢字コード感があって面白い。
    JIS基本漢字とか少々の作業ミスのせいで幽霊文字とか生じてるけど、基本問題なくみんな今まで受け継がれてるのは大したもんだ。
    当時犯した今に響く重大なミスってのは特に思い浮かばない。

    ところでこの機会にJIS X 0208のWikipedia記事を覗いたらスラドの日記でよくぶらぶらしてる安岡氏の名前がちらほら文中に載ってる。

    • by Anonymous Coward

      良くも悪くもあの人の日記にこのストーリーをはるかに超える密度と情報量の情報が載るのだろうという気はする。

  • by Anonymous Coward on 2023年05月15日 19時17分 (#4460435)

    相続で法定相続情報証明制度を利用したのですが、申請に必要な法定相続情報一覧図を作成して法務局に提出したとき、戸籍上の名前に異体字が使われていたために、わざわざ法務局でゼロから作り直していました。高いお金をもらっているだろう人がなんともつまらない仕事に時間をかけているのだなと思ってしまいました。

    異体字は既に入っている字体だけにしましょうよ...

  • by jizou (5538) on 2023年05月15日 21時32分 (#4460517) 日記

    官報は「国が出す広報資料」のはずで、
    「異字体を正確に表示すること」が求められているわけではないと思う。

    専用フォントをインストールしないと読めないような異字体で
    広報資料を作成する必要性がどれくらいあるんだろう。

    まずは、新しい官報を一般的なフォントで作成するように切り替えて、
    どうしても古い文字が必要なものだけ、備考欄に画像ファイルを張り付ける
    程度にすれば、古臭いシステムを維持する必要はなくなると思う。

    異字体って、昔のキラキラネームみたいなもので、
    文字の一部を変えて目立つようにしたもの... と考えると、
    官報のために、無駄な費用をかけて日本全国でサポートする意味は無いと思う。

    文字を作った人からすれば、「俺が作った」は大事なんだろうけど。

    • by Anonymous Coward

      「どうしても古い文字が必要なものだけ、備考欄に画像ファイルを張り付ける」なんてそんな面倒なことをしなくていいようにするために、文字として、Unicode(IVS含)の枠内で扱えるようにしようという取り組みではないでしょうか。

      あと、どうせ今の官報の電子版はPDFなので、読者は特別なフォントのインストール不要です。PDFで公開することの良しあしは別として。

    • by Anonymous Coward

      官報には人名が載るんだから必要なんだが。
      少しは考えてみなよ。
      しかも異体字がキラキラネームって知らないなら黙ってろって感じ。

      • by Anonymous Coward

        そうだね仲の悪い親戚があいつと同じ字は嫌だとか言って変えたりもしてるからDQNネームのほうが近いね。

  • by Anonymous Coward on 2023年05月15日 18時23分 (#4460392)

    MJ/MJ+ に関しては unicode に登録申請するのは当然として、とっと JIS 規格化すべきだと思う。
    必要な資料が入手しやすくならなないと。

    • by Anonymous Coward on 2023年05月15日 18時47分 (#4460407)

      MJは異体字セレクタで登録済み。MJ+は当然まだで、UnicodeのPUP(私用面)を使う案が出てたけど当然のようにベンダーから強く反対された模様

      親コメント
      • by Anonymous Coward

        PUAとか正気じゃないなと思ってたけど、ベンダーが正気で安心した。

    • by Anonymous Coward on 2023年05月15日 21時17分 (#4460511)

      MJでは、JIS規格化はしていないものの、ウェブでデータを見れる( https://moji.or.jp/mojikibansearch/detail [moji.or.jp] ) ようにしたり、フォント(IPAmj明朝)を作ったり、データの公開にも気を使われていたという印象。MJ+でも同程度のことは期待できると思う。

      親コメント
    • by Anonymous Coward on 2023年05月15日 18時42分 (#4460402)

      こういうのって、Unicodeに適合するのかな?
      異字体の集合だから、文字コード割り当てるものでもないし、異字体セレクタの領域だよね。
      でも異字体セレクタも勝手に追加して良いものではなさげだし、Unicodeコンソーシアムって動き鈍い印象がある(絵文字以外)ので、はたして登録されるんだろか…

      「スマホなど、MJ+を使えないシステムに向けては、MJ+をJIS第四水準のどの文字に代替するかを定めた代替マップも提供します」
      とのことなので、異字体セレクタ的な取り組みはできそうではあるんだけどね。

      親コメント
      • by Anonymous Coward

        こういうのって、Unicodeに適合するのかな?
        異字体の集合だから、文字コード割り当てるものでもないし、異字体セレクタの領域だよね。

        アルファベット圏のリガチャ(合字)扱いにしても旧字体フュージョンは厳しそう

      • by Anonymous Coward

        でもまあ日本政府ならなんとかできるのでは。
        問題になるのは結局みんな大好きいつものCJK系か。

    • by darat (42782) on 2023年05月15日 19時46分 (#4460448)
      Moji_Johoコレクションの異体字の収録グリフを拡張する。
      フォントが対応する異体字のコレクションをAdobe-Japan1だけではなくMoji_Johoにも対応してもらう。
      異体字セレクタを扱えないシステムは官公庁では発注しない。
      現行の異体字セレクタの機能に収まるよう工夫して欲しいな。
      親コメント
    • by Anonymous Coward

      必要な資料が入手しやすくならなないと。

      外字でのベンダーロックインができなくなったわけで
      ベンダーが上納金がケチった結果でしょうから
      今からでも出せば形骸化させちゃうんじゃないですかね

      # 正しさとは力関係のことである

  • by Anonymous Coward on 2023年05月15日 18時44分 (#4460405)

    これ、入力とか検索とかどうするんですかね?

    保険証とマイナンバーの紐づけすらまともに行えないのに、こんな異体字データ正しく扱えるとはとても思えない。
    本人に確認させたら、この異体字じゃないって言われるケースめっちゃ多そう。

    • by Anonymous Coward

      外字が作られる理由の一つに検索できない(作ったほうが早い)というのがあるのよね。ちゃんと検索システム整備しないと使われない文字が増えるだけ

      • by Anonymous Coward

        まー今ならコンピューターリソースが充実して画像検索もできるので、
        カナ漢変換して普通のフォントにした後に、
        見た目が似たような字(あいまい)も候補に出すとか。

        あーでも形は似てるけど、字源が違うから置き換えできない字はあるのだろう。

    • by Anonymous Coward

      フリガナでもふりがなでもFURIGANAでもhuriganaでもなんでもあるだろう。
      もしかして渡邉?などもあるとなおよい。

    • by Anonymous Coward

      そういうのは各地方自治体が戸籍デジタル化した時にもう乗り越えた問題だろ
      今回はそれを国レベルで統一するって話で、重複文字の洗い出しまで済んでるのに、今更入力だ検索だなんかが問題になるもんかね

      • by Anonymous Coward

        ホントに乗り越えてんの? ホントに?
        引っ越ししたらだめですで乗り越えてるって言えんの? 言ってるんだろうなぁ (´・ω・`)
         
        そういうのを切り捨てて標準システムにあわせてこそのDXなんじゃ...
        だいたい本人でも140種類のどれかってわからんとおもうし、面倒すぎて確認したくもないだろ。
        サイゼリアじゃないんだから。

  • by Anonymous Coward on 2023年05月15日 19時47分 (#4460449)

    全然そんなことはなく、国の出すシステム標準に対して地方自治体でそれぞれシステム作らなきゃ行けない(地方自治のため)
    だから、行政別に様々なことやってただけなので行政側がどうするのか考えず
    手書きのままでコンピュータシステム化しただけの話なので
    ベンダーが悪いっていうのはやめましょう

    • by Anonymous Coward

      いわゆる現場の運用にシステムを合わせるの典型例かと。
      DXを本気でやるなら、多少乱暴でも渡辺さんはJISにあわせてもらうしかない。
      それができなきゃDXなぞうそっぱち。
       
      引っ越ししたらダメとか結局のところ意味ないよ。
      先祖の書き間違いとかでしょ。異体字って。140種類はねーよ。

  • by Anonymous Coward on 2023年05月15日 19時59分 (#4460459)

    つまりデジタル省がデジタル音楽に特化した「無線と実験+」を発刊するということだな

  • by Anonymous Coward on 2023年05月15日 20時10分 (#4460465)

    必ず読み仮名併記して御勘弁

    • by Anonymous Coward

      角に頭をぶつけて出直せと?

    • by Anonymous Coward

      MJ++の後にMJ++++…とならずに、MJ#になるから待ってて
      え?トーフマークって#じゃない?

  • ローカル漢字は手書き年賀状とお墓の文化だけで十分だろう
    異体字はすべて行政からは廃止して統一してくれよ

    • by Anonymous Coward

      ローカル漢字は手書き年賀状とお墓の文化だけで十分だろう

      では墓石に✟二つ名✟を刻みましょう(ヤメタゲテー

  • by Anonymous Coward on 2023年05月15日 20時21分 (#4460470)

    もう名前表記なんかやめて、マイナンバーで一元管理したらいいと思う。

    本人確認はカードのICチップで行えるし、名前表記は署名という位置付けにして、顔画像と一緒に画像でマイナンバーに紐づければフォントなんて要らない。

    • by Anonymous Coward

      もう名前表記なんかやめて、マイナンバーで一元管理したらいいと思う。

      ACはの名前表記です勝手に使わないでください

      こうですね

    • by Anonymous Coward

      ICチップを体に埋め込めば無くさない!

      # 満員電車で勝手に読み取らないでください。

typodupeerror

ナニゲにアレゲなのは、ナニゲなアレゲ -- アレゲ研究家

読み込み中...