旧字体を継承することは一度考え直したほうがよい (#3899783) | 全国1896市区町村のデジタル戸籍化が完了

「全国1896市区町村のデジタル戸籍化が完了」記事へのコメント

記事ページを表示すべてのコメント取得

検索115コメント Log In/Create an Account

旧字体を継承することは一度考え直したほうがよい (スコア:0)

by Anonymous Coward on 2020年10月03日 11時23分 (#3899783)

自分の中学校の同期に役場の職員とした奴がいるんだけど、元々変体仮名を大学で扱っていたから嬉嬉として仕事してるって聞いたのだけど、そこまで時間を掛けてやる必要のある仕事かって常々疑問だった。

旧字体そのものがハードルになっているのであれば、現代の文字に整合すべきだと思う。
言葉だって時代ごとにそれぞれの文法があって、その時々で時代にあったものが選ばれている。
まずはUTF-8ベースで話をすべきではないのかな。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  議論のレベルが違う。戸籍簿では旧字体どころか書き誤りなどまたは意図的なものによる異体字まで忠実に記録している。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    当時の役所が事なかれ主義で申請された内容をそのまま受け取ってただけでしょ
    今のキラキラネームも同様の問題になると思うけどね
- Re: (スコア:0)
  
  by Anonymous Coward
  
  一応、文化というものが先にあって、そこに事務処理とか「常用されるアジア文字は8bitも
  あればじゅうぶんである」とか雑極まるUnicodeの都合が後からやってきたわけだからして…
  - Re:旧字体を継承することは一度考え直したほうがよい (スコア:1)
    
    by Anonymous Coward on 2020年10月03日 14時23分 (#3899879)
    
    ＞一応、文化というものが先にあって、そこに事務処理とか「常用されるアジア文字は8bitも
    ＞あればじゅうぶんである」とか雑極まるUnicodeの都合が後からやってきたわけだからして…
    そうでもないですよ？
    名字を名乗るのの明治政府が勝手に決めて「ない奴は今すぐ決めろ」とシステムが先行したものですし。
    
    シェア
    
    親コメント
    - Re:旧字体を継承することは一度考え直したほうがよい (スコア:1)
      
      by Anonymous Coward on 2020年10月03日 21時52分 (#3900097)
      
      トピ主()です
      予想外に反響があって、非常に参考になります。
      
      自分が一番言いたかった点はココで、名字が元々一部の人たちのものであって、社会システム変更のタイミングで新しく追加されたということに着目しています。
      
      社会システムは適宜見直されるべきであると考えます。
      事情をよく知っている人ならば、過去全ての戸籍がテキストデータとして扱われず、明治自体近傍のものなどは役人の誤記があるものが平気で手書きを画像化したデータで残っているのですよ。
      
      個人の権利も重要ですが、使いずらいデータに価値はあるのでしょうかね・・・
      
      シェア
      
      親コメント
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        ×使いずらい
        ○使いづらい
        というのはさておき
        「戸籍システムに使える字は（今と異なる）この文字集団にしましょう」という議論はあっても良いとは思います。
        ただその議論をまとめるのは果てしなく難しく、例えば当用漢字とか常用漢字とか簡体字とかにまつわる話を見ても分かるように必ず「コレジャナイ」論との戦いになっちゃうんですよね。
        例えばUnicodeに揃えたらどう？と言っても、そのUnicodeの現行部分は未来永劫固定と決まってるわけではない（日本国が固定できるものでもなく、また字体などは変更される可能性も結構ある…というか字体そのものはフォント側の問題だけど、そのコードにどの字体が含まれるかの問題）。
        日本国の方も、「これが正字でこれが異体字」という定義が時々変更されている。
        そんななか、「とりあえず0～65535文字目まではコレ固定ね」としようと思ったら「日本の国籍に使える文字セット」として日本主導日本管理で新たに立ち上げることになる。他の文字コード群とは別に。
        なんか本末転倒感まで出てきちゃうんですよねー。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      字（あざな）を廃止したのもシステム（管理）都合ですしねぇ
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    Unicodeは東アジアのマルチリンガル対応ができないけど、
    各国内ですでにコード化された文字は全部区別するようにしていました。
    だから国内システムに関する件をUnicodeのせいにするのはおかしい。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  システムのために国民がいるんじゃなくて、国民のためにシステムがあるんですよ。
  UTF-8やUnicodeの制限で本来の名前を名乗れないなんて悲惨すぎる
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    誤字や勝手に創作された意字を「本来」と呼ぶのに違和感がある、という話でしょ。
    - 誤字だけじゃないんですけど (スコア:3, 参考になる)
      
      by Anonymous Coward on 2020年10月03日 20時12分 (#3900044)
      
      戸籍統一文字は5万6040字（漢字5万5267字のほか変体仮名､平仮名､片仮名､括弧類､ラテン文字､ギリシア文字､キリル文字､アラビア数字など非漢字773字）もあり、Unicodeで表現できない文字も多く含まれています。
      ちなみに、住民基本台帳ネットワーク統一文字は約2万字しかないので、それと比べていかに膨大かが分かるはずです。
      その、戸籍統一文字でも表現できない文字があることで問題になっているのに、Unicodeを持ち出すとかレベルが低すぎます。
      Unicode文字だけでなんとかできるなら誰も苦労しないですよ。
      戸籍統一文字にあるけどUnicodeに無い文字の中に、担当者等の誤字によって生まれたものが多く含まれているのは事実ですけど、正しい漢字も多く含まれているのです。
      むしろ、歴史をさかのぼると、Unicodeに登録されている方が本来の正字ではない「異自体」であることまであるのですが。
      Unicodeが絶対的に正しいと思わない方がいいですよ。
      Unicodeの方が「誤字」で、戸籍統一文字にしかない文字が「正字」であるというケースもあるので。
      もし、貴方の氏名がUnicodeの都合で強制的に変えられたとして、貴方は納得しますか？
      
      シェア
      
      親コメント
      - Re:誤字だけじゃないんですけど (スコア:1)
        
        by Anonymous Coward on 2020年10月04日 16時44分 (#3900400)
        
        戸籍統一文字は漢和字典に載っている(そしてその字典が誤字だと言っていない)文字をとりあえず全部放り込んでいる節があって、実際にその字が戸籍で使われているかどうかは検討していないようなので、戸籍統一文字の字数をもとに何か言ってもあまり意味がないと思う。
        字典に載っている字を放り込んだだけでは役に立たないというのはJIS X 0213の制定過程ですでに明らかになったことで今さらだし。
        # ただし人名とは関係なく、大漢和辞典(の譌字でない字)とUnicodeの対応がわりと明確になったという副作用があって個人的には嬉しい
        
        シェア
        
        親コメント
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        別ACだけど、皆納得してもいいんじゃない？と思う。
        正字だろうが誤字だろうが異字体だろうが旧字体だろうが、元からの「正しい」字だろうが無関係に、とにかくUnicodeで扱う字を正とするって話だよね？
        そうなったとして自分は・・・（想像中）・・・それほど拘らないかなあ。
        自分はあまり多くはない名字で、かつ昔の戸籍は文献や活字に無い書き方の字を使ってた。
        父の代で辞書どおりの字にしたけど、それを聞いた時も単純に文化的な興味・面白さだけだったかな。
        抵抗を感じる人もいるのだろうとは思うが、その拘りに共感はできない。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        名前に行政システムではそのまま表現できない文字を入れるという点から、議論する必要があるのではないですかね?
        
        情報システム化が避けて通れない道というのは既に分かっているはずですが、それならばUnicodeにどうして働きかけをしないのでしょうかね。
        私が甚だ疑問なのは「一部の特殊な文字の方々のために、日本独自の文字コード体系を作る」ことが、どれだけ負担(経済的、技術的)になっているか、きちんと評価しているのかという一点に尽きます。
        
        何でもかんでも現状のデータをそっくりそのまま移行するために、大きなコストを将来的に払い続けるという判断には同意しかねます。
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        Unicodeを日本側が真にコントロールできない以上、「Unicodeで使える文字を正字とする」としたとたんにUnicode側での変更が国のシステム上の変更に直結しちゃうんですよね。
        それだったら外字登録機能つけて個別登録の方がマシじゃね？という計算も成り立たないこともないと思うんだけどな。
        これでの問題はプロトコールとフォーマット、そして「字を増やそうとする勢力」の規制にあるのである。
        あと「グラフィティの登録」としての手書きサインと「デジタル登録」としての入力可能な第二水準までの文字列との並行運用という手もあるかもしれない。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        そのためにISV/IVDによる異体字処理があるのだがな。1万字ぐらいの異体字が定義されていたのではなかったか？
        電子処理する以上は包摂は必須だし、手描きサインの変更まで強制されるわけではない。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      生まれたときからその名前なら、その人にとっては本来だと思うけど。
      誰の視点での感想なのかが謎。
      - Re:旧字体を継承することは一度考え直したほうがよい (スコア:1)
        
        by Anonymous Coward on 2020年10月03日 18時36分 (#3899984)
        
        ＞生まれたときからその名前なら、その人にとっては本来だと思うけど。
        こうやって過ちも正当化されるのかー
        
        シェア
        
        親コメント
        
        Re:旧字体を継承することは一度考え直したほうがよい (スコア:1)
        
        by renja (12958) on 2020年10月04日 10時27分 (#3900257) 日記
        
        全てを過ちというレッテル貼って否定するのも過激すぎ
        
        --
        
        ψアレゲな事を真面目にやることこそアレゲだと思う。
        
        シェア
        
        親コメント
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        親の過ちで生まれた子はどうすればいいんだろう(笑)
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        始めた人は「偉い人と同じ文字は恐れ多いから点一つ減らそう」とか逆に「ウチは唯一無二のこの文字を使おう」とか言って決めたケースもありますから、少なくとも本人にとっては過ちではなかったケースも多々ありますわな
        めっちゃ面倒だけど（社内システム組む時にここの先生は一角少ないのが正しいから対応するようにと言われたった一人のために外字まわり作り込むことになったり）
        真に誤ちだと思うなら自分でかけあって直すことも可能っちゃ可能ですもんね
        親戚づきあいとの兼ね合いがあるからめっちゃ面倒だけど
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        早めに親と縁を切って自立すればいいんじゃないですか？
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        皮肉でもなくてまさにその通りなんじゃないですかね。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      日本語の漢字は滅びた中国の古代王朝のとある本からよく使う字だけ引用してる物だから
      JISに規定されてる文字やその本にある字が全て「正しい漢字」ではない
      種々の法律やUnicode規格で漢字表が作られてるが、「全ての正しい漢字の一覧」は無い
      全て「この場面で使う字はこれを一覧とする」という部分的な表
      特にUnicodeなんか文字コード規格ごとに微妙に処理が違うのを嫌がった欧米人が
      「よく分からん古代文字を除けばアジア人に字が何億種もあるわけがない、これで我慢しろ」
      と言って雑にキリのいい文字数で切って詰め込んだ物だから別に正しくも包括的でも無い
      その結果枠が足りなくなって1文字あたりのバイト数をズルズル伸ばしてるしな
- 判子も旧字体が多い (スコア:0)
  
  by Anonymous Coward
  
  昔にハンコ屋が注文書等の電子化は金がかかりすぎて非現実的で難しいって話してたな
  旧字体の名字が結構あるのと代表的なので吉の士か土か問題とかあるから
  別途対応するシステム組むと洒落にならんわな
- Re: (スコア:0)
  
  by Anonymous Coward
  
  UTF-8はエンコーディングの名前であって、文字集合の名前ではないとクソリプをしておく。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    その「エンコーディングとは何か」がブレているのも事実。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    確かに笑
    UnicodeとUTF-8を混同するな(怒)
- Re: (スコア:0)
  
  by Anonymous Coward
  
  むかしはコンピュータの処理能力不足から、異字体やらを使えなかったが、
  コンピュータの処理能力が、異字体全部登録しても問題ないくらいに上がってるんだから、
  数万文字を正規に追加すればいいのに
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    実際、そういう取り組みは行われてきている。元の元のコメ「まずはUTF-8ベースで話をすべきではないのかな」と言うが、漢字異体字シーケンス (IVS)を使い、デジタル化した戸籍で使われている文字はすべてUTF-8で表現可能なはず。プレス発表　2017年12月22日に発行された国際規格に準拠した「IPAmj明朝フォント」の新バージョンを公開～行政実務で必要とされる漢字約6万文字の全てが利用可能に～ [ipa.go.jp]
    それでもなお、タレコミのyasuoka先生の文章にあるとおり、現時点ではまだ少し足りないという状態ではあるようだが。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      なるほど・・・サイズとしては1漢字がMAX 8バイトということですね
      
      https://mojikiban.ipa.go.jp/1292.html
      
      異字体が表示できない場合であっても、代表的な字体が表示できるようにしている点がとても気に入りました。
      
      # テキストなんて高々しれてるデータ量なので、これくらいケチケチせずに使ってどんどん共通化するのは賛成
- Re: (スコア:0)
  
  by Anonymous Coward
  
  「互換が面倒だからデータなんてバンバン欠落させろ」
  って、WindowsUpdateならそんくらい雑でもいいんだろうけどさぁ
  # Unicodeにすれば文字の問題は何でも大丈夫だと信じてるなら確かに議論のレベルが違う
- Re: (スコア:0)
  
  by Anonymous Coward
  
  先日のNHK日本人のおなまえっ!でやっていたけど、斎藤さんとか、斉藤さんとか、齊藤さんとか、とにかく「さいとうさん」が多すぎ。
  システムを扱ったり、客の名前を手書きすることがある立場だけで言えば、斉藤さんに統一してくれればいいと思う。
  さいとうさん以外もだけど。
  ただ、自分の字体にこだわっている人もいるから、今のままでもよいのかなとも思う。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    殆ど誤字（もしくは勝手文字）だから、そういうのだけでも整理すべきだろうね。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      元が誤字でも、ユニークであることに価値を見出す人もいるので、他と同じになれと言われてはいそうですかと言う人ばかりじゃありません。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

全国1896市区町村のデジタル戸籍化が完了 More ログイン

「全国1896市区町村のデジタル戸籍化が完了」記事へのコメント

旧字体を継承することは一度考え直したほうがよい (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:旧字体を継承することは一度考え直したほうがよい (スコア:1)

Re:旧字体を継承することは一度考え直したほうがよい (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

誤字だけじゃないんですけど (スコア:3, 参考になる)

Re:誤字だけじゃないんですけど (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:旧字体を継承することは一度考え直したほうがよい (スコア:1)

Re:旧字体を継承することは一度考え直したほうがよい (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

判子も旧字体が多い (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

スラド