アカウント名:
パスワード:
議論のレベルが違う。戸籍簿では旧字体どころか書き誤りなどまたは意図的なものによる異体字まで忠実に記録している。
当時の役所が事なかれ主義で申請された内容をそのまま受け取ってただけでしょ今のキラキラネームも同様の問題になると思うけどね
一応、文化というものが先にあって、そこに事務処理とか「常用されるアジア文字は8bitもあればじゅうぶんである」とか雑極まるUnicodeの都合が後からやってきたわけだからして…
>一応、文化というものが先にあって、そこに事務処理とか「常用されるアジア文字は8bitも>あればじゅうぶんである」とか雑極まるUnicodeの都合が後からやってきたわけだからして…
そうでもないですよ?名字を名乗るのの明治政府が勝手に決めて「ない奴は今すぐ決めろ」とシステムが先行したものですし。
×使いずらい○使いづらい
というのはさておき
「戸籍システムに使える字は(今と異なる)この文字集団にしましょう」という議論はあっても良いとは思います。ただその議論をまとめるのは果てしなく難しく、例えば当用漢字とか常用漢字とか簡体字とかにまつわる話を見ても分かるように必ず「コレジャナイ」論との戦いになっちゃうんですよね。例えばUnicodeに揃えたらどう?と言っても、そのUnicodeの現行部分は未来永劫固定と決まってるわけではない(日本国が固定できるものでもなく、また字体などは変更される可能性も結構ある…というか字体そのものはフォント側の問題だけど、そのコードにどの字体が含まれるかの問題)。日本国の方も、「これが正字でこれが異体字」という定義が時々変更されている。そんななか、「とりあえず0~65535文字目まではコレ固定ね」としようと思ったら「日本の国籍に使える文字セット」として日本主導日本管理で新たに立ち上げることになる。他の文字コード群とは別に。なんか本末転倒感まで出てきちゃうんですよねー。
字(あざな)を廃止したのもシステム(管理)都合ですしねぇ
Unicodeは東アジアのマルチリンガル対応ができないけど、各国内ですでにコード化された文字は全部区別するようにしていました。だから国内システムに関する件をUnicodeのせいにするのはおかしい。
システムのために国民がいるんじゃなくて、国民のためにシステムがあるんですよ。
UTF-8やUnicodeの制限で本来の名前を名乗れないなんて悲惨すぎる
誤字や勝手に創作された意字を「本来」と呼ぶのに違和感がある、という話でしょ。
戸籍統一文字は5万6040字(漢字5万5267字のほか変体仮名、平仮名、片仮名、括弧類、ラテン文字、ギリシア文字、キリル文字、アラビア数字など非漢字773字)もあり、Unicodeで表現できない文字も多く含まれています。ちなみに、住民基本台帳ネットワーク統一文字は約2万字しかないので、それと比べていかに膨大かが分かるはずです。
その、戸籍統一文字でも表現できない文字があることで問題になっているのに、Unicodeを持ち出すとかレベルが低すぎます。Unicode文字だけでなんとかできるなら誰も苦労しないですよ。
戸籍統一文字にあるけどUnicodeに無い文字の中に、担当者等の誤字によって生まれたものが多く含まれているのは事実ですけど、正しい漢字も多く含まれているのです。むしろ、歴史をさかのぼると、Unicodeに登録されている方が本来の正字ではない「異自体」であることまであるのですが。
Unicodeが絶対的に正しいと思わない方がいいですよ。Unicodeの方が「誤字」で、戸籍統一文字にしかない文字が「正字」であるというケースもあるので。
もし、貴方の氏名がUnicodeの都合で強制的に変えられたとして、貴方は納得しますか?
戸籍統一文字は漢和字典に載っている(そしてその字典が誤字だと言っていない)文字をとりあえず全部放り込んでいる節があって、実際にその字が戸籍で使われているかどうかは検討していないようなので、戸籍統一文字の字数をもとに何か言ってもあまり意味がないと思う。
字典に載っている字を放り込んだだけでは役に立たないというのはJIS X 0213の制定過程ですでに明らかになったことで今さらだし。
# ただし人名とは関係なく、大漢和辞典(の譌字でない字)とUnicodeの対応がわりと明確になったという副作用があって個人的には嬉しい
別ACだけど、皆納得してもいいんじゃない?と思う。正字だろうが誤字だろうが異字体だろうが旧字体だろうが、元からの「正しい」字だろうが無関係に、とにかくUnicodeで扱う字を正とするって話だよね?
そうなったとして自分は・・・(想像中)・・・それほど拘らないかなあ。自分はあまり多くはない名字で、かつ昔の戸籍は文献や活字に無い書き方の字を使ってた。父の代で辞書どおりの字にしたけど、それを聞いた時も単純に文化的な興味・面白さだけだったかな。抵抗を感じる人もいるのだろうとは思うが、その拘りに共感はできない。
Unicodeを日本側が真にコントロールできない以上、「Unicodeで使える文字を正字とする」としたとたんにUnicode側での変更が国のシステム上の変更に直結しちゃうんですよね。それだったら外字登録機能つけて個別登録の方がマシじゃね?という計算も成り立たないこともないと思うんだけどな。これでの問題はプロトコールとフォーマット、そして「字を増やそうとする勢力」の規制にあるのである。
あと「グラフィティの登録」としての手書きサインと「デジタル登録」としての入力可能な第二水準までの文字列との並行運用という手もあるかもしれない。
そのためにISV/IVDによる異体字処理があるのだがな。1万字ぐらいの異体字が定義されていたのではなかったか?電子処理する以上は包摂は必須だし、手描きサインの変更まで強制されるわけではない。
生まれたときからその名前なら、その人にとっては本来だと思うけど。誰の視点での感想なのかが謎。
>生まれたときからその名前なら、その人にとっては本来だと思うけど。
こうやって過ちも正当化されるのかー
全てを過ちというレッテル貼って否定するのも過激すぎ
親の過ちで生まれた子はどうすればいいんだろう(笑)
始めた人は「偉い人と同じ文字は恐れ多いから点一つ減らそう」とか逆に「ウチは唯一無二のこの文字を使おう」とか言って決めたケースもありますから、少なくとも本人にとっては過ちではなかったケースも多々ありますわなめっちゃ面倒だけど(社内システム組む時にここの先生は一角少ないのが正しいから対応するようにと言われたった一人のために外字まわり作り込むことになったり)真に誤ちだと思うなら自分でかけあって直すことも可能っちゃ可能ですもんね親戚づきあいとの兼ね合いがあるからめっちゃ面倒だけど
早めに親と縁を切って自立すればいいんじゃないですか?
皮肉でもなくてまさにその通りなんじゃないですかね。
日本語の漢字は滅びた中国の古代王朝のとある本からよく使う字だけ引用してる物だからJISに規定されてる文字やその本にある字が全て「正しい漢字」ではない種々の法律やUnicode規格で漢字表が作られてるが、「全ての正しい漢字の一覧」は無い全て「この場面で使う字はこれを一覧とする」という部分的な表
特にUnicodeなんか文字コード規格ごとに微妙に処理が違うのを嫌がった欧米人が「よく分からん古代文字を除けばアジア人に字が何億種もあるわけがない、これで我慢しろ」と言って雑にキリのいい文字数で切って詰め込んだ物だから別に正しくも包括的でも無い
その結果枠が足りなくなって1文字あたりのバイト数をズルズル伸ばしてるしな
昔にハンコ屋が注文書等の電子化は金がかかりすぎて非現実的で難しいって話してたな旧字体の名字が結構あるのと代表的なので吉の士か土か問題とかあるから別途対応するシステム組むと洒落にならんわな
UTF-8はエンコーディングの名前であって、文字集合の名前ではないとクソリプをしておく。
その「エンコーディングとは何か」がブレているのも事実。
むかしはコンピュータの処理能力不足から、異字体やらを使えなかったが、コンピュータの処理能力が、異字体全部登録しても問題ないくらいに上がってるんだから、数万文字を正規に追加すればいいのに
実際、そういう取り組みは行われてきている。元の元のコメ「まずはUTF-8ベースで話をすべきではないのかな」と言うが、漢字異体字シーケンス (IVS)を使い、デジタル化した戸籍で使われている文字はすべてUTF-8で表現可能なはず。プレス発表 2017年12月22日に発行された国際規格に準拠した「IPAmj明朝フォント」の新バージョンを公開 ~行政実務で必要とされる漢字約6万文字の全てが利用可能に~ [ipa.go.jp]
それでもなお、タレコミのyasuoka先生の文章にあるとおり、現時点ではまだ少し足りないという状態ではあるようだが。
「互換が面倒だからデータなんてバンバン欠落させろ」って、WindowsUpdateならそんくらい雑でもいいんだろうけどさぁ
# Unicodeにすれば文字の問題は何でも大丈夫だと信じてるなら確かに議論のレベルが違う
先日のNHK日本人のおなまえっ!でやっていたけど、斎藤さんとか、斉藤さんとか、齊藤さんとか、とにかく「さいとうさん」が多すぎ。システムを扱ったり、客の名前を手書きすることがある立場だけで言えば、斉藤さんに統一してくれればいいと思う。さいとうさん以外もだけど。
ただ、自分の字体にこだわっている人もいるから、今のままでもよいのかなとも思う。
殆ど誤字(もしくは勝手文字)だから、そういうのだけでも整理すべきだろうね。
元が誤字でも、ユニークであることに価値を見出す人もいるので、他と同じになれと言われてはいそうですかと言う人ばかりじゃありません。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人はmoriwaka -- Anonymous Coward
旧字体を継承することは一度考え直したほうがよい (スコア:0)
旧字体そのものがハードルになっているのであれば、現代の文字に整合すべきだと思う。
言葉だって時代ごとにそれぞれの文法があって、その時々で時代にあったものが選ばれている。
まずはUTF-8ベースで話をすべきではないのかな。
Re: (スコア:0)
議論のレベルが違う。戸籍簿では旧字体どころか書き誤りなどまたは意図的なものによる異体字まで忠実に記録している。
Re: (スコア:0)
当時の役所が事なかれ主義で申請された内容をそのまま受け取ってただけでしょ
今のキラキラネームも同様の問題になると思うけどね
Re: (スコア:0)
一応、文化というものが先にあって、そこに事務処理とか「常用されるアジア文字は8bitも
あればじゅうぶんである」とか雑極まるUnicodeの都合が後からやってきたわけだからして…
Re:旧字体を継承することは一度考え直したほうがよい (スコア:1)
>一応、文化というものが先にあって、そこに事務処理とか「常用されるアジア文字は8bitも
>あればじゅうぶんである」とか雑極まるUnicodeの都合が後からやってきたわけだからして…
そうでもないですよ?
名字を名乗るのの明治政府が勝手に決めて「ない奴は今すぐ決めろ」とシステムが先行したものですし。
Re:旧字体を継承することは一度考え直したほうがよい (スコア:1)
予想外に反響があって、非常に参考になります。
自分が一番言いたかった点はココで、名字が元々一部の人たちのものであって、社会システム変更のタイミングで新しく追加されたということに着目しています。
社会システムは適宜見直されるべきであると考えます。
事情をよく知っている人ならば、過去全ての戸籍がテキストデータとして扱われず、明治自体近傍のものなどは役人の誤記があるものが平気で手書きを画像化したデータで残っているのですよ。
個人の権利も重要ですが、使いずらいデータに価値はあるのでしょうかね・・・
Re: (スコア:0)
×使いずらい
○使いづらい
というのはさておき
「戸籍システムに使える字は(今と異なる)この文字集団にしましょう」という議論はあっても良いとは思います。
ただその議論をまとめるのは果てしなく難しく、例えば当用漢字とか常用漢字とか簡体字とかにまつわる話を見ても分かるように必ず「コレジャナイ」論との戦いになっちゃうんですよね。
例えばUnicodeに揃えたらどう?と言っても、そのUnicodeの現行部分は未来永劫固定と決まってるわけではない(日本国が固定できるものでもなく、また字体などは変更される可能性も結構ある…というか字体そのものはフォント側の問題だけど、そのコードにどの字体が含まれるかの問題)。
日本国の方も、「これが正字でこれが異体字」という定義が時々変更されている。
そんななか、「とりあえず0~65535文字目まではコレ固定ね」としようと思ったら「日本の国籍に使える文字セット」として日本主導日本管理で新たに立ち上げることになる。他の文字コード群とは別に。
なんか本末転倒感まで出てきちゃうんですよねー。
Re: (スコア:0)
字(あざな)を廃止したのもシステム(管理)都合ですしねぇ
Re: (スコア:0)
Unicodeは東アジアのマルチリンガル対応ができないけど、
各国内ですでにコード化された文字は全部区別するようにしていました。
だから国内システムに関する件をUnicodeのせいにするのはおかしい。
Re: (スコア:0)
システムのために国民がいるんじゃなくて、国民のためにシステムがあるんですよ。
UTF-8やUnicodeの制限で本来の名前を名乗れないなんて悲惨すぎる
Re: (スコア:0)
誤字や勝手に創作された意字を「本来」と呼ぶのに違和感がある、という話でしょ。
誤字だけじゃないんですけど (スコア:3, 参考になる)
戸籍統一文字は5万6040字(漢字5万5267字のほか変体仮名、平仮名、片仮名、括弧類、ラテン文字、ギリシア文字、キリル文字、アラビア数字など非漢字773字)もあり、Unicodeで表現できない文字も多く含まれています。
ちなみに、住民基本台帳ネットワーク統一文字は約2万字しかないので、それと比べていかに膨大かが分かるはずです。
その、戸籍統一文字でも表現できない文字があることで問題になっているのに、Unicodeを持ち出すとかレベルが低すぎます。
Unicode文字だけでなんとかできるなら誰も苦労しないですよ。
戸籍統一文字にあるけどUnicodeに無い文字の中に、担当者等の誤字によって生まれたものが多く含まれているのは事実ですけど、正しい漢字も多く含まれているのです。
むしろ、歴史をさかのぼると、Unicodeに登録されている方が本来の正字ではない「異自体」であることまであるのですが。
Unicodeが絶対的に正しいと思わない方がいいですよ。
Unicodeの方が「誤字」で、戸籍統一文字にしかない文字が「正字」であるというケースもあるので。
もし、貴方の氏名がUnicodeの都合で強制的に変えられたとして、貴方は納得しますか?
Re:誤字だけじゃないんですけど (スコア:1)
戸籍統一文字は漢和字典に載っている(そしてその字典が誤字だと言っていない)文字をとりあえず全部放り込んでいる節があって、実際にその字が戸籍で使われているかどうかは検討していないようなので、戸籍統一文字の字数をもとに何か言ってもあまり意味がないと思う。
字典に載っている字を放り込んだだけでは役に立たないというのはJIS X 0213の制定過程ですでに明らかになったことで今さらだし。
# ただし人名とは関係なく、大漢和辞典(の譌字でない字)とUnicodeの対応がわりと明確になったという副作用があって個人的には嬉しい
Re: (スコア:0)
別ACだけど、皆納得してもいいんじゃない?と思う。
正字だろうが誤字だろうが異字体だろうが旧字体だろうが、元からの「正しい」字だろうが無関係に、とにかくUnicodeで扱う字を正とするって話だよね?
そうなったとして自分は・・・(想像中)・・・それほど拘らないかなあ。
自分はあまり多くはない名字で、かつ昔の戸籍は文献や活字に無い書き方の字を使ってた。
父の代で辞書どおりの字にしたけど、それを聞いた時も単純に文化的な興味・面白さだけだったかな。
抵抗を感じる人もいるのだろうとは思うが、その拘りに共感はできない。
Re: (スコア:0)
情報システム化が避けて通れない道というのは既に分かっているはずですが、それならばUnicodeにどうして働きかけをしないのでしょうかね。
私が甚だ疑問なのは「一部の特殊な文字の方々のために、日本独自の文字コード体系を作る」ことが、どれだけ負担(経済的、技術的)になっているか、きちんと評価しているのかという一点に尽きます。
何でもかんでも現状のデータをそっくりそのまま移行するために、大きなコストを将来的に払い続けるという判断には同意しかねます。
Re: (スコア:0)
Unicodeを日本側が真にコントロールできない以上、「Unicodeで使える文字を正字とする」としたとたんにUnicode側での変更が国のシステム上の変更に直結しちゃうんですよね。
それだったら外字登録機能つけて個別登録の方がマシじゃね?という計算も成り立たないこともないと思うんだけどな。
これでの問題はプロトコールとフォーマット、そして「字を増やそうとする勢力」の規制にあるのである。
あと「グラフィティの登録」としての手書きサインと「デジタル登録」としての入力可能な第二水準までの文字列との並行運用という手もあるかもしれない。
Re: (スコア:0)
そのためにISV/IVDによる異体字処理があるのだがな。1万字ぐらいの異体字が定義されていたのではなかったか?
電子処理する以上は包摂は必須だし、手描きサインの変更まで強制されるわけではない。
Re: (スコア:0)
生まれたときからその名前なら、その人にとっては本来だと思うけど。
誰の視点での感想なのかが謎。
Re:旧字体を継承することは一度考え直したほうがよい (スコア:1)
>生まれたときからその名前なら、その人にとっては本来だと思うけど。
こうやって過ちも正当化されるのかー
Re:旧字体を継承することは一度考え直したほうがよい (スコア:1)
全てを過ちというレッテル貼って否定するのも過激すぎ
ψアレゲな事を真面目にやることこそアレゲだと思う。
Re: (スコア:0)
親の過ちで生まれた子はどうすればいいんだろう(笑)
Re: (スコア:0)
始めた人は「偉い人と同じ文字は恐れ多いから点一つ減らそう」とか逆に「ウチは唯一無二のこの文字を使おう」とか言って決めたケースもありますから、少なくとも本人にとっては過ちではなかったケースも多々ありますわな
めっちゃ面倒だけど(社内システム組む時にここの先生は一角少ないのが正しいから対応するようにと言われたった一人のために外字まわり作り込むことになったり)
真に誤ちだと思うなら自分でかけあって直すことも可能っちゃ可能ですもんね
親戚づきあいとの兼ね合いがあるからめっちゃ面倒だけど
Re: (スコア:0)
早めに親と縁を切って自立すればいいんじゃないですか?
Re: (スコア:0)
皮肉でもなくてまさにその通りなんじゃないですかね。
Re: (スコア:0)
日本語の漢字は滅びた中国の古代王朝のとある本からよく使う字だけ引用してる物だから
JISに規定されてる文字やその本にある字が全て「正しい漢字」ではない
種々の法律やUnicode規格で漢字表が作られてるが、「全ての正しい漢字の一覧」は無い
全て「この場面で使う字はこれを一覧とする」という部分的な表
特にUnicodeなんか文字コード規格ごとに微妙に処理が違うのを嫌がった欧米人が
「よく分からん古代文字を除けばアジア人に字が何億種もあるわけがない、これで我慢しろ」
と言って雑にキリのいい文字数で切って詰め込んだ物だから別に正しくも包括的でも無い
その結果枠が足りなくなって1文字あたりのバイト数をズルズル伸ばしてるしな
判子も旧字体が多い (スコア:0)
昔にハンコ屋が注文書等の電子化は金がかかりすぎて非現実的で難しいって話してたな
旧字体の名字が結構あるのと代表的なので吉の士か土か問題とかあるから
別途対応するシステム組むと洒落にならんわな
Re: (スコア:0)
UTF-8はエンコーディングの名前であって、文字集合の名前ではないとクソリプをしておく。
Re: (スコア:0)
その「エンコーディングとは何か」がブレているのも事実。
Re: (スコア:0)
UnicodeとUTF-8を混同するな(怒)
Re: (スコア:0)
むかしはコンピュータの処理能力不足から、異字体やらを使えなかったが、
コンピュータの処理能力が、異字体全部登録しても問題ないくらいに上がってるんだから、
数万文字を正規に追加すればいいのに
Re: (スコア:0)
実際、そういう取り組みは行われてきている。元の元のコメ「まずはUTF-8ベースで話をすべきではないのかな」と言うが、漢字異体字シーケンス (IVS)を使い、デジタル化した戸籍で使われている文字はすべてUTF-8で表現可能なはず。プレス発表 2017年12月22日に発行された国際規格に準拠した「IPAmj明朝フォント」の新バージョンを公開 ~行政実務で必要とされる漢字約6万文字の全てが利用可能に~ [ipa.go.jp]
それでもなお、タレコミのyasuoka先生の文章にあるとおり、現時点ではまだ少し足りないという状態ではあるようだが。
Re: (スコア:0)
https://mojikiban.ipa.go.jp/1292.html
異字体が表示できない場合であっても、代表的な字体が表示できるようにしている点がとても気に入りました。
# テキストなんて高々しれてるデータ量なので、これくらいケチケチせずに使ってどんどん共通化するのは賛成
Re: (スコア:0)
「互換が面倒だからデータなんてバンバン欠落させろ」
って、WindowsUpdateならそんくらい雑でもいいんだろうけどさぁ
# Unicodeにすれば文字の問題は何でも大丈夫だと信じてるなら確かに議論のレベルが違う
Re: (スコア:0)
先日のNHK日本人のおなまえっ!でやっていたけど、斎藤さんとか、斉藤さんとか、齊藤さんとか、とにかく「さいとうさん」が多すぎ。
システムを扱ったり、客の名前を手書きすることがある立場だけで言えば、斉藤さんに統一してくれればいいと思う。
さいとうさん以外もだけど。
ただ、自分の字体にこだわっている人もいるから、今のままでもよいのかなとも思う。
Re: (スコア:0)
殆ど誤字(もしくは勝手文字)だから、そういうのだけでも整理すべきだろうね。
Re: (スコア:0)
元が誤字でも、ユニークであることに価値を見出す人もいるので、他と同じになれと言われてはいそうですかと言う人ばかりじゃありません。