route127の日記: みずほ外字 3
社民党ではなく、みずほ証券の新システム移行に伴う漢字表記変更の話題に興味を覚えて一覧からコードポイントを調べていた。
汎用機の漢字コード事情はよく分からんが「風」の異体字「凬」はIBM拡張漢字に含まれていてMSのCP932や富士通のJFE(EBCDIC?)なんかでは表現できるらしい。
そう考えるとEUC-JPで表示できない漢字の切り捨てのような気がしてきたので、それぞれの漢字についてunicodeのコードポイントとEUC-JP収録状況を調べて表示するスクリプトを書いた。
結果はWin10付属メモ帳で游ゴシックを使用して表示させたのでブラウザだと見え方が変わるかもしれない。
凡例
左:システム変更前の漢字、右:システム変更後の漢字
C:CP932収録漢字、E:EUC-JP収録漢字
1 E簱(U+7C31) CE籏(U+7C4F)
2 𣳾(U+23CFE) CE泰(U+6CF0)
3 C 隆(U+F9DC) CE隆(U+9686)
4 ⿰青爭(U+2FF0 U+9752 U+722D) CE静(U+9759)
5 𡌛(U+2131B) CE墅(U+5885)
6 𫞏(U+2B78F) CE橋(U+6A4B)
7 䑓(U+4453) CE臺(U+81FA)
8 ⿰氵𮈡(U+2FF0 U+6C35 U+2E221) CE潔(U+6F54)
9 ⻆(U+2EC6) CE角(U+89D2)
10 ⿱叀心(U+2FF1 U+53C0 U+5FC3) CE惠(U+60E0)
11 E亯(U+4EAF) CE亨(U+4EA8)
12 䒳(U+44B3) CE朶(U+6736)
13 E乴(U+4E74) CE折(U+6298)
14 𧜏(U+2770F) CE裴(U+88F4)
15 E璚(U+749A) CE瓊(U+74CA)
16 E刘(U+5218) CE劉(U+5289)
17 E眎(U+770E) CE視(U+8996)
18 𫕟(U+2B55F) CE宵(U+5BB5)
19 ⿰金益(U+2FF0 U+91D1 U+76CA) CE鎰(U+93B0)
20 沪(U+6CAA) CE瀘(U+7018)
21 難(U+FA68) CE難(U+96E3)
22 𠀋(U+2000B) CE丈(U+4E08)
23 C 寬(U+5BEC) CE寛(U+5BDB)
24 CE凜(U+51DC) CE凛(U+51DB)
25 C 福(U+FA1B) CE福(U+798F)
26 C 神(U+FA19) CE神(U+795E)
27 C 凬(U+51EC) CE風(U+98A8)
28 𤋮(U+242EE) CE煕(U+7155)
29 CE熙(U+7199) CE煕(U+7155)
30 𠘕(U+20615) CE熈(U+7188)
31 CE纊(U+7E8A) CE絋(U+7D4B)
32 CE曻(U+66FB) CE昇(U+6607)
33 CE侚(U+4F9A) CE徇(U+5F87)
34 CE冝(U+519D) CE宜(U+5B9C)
35 C 增(U+589E) CE増(U+5897)
36 C 﨑(U+FA11) CE崎(U+5D0E)
37 C 德(U+5FB7) CE徳(U+5FB3)
38 C 晥(U+6665) CE皖(U+7696)
39 C 栁(U+6801) CE柳(U+67F3)
40 C 淸(U+6DF8) CE清(U+6E05)
41 CE濵(U+6FF5) CE浜(U+6D5C)
42 C 瀨(U+7028) CE瀬(U+702C)
43 C 祥(U+FA1A) CE祥(U+7965)
44 C 靖(U+FA1C) CE靖(U+9756)
45 C 賴(U+8CF4) CE頼(U+983C)
46 C 髙(U+9AD9) CE高(U+9AD8)
47 䌫(U+432B) CE纜(U+7E9C)
48 社(U+FA4C) CE社(U+793E)
49 㟢(U+37E2) CE嵜(U+5D5C)
50 祐(U+FA4F) CE祐(U+7950)
51 𠮷(U+20BB7) CE吉(U+5409)
52 禮(U+79AE U+E0101) CE禮(U+79AE)
53 彥(U+5F65) CE彦(U+5F66)
54 廣(U+5EE3 U+E0101) CE廣(U+5EE3)
55 藏(U+85CF U+E0101) CE蔵(U+8535)
56 E泠(U+6CE0) CE冷(U+51B7)
57 真(U+771F U+E0101) CE真(U+771F)
58 CE杦(U+6766) CE杉(U+6749)
59 CE靏(U+974F) CE鶴(U+9DB4)
結果を見るとシステム変更前の漢字は以下の三つに分類できそうに思える。
(a)Unicodeに対応するコードポイントがないかIVSを使わないと表現できない
4 ⿰青爭(U+2FF0 U+9752 U+722D) CE静(U+9759)
8 ⿰氵𮈡(U+2FF0 U+6C35 U+2E221) CE潔(U+6F54)
10 ⿱叀心(U+2FF1 U+53C0 U+5FC3) CE惠(U+60E0)
19 ⿰金益(U+2FF0 U+91D1 U+76CA) CE鎰(U+93B0)
52 禮(U+79AE U+E0101) CE禮(U+79AE)
54 廣(U+5EE3 U+E0101) CE廣(U+5EE3)
55 藏(U+85CF U+E0101) CE蔵(U+8535)
57 真(U+771F U+E0101) CE真(U+771F)
(b)Unicodeに対応するコードポイントがあるがEUC-JPでは定義されていない
2 𣳾(U+23CFE) CE泰(U+6CF0)
3 C 隆(U+F9DC) CE隆(U+9686)
5 𡌛(U+2131B) CE墅(U+5885)
6 𫞏(U+2B78F) CE橋(U+6A4B)
7 䑓(U+4453) CE臺(U+81FA)
9 ⻆(U+2EC6) CE角(U+89D2)
12 䒳(U+44B3) CE朶(U+6736)
14 𧜏(U+2770F) CE裴(U+88F4)
18 𫕟(U+2B55F) CE宵(U+5BB5)
20 沪(U+6CAA) CE瀘(U+7018)
21 難(U+FA68) CE難(U+96E3)
22 𠀋(U+2000B) CE丈(U+4E08)
23 C 寬(U+5BEC) CE寛(U+5BDB)
25 C 福(U+FA1B) CE福(U+798F)
26 C 神(U+FA19) CE神(U+795E)
27 C 凬(U+51EC) CE風(U+98A8)
28 𤋮(U+242EE) CE煕(U+7155)
30 𠘕(U+20615) CE熈(U+7188)
35 C 增(U+589E) CE増(U+5897)
36 C 﨑(U+FA11) CE崎(U+5D0E)
37 C 德(U+5FB7) CE徳(U+5FB3)
38 C 晥(U+6665) CE皖(U+7696)
39 C 栁(U+6801) CE柳(U+67F3)
40 C 淸(U+6DF8) CE清(U+6E05)
42 C 瀨(U+7028) CE瀬(U+702C)
43 C 祥(U+FA1A) CE祥(U+7965)
44 C 靖(U+FA1C) CE靖(U+9756)
45 C 賴(U+8CF4) CE頼(U+983C)
46 C 髙(U+9AD9) CE高(U+9AD8)
47 䌫(U+432B) CE纜(U+7E9C)
48 社(U+FA4C) CE社(U+793E)
49 㟢(U+37E2) CE嵜(U+5D5C)
50 祐(U+FA4F) CE祐(U+7950)
51 𠮷(U+20BB7) CE吉(U+5409)
53 彥(U+5F65) CE彦(U+5F66)
(c)UnicodeでもEUC-JPでも表現できる
1 E簱(U+7C31) CE籏(U+7C4F)
11 E亯(U+4EAF) CE亨(U+4EA8)
13 E乴(U+4E74) CE折(U+6298)
15 E璚(U+749A) CE瓊(U+74CA)
16 E刘(U+5218) CE劉(U+5289)
17 E眎(U+770E) CE視(U+8996)
24 CE凜(U+51DC) CE凛(U+51DB)
29 CE熙(U+7199) CE煕(U+7155)
31 CE纊(U+7E8A) CE絋(U+7D4B)
32 CE曻(U+66FB) CE昇(U+6607)
33 CE侚(U+4F9A) CE徇(U+5F87)
34 CE冝(U+519D) CE宜(U+5B9C)
41 CE濵(U+6FF5) CE浜(U+6D5C)
56 E泠(U+6CE0) CE冷(U+51B7)
58 CE杦(U+6766) CE杉(U+6749)
59 CE靏(U+974F) CE鶴(U+9DB4)
EUC-JPで表示できない漢字を切り捨てるのかと思ったが表示できる漢字(c)も割とあった。
単純にJIS83外字を切り捨てたのでは? (スコア:0)
システム変更前の漢字でCP932に収録されているもの(25字)は、全部JIS90で追加されたもの(2字)かIBM拡張漢字(23字)のようなので。
一覧に掲載されたのはおそらくみずほ証券のシステムで実際に使われていたJIS83外字だけなので、一覧だけ見ても法則性はつかめないと思う
Re:単純にJIS83外字を切り捨てたのでは? (スコア:1)
リプレースとかで文字コードが変わるのを想像してたけど古いJISを切り捨ててるのか。
どういうメリットがあるのか想像がつかない。
Re: (スコア:0)
別ACです。
証券会社は、源泉徴収などのオンライン手続でマイナンバーや法人番号を利用する場合にはJISの範囲内の縮退しなければなりません。
もしかしたら、いっそのこと外字をやめようという判断なのかも。
外字廃止で検索すると、健康保険組合ではマイナンバー対応に合わせて外字をやめたところが割とあるようです。