パスワードを忘れた? アカウント作成
15702226 journal
お金

route127の日記: みずほ外字 3

日記 by route127

社民党ではなく、みずほ証券の新システム移行に伴う漢字表記変更の話題に興味を覚えて一覧からコードポイントを調べていた。
汎用機の漢字コード事情はよく分からんが「風」の異体字「凬」はIBM拡張漢字に含まれていてMSのCP932や富士通のJFE(EBCDIC?)なんかでは表現できるらしい。
そう考えるとEUC-JPで表示できない漢字の切り捨てのような気がしてきたので、それぞれの漢字についてunicodeのコードポイントとEUC-JP収録状況を調べて表示するスクリプトを書いた。
結果はWin10付属メモ帳で游ゴシックを使用して表示させたのでブラウザだと見え方が変わるかもしれない。

凡例
左:システム変更前の漢字、右:システム変更後の漢字
C:CP932収録漢字、E:EUC-JP収録漢字

1  E簱(U+7C31)    CE籏(U+7C4F)
  2   𣳾(U+23CFE)    CE泰(U+6CF0)
  3 C 隆(U+F9DC)    CE隆(U+9686)
  4   ⿰青爭(U+2FF0 U+9752 U+722D)    CE静(U+9759)
  5   𡌛(U+2131B)    CE墅(U+5885)
  6   𫞏(U+2B78F)    CE橋(U+6A4B)
  7   䑓(U+4453)    CE臺(U+81FA)
  8   ⿰氵𮈡(U+2FF0 U+6C35 U+2E221)    CE潔(U+6F54)
  9   ⻆(U+2EC6)    CE角(U+89D2)
10   ⿱叀心(U+2FF1 U+53C0 U+5FC3)    CE惠(U+60E0)
11  E亯(U+4EAF)    CE亨(U+4EA8)
12   䒳(U+44B3)    CE朶(U+6736)
13  E乴(U+4E74)    CE折(U+6298)
14   𧜏(U+2770F)    CE裴(U+88F4)
15  E璚(U+749A)    CE瓊(U+74CA)
16  E刘(U+5218)    CE劉(U+5289)
17  E眎(U+770E)    CE視(U+8996)
18   𫕟(U+2B55F)    CE宵(U+5BB5)
19   ⿰金益(U+2FF0 U+91D1 U+76CA)    CE鎰(U+93B0)
20   沪(U+6CAA)    CE瀘(U+7018)
21   難(U+FA68)    CE難(U+96E3)
22   𠀋(U+2000B)    CE丈(U+4E08)
23 C 寬(U+5BEC)    CE寛(U+5BDB)
24 CE凜(U+51DC)    CE凛(U+51DB)
25 C 福(U+FA1B)    CE福(U+798F)
26 C 神(U+FA19)    CE神(U+795E)
27 C 凬(U+51EC)    CE風(U+98A8)
28   𤋮(U+242EE)    CE煕(U+7155)
29 CE熙(U+7199)    CE煕(U+7155)
30   𠘕(U+20615)    CE熈(U+7188)
31 CE纊(U+7E8A)    CE絋(U+7D4B)
32 CE曻(U+66FB)    CE昇(U+6607)
33 CE侚(U+4F9A)    CE徇(U+5F87)
34 CE冝(U+519D)    CE宜(U+5B9C)
35 C 增(U+589E)    CE増(U+5897)
36 C 﨑(U+FA11)    CE崎(U+5D0E)
37 C 德(U+5FB7)    CE徳(U+5FB3)
38 C 晥(U+6665)    CE皖(U+7696)
39 C 栁(U+6801)    CE柳(U+67F3)
40 C 淸(U+6DF8)    CE清(U+6E05)
41 CE濵(U+6FF5)    CE浜(U+6D5C)
42 C 瀨(U+7028)    CE瀬(U+702C)
43 C 祥(U+FA1A)    CE祥(U+7965)
44 C 靖(U+FA1C)    CE靖(U+9756)
45 C 賴(U+8CF4)    CE頼(U+983C)
46 C 髙(U+9AD9)    CE高(U+9AD8)
47   䌫(U+432B)    CE纜(U+7E9C)
48   社(U+FA4C)    CE社(U+793E)
49   㟢(U+37E2)    CE嵜(U+5D5C)
50   祐(U+FA4F)    CE祐(U+7950)
51   𠮷(U+20BB7)    CE吉(U+5409)
52   禮(U+79AE U+E0101)    CE禮(U+79AE)
53   彥(U+5F65)    CE彦(U+5F66)
54   廣(U+5EE3 U+E0101)    CE廣(U+5EE3)
55   藏(U+85CF U+E0101)    CE蔵(U+8535)
56  E泠(U+6CE0)    CE冷(U+51B7)
57   真(U+771F U+E0101)    CE真(U+771F)
58 CE杦(U+6766)    CE杉(U+6749)
59 CE靏(U+974F)    CE鶴(U+9DB4)

結果を見るとシステム変更前の漢字は以下の三つに分類できそうに思える。
(a)Unicodeに対応するコードポイントがないかIVSを使わないと表現できない

4   ⿰青爭(U+2FF0 U+9752 U+722D)    CE静(U+9759)
  8   ⿰氵𮈡(U+2FF0 U+6C35 U+2E221)    CE潔(U+6F54)
10   ⿱叀心(U+2FF1 U+53C0 U+5FC3)    CE惠(U+60E0)
19   ⿰金益(U+2FF0 U+91D1 U+76CA)    CE鎰(U+93B0)
52   禮(U+79AE U+E0101)    CE禮(U+79AE)
54   廣(U+5EE3 U+E0101)    CE廣(U+5EE3)
55   藏(U+85CF U+E0101)    CE蔵(U+8535)
57   真(U+771F U+E0101)    CE真(U+771F)

(b)Unicodeに対応するコードポイントがあるがEUC-JPでは定義されていない

2   𣳾(U+23CFE)    CE泰(U+6CF0)
  3 C 隆(U+F9DC)    CE隆(U+9686)
  5   𡌛(U+2131B)    CE墅(U+5885)
  6   𫞏(U+2B78F)    CE橋(U+6A4B)
  7   䑓(U+4453)    CE臺(U+81FA)
  9   ⻆(U+2EC6)    CE角(U+89D2)
12   䒳(U+44B3)    CE朶(U+6736)
14   𧜏(U+2770F)    CE裴(U+88F4)
18   𫕟(U+2B55F)    CE宵(U+5BB5)
20   沪(U+6CAA)    CE瀘(U+7018)
21   難(U+FA68)    CE難(U+96E3)
22   𠀋(U+2000B)    CE丈(U+4E08)
23 C 寬(U+5BEC)    CE寛(U+5BDB)
25 C 福(U+FA1B)    CE福(U+798F)
26 C 神(U+FA19)    CE神(U+795E)
27 C 凬(U+51EC)    CE風(U+98A8)
28   𤋮(U+242EE)    CE煕(U+7155)
30   𠘕(U+20615)    CE熈(U+7188)
35 C 增(U+589E)    CE増(U+5897)
36 C 﨑(U+FA11)    CE崎(U+5D0E)
37 C 德(U+5FB7)    CE徳(U+5FB3)
38 C 晥(U+6665)    CE皖(U+7696)
39 C 栁(U+6801)    CE柳(U+67F3)
40 C 淸(U+6DF8)    CE清(U+6E05)
42 C 瀨(U+7028)    CE瀬(U+702C)
43 C 祥(U+FA1A)    CE祥(U+7965)
44 C 靖(U+FA1C)    CE靖(U+9756)
45 C 賴(U+8CF4)    CE頼(U+983C)
46 C 髙(U+9AD9)    CE高(U+9AD8)
47   䌫(U+432B)    CE纜(U+7E9C)
48   社(U+FA4C)    CE社(U+793E)
49   㟢(U+37E2)    CE嵜(U+5D5C)
50   祐(U+FA4F)    CE祐(U+7950)
51   𠮷(U+20BB7)    CE吉(U+5409)
53   彥(U+5F65)    CE彦(U+5F66)

(c)UnicodeでもEUC-JPでも表現できる

1  E簱(U+7C31)    CE籏(U+7C4F)
11  E亯(U+4EAF)    CE亨(U+4EA8)
13  E乴(U+4E74)    CE折(U+6298)
15  E璚(U+749A)    CE瓊(U+74CA)
16  E刘(U+5218)    CE劉(U+5289)
17  E眎(U+770E)    CE視(U+8996)
24 CE凜(U+51DC)    CE凛(U+51DB)
29 CE熙(U+7199)    CE煕(U+7155)
31 CE纊(U+7E8A)    CE絋(U+7D4B)
32 CE曻(U+66FB)    CE昇(U+6607)
33 CE侚(U+4F9A)    CE徇(U+5F87)
34 CE冝(U+519D)    CE宜(U+5B9C)
41 CE濵(U+6FF5)    CE浜(U+6D5C)
56  E泠(U+6CE0)    CE冷(U+51B7)
58 CE杦(U+6766)    CE杉(U+6749)
59 CE靏(U+974F)    CE鶴(U+9DB4)

EUC-JPで表示できない漢字を切り捨てるのかと思ったが表示できる漢字(c)も割とあった。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2022年06月17日 2時32分 (#4270883)

    システム変更前の漢字でCP932に収録されているもの(25字)は、全部JIS90で追加されたもの(2字)かIBM拡張漢字(23字)のようなので。
    一覧に掲載されたのはおそらくみずほ証券のシステムで実際に使われていたJIS83外字だけなので、一覧だけ見ても法則性はつかめないと思う

    • リプレースとかで文字コードが変わるのを想像してたけど古いJISを切り捨ててるのか。
      どういうメリットがあるのか想像がつかない。

      親コメント
      • by Anonymous Coward

        別ACです。
        証券会社は、源泉徴収などのオンライン手続でマイナンバーや法人番号を利用する場合にはJISの範囲内の縮退しなければなりません。
        もしかしたら、いっそのこと外字をやめようという判断なのかも。
        外字廃止で検索すると、健康保険組合ではマイナンバー対応に合わせて外字をやめたところが割とあるようです。

typodupeerror

犯人はmoriwaka -- Anonymous Coward

読み込み中...