パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

厚労省の診療データベース、データの不備によって突き合わせできず」記事へのコメント

  • by Anonymous Coward on 2013年11月06日 11時12分 (#2490496)

    仕様はこの資料の最後の3ページに書かれています。
    http://www.mhlw.go.jp/stf/shingi/2r9852000000thao-att/2r9852000000theb.pdf [mhlw.go.jp]
    お時間のない方のためにまとめると、
    1. 保険者番号,(保険証)記号番号,生年月日,性別 から作成したハッシュ値
    2. 氏名,生年月日,性別 から作成したハッシュ値
    の2種類のハッシュで 名寄せする、ということでした。
    この資料上でも、名前のカナ,漢字で合わないことがあるので、そういう場合は
    1番目のハッシュ値を使う、と書いてます。

    ここからは考察。お時間のない方は読まなくてOK。
    記号番号は結構変更がある上、同性の双子は区別できないので、1番目のキーも
    それほど盤石ではありませんが、8割ロストするほどひどいものでもないと
    思われます。
    二番目のキーの問題だけをとりあげてNHKが先走った報道をした可能性も
    ありますが、一番目のキーがあっても8割ロストしてしまうことの
    原因を考えると、やはり
    大きな問題は、ハッシュ値を作成するのが、運用管理業者側である、
    とされていることです。もちろんハッシュアルゴリズムを合わせるぐらいの
    ルール運用はされていますが、たとえば記号番号に含まれる数字を
    全角/半角のどちらで行うか(全角が正解)、ゼロフィルしちゃいけませんよ、
    あるいは保険者番号が分からないときはどうするのか、とか
    そういうことをちゃんと決めていたとしても、ハッシュ値になっていると
    それらルールが守られているかチェックできないのが痛いかと。

    • by Anonymous Coward on 2013年11月06日 11時31分 (#2490501)

      ハズしているかも知れないけど、思いついたことを。
      特定健診の元データは、XMLでやりとりされるので、日本語、全角文字はUTF8で記載されています。
      一方、電子レセプトのほとんどはShiftJISデータでやりとりが行われています。
      <<記号番号に ひらがなや全角が含まれることが多い>>ため、
      記号番号を入れたときに別のハッシュ値になるかもしれません。

      うーん こっちが本命かも。。。

      親コメント
    • by Anonymous Coward

      番号の扱いすら正規化ルールが徹底されていないとなると、医療用IDであれ共通番号であれ、どうにもならなかったということになるでしょうか。

UNIXはただ死んだだけでなく、本当にひどい臭いを放ち始めている -- あるソフトウェアエンジニア

処理中...