アカウント名:
パスワード:
厚労省は「すでに集めたデータも照合できるように今年度システム改修を進める」としているが、ハッシュ値を直すには原データが必要だろう。全データの入れ直しになるのではないだろうか。
氏名+生年月日 のハッシュ値から、氏名・生年月日を割り出すことは意外と簡単ですよ。
って感じです。ハッシュ値のみから力技で解析する必要がなくなるので、数億回ハッシュ関数を通す計算をやるだけで済みます。これなら、計算コストも殆どかかりません。「正規化」というデータベースの入門書とか、ITパスポートや基本情報技術者試験の勉強本にも書かれているような基礎的なことができないような開発者・企画者のことだから、ストレッチングなんてやらずにMD5・SHA-1・SHA-2とかのハッシュ関数を1度通しただけでしょうから、家庭用コンピュータでもできるぐらいです。
とりあえず2013年のストーリーも読み直した方が良さそう。
このあたり [it.srad.jp]の推測とかどうなったろ
それやっても年金と同じく入力ミスや手抜き入力でヒットしないデータは残るんだろうなぁ…というか> 住民票データベースは正当な理由があれば取得できますこんなゴミを発注して運用を続けた連中や作り上げた連中がそれを許可・実行するのだろうか?
この無様を晒しながら何も対策せずに運用(笑)を続けるとか、「ただの不具合であり、発注・開発・検収に問題はなかった」なんて言い出しても全く不思議じゃない連中だと思うんだが…
そうですね。記号番号データのハッシュ値より、氏名+生年月日+性別の ハッシュ値を攻めるほうが近道かもしれません。#ハッシュ化の工程は 2度通すようになっているようですが。
ただ、あなたの指摘の手法は、そもそもハッシュ値に置き換えることで「匿名化」ができているんだ、とする主張を覆すものなので、厚労省自らの手では行えないということでしょうか。
過去の集計データの規模からみて、対象データは数百万人程度の分量だと推測されますので、わずかその程度であれば、あらためて 原データを出してもらうのが 一番早いと思いますが、そんなものにお金はつかないでしょうね。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
コンピュータは旧約聖書の神に似ている、規則は多く、慈悲は無い -- Joseph Campbell
データの入れ替えの必要は無いのでは? (スコア:2)
氏名+生年月日 のハッシュ値から、氏名・生年月日を割り出すことは意外と簡単ですよ。
って感じです。ハッシュ値のみから力技で解析する必要がなくなるので、数億回ハッシュ関数を通す計算をやるだけで済みます。これなら、計算コストも殆どかかりません。「正規化」というデータベースの入門書とか、ITパスポートや基本情報技術者試験の勉強本にも書かれているような基礎的なことができないような開発者・企画者のことだから、ストレッチングなんてやらずにMD5・SHA-1・SHA-2とかのハッシュ関数を1度通しただけでしょうから、家庭用コンピュータでもできるぐらいです。
Re:データの入れ替えの必要は無いのでは? (スコア:1)
とりあえず2013年のストーリーも読み直した方が良さそう。
このあたり [it.srad.jp]の推測とかどうなったろ
Re: (スコア:0)
それやっても年金と同じく入力ミスや手抜き入力でヒットしないデータは残るんだろうなぁ…
というか
> 住民票データベースは正当な理由があれば取得できます
こんなゴミを発注して運用を続けた連中や作り上げた連中がそれを許可・実行するのだろうか?
この無様を晒しながら何も対策せずに運用(笑)を続けるとか、
「ただの不具合であり、発注・開発・検収に問題はなかった」
なんて言い出しても全く不思議じゃない連中だと思うんだが…
Re: (スコア:0)
そうですね。
記号番号データのハッシュ値より、
氏名+生年月日+性別の ハッシュ値を攻めるほうが近道かもしれません。
#ハッシュ化の工程は 2度通すようになっているようですが。
ただ、あなたの指摘の手法は、そもそもハッシュ値に置き換えることで「匿名化」ができているんだ、
とする主張を覆すものなので、厚労省自らの手では行えないということでしょうか。
過去の集計データの規模からみて、対象データは数百万人程度の分量だと推測されますので、
わずかその程度であれば、あらためて 原データを出してもらうのが 一番早いと思いますが、
そんなものにお金はつかないでしょうね。