パスワードを忘れた? アカウント作成
423098 journal

pasasの日記: 郵便番号とCSV

日記 by pasas

「郵便番号を入れると、住所を自動的に補完してくれるようなユーザインタフェースが欲しい」という発注を受けた。
郵便番号のデータは郵政事業庁のページからダウンロード。
当然だけど、自由にタダで使えるらしい。
全部で12万件以上。
間違いなくこの情報がDBの中で一番容量を食っている。

ところがこのデータ、ちょっとだけ曲者。
以下困ったこと。

  • 住所欄に「以下に掲載がない場合」という記述がある。今回のシステムにとって、これは困る。
  • ひとつの番号で、2つの住所を表している場合がある。でも、これはフラグがあるので回避可能。

そして一番困ったのはこれ。

  • 長い住所の場合、2エントリに渡っている。

ちょっとわかりにくいかもしれないけど、以下のような感じ。

"6020033","京都府","京都市上京区","今出川町(烏丸通今出川上る、烏丸通今出川下る、今出川通烏丸西"
"6020033","京都府","京都市上京区","入、今出川通室町東入)"

つまり最後のフィールドが途中で切断されて別エントリとなっているのだ。
こんなのってアリ??

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

計算機科学者とは、壊れていないものを修理する人々のことである

読み込み中...