アカウント名:
パスワード:
「とにかく日本の住所のヤバさをもっと知るべきだと思います」 https://note.com/inuro/n/n7ec7cf15cf9c [note.com]
というnoteの記事を読んでいたのだが、なんというかルールがめちゃくちゃじゃねえか住所って。「○○市■■2丁目1-15」みたいなルールなのかと思ったら「下田市2丁目」というパターンもある。「春日部市8丁目」は1~7丁目はない。丁目すらなく市の下にいきなり番地になってる「御所市1番地」
なお「同一市内に同一町名が2つある」とかいう事態もあるそうだ。どうなってるんだ住所システム。そんなのでいいのか。
春日部市8丁目じゃない春日部市八丁目だ。八丁目は大字か字かにあたる固有名詞なので漢数字と算用数字を間違えてはいけない。
> 春日部市8丁目じゃない春日部市八丁目だ。
そんなのはわかってますが、「春日部市8丁目」で登録されたりするから困るんですよ。
という話を書いたのだが?
え?
こういうのも居るから,いかに根が深い問題か。人による表記ゆれもある(そういう問題じゃない)
>千葉が内部データ上は1000葉になってようがstrcmpで一致判定できるかどうかという観点では気にする必要はない。それに近い地名曖昧検索システムを20年以上前に作ったわただ困ったことに、そうやって見るからにヒドい表記だけどどうせ内部データだからいいかって割り切った正規化データを表示用に使うとか言われたこと実験的プロジェクトなのでごめんねで押し切った
八戸市も8戸市に! 正規化するんですね!
わはは
まぁこの目的ならそれでいいしかし略称、地名重複を含む表記ゆれなどには対応できないなこれ
そのマスターデータもユーザーデータも内で閉じてる分には問題ないですけどね。じゃあ別のライブラリ使って地図参照させようとか集客の弱い店舗を割り出そうとかなると困るわけで。
VIII戸市に正規化します
千葉県も1000葉県で。
大昔、郵便番号をローマ数字にしたり、「壱」「弐」「参」で書いたことはある。若さ故の過ちだ。許してくれ。
で、ハイフンに漢数字の一を使われて破綻すると
実際、ハイフンとかが「ー」になってるのはよく見てきた。
まぁまぁの正規化ができてるなら、正し目な住所一覧に正規化掛けて、差異が出たエントリだけ正規化データをキーにした正し目住所一覧を生成、表示の際にそのデータベースに引っかかれば変換する、で良さげだけど……まぁ省力化は出来ても面倒は面倒、か。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
Stay hungry, Stay foolish. -- Steven Paul Jobs
マイナンバーカードより先にマイ住所ナンバーをつくれ (スコア:5, 興味深い)
「とにかく日本の住所のヤバさをもっと知るべきだと思います」
https://note.com/inuro/n/n7ec7cf15cf9c [note.com]
というnoteの記事を読んでいたのだが、なんというかルールがめちゃくちゃじゃねえか住所って。
「○○市■■2丁目1-15」みたいなルールなのかと思ったら「下田市2丁目」というパターンもある。
「春日部市8丁目」は1~7丁目はない。
丁目すらなく市の下にいきなり番地になってる「御所市1番地」
なお「同一市内に同一町名が2つある」とかいう事態もあるそうだ。どうなってるんだ住所システム。そんなのでいいのか。
Re: (スコア:5, 参考になる)
春日部市8丁目じゃない春日部市八丁目だ。
八丁目は大字か字かにあたる固有名詞なので漢数字と算用数字を間違えてはいけない。
Re: (スコア:1)
> 春日部市8丁目じゃない春日部市八丁目だ。
そんなのはわかってますが、「春日部市8丁目」で登録されたりするから困るんですよ。
Re:マイナンバーカードより先にマイ住所ナンバーをつくれ (スコア:1)
という話を書いたのだが?
Re: (スコア:0)
え?
Re: (スコア:0)
こういうのも居るから,いかに根が深い問題か。
人による表記ゆれもある(そういう問題じゃない)
Re:マイナンバーカードより先にマイ住所ナンバーをつくれ (スコア:1)
と思ったらマスターデータが春日部市8丁目だったりするわけ。
本当にやるべきだったのは
・比較はマスターデータとユーザーデータの両方を8丁目に正規化する
ここで春日部市の正式な地名がどうとかは心底どうでもいいことで実際は根はそんなに深くない。宛名に何書くかとかは「今は」考えなくていいということ。千葉が内部データ上は1000葉になってようがstrcmpで一致判定できるかどうかという観点では気にする必要はない。
って話をずっと前に経産省だか国交省が住所の正規化ライブラリ作ったよ、というトピでやったような
Re: (スコア:0)
>千葉が内部データ上は1000葉になってようがstrcmpで一致判定できるかどうかという観点では気にする必要はない。
それに近い地名曖昧検索システムを20年以上前に作ったわ
ただ困ったことに、そうやって見るからにヒドい表記だけどどうせ内部データだからいいかって割り切った
正規化データを表示用に使うとか言われたこと
実験的プロジェクトなのでごめんねで押し切った
Re: (スコア:0)
八戸市も8戸市に! 正規化するんですね!
わはは
Re: (スコア:0)
まぁこの目的ならそれでいい
しかし略称、地名重複を含む表記ゆれなどには対応できないなこれ
Re:マイナンバーカードより先にマイ住所ナンバーをつくれ (スコア:1)
そのマスターデータもユーザーデータも内で閉じてる分には問題ないですけどね。
じゃあ別のライブラリ使って地図参照させようとか集客の弱い店舗を割り出そうとかなると困るわけで。
Re: (スコア:0)
VIII戸市に正規化します
Re: (スコア:0)
千葉県も1000葉県で。
Re: (スコア:0)
大昔、郵便番号をローマ数字にしたり、「壱」「弐」「参」で書いたことはある。
若さ故の過ちだ。許してくれ。
Re: (スコア:0)
で、ハイフンに漢数字の一を使われて破綻すると
Re: (スコア:0)
10000000000000000都の1000000遍
Re: (スコア:0)
Re: (スコア:0)
実際、ハイフンとかが「ー」になってるのはよく見てきた。
Re:マイナンバーカードより先にマイ住所ナンバーをつくれ (スコア:1)
Re: (スコア:0)
まぁまぁの正規化ができてるなら、正し目な住所一覧に正規化掛けて、
差異が出たエントリだけ正規化データをキーにした正し目住所一覧を生成、
表示の際にそのデータベースに引っかかれば変換する、で良さげだけど……
まぁ省力化は出来ても面倒は面倒、か。