パスワードを忘れた? アカウント作成

経産省、住所の正規化などを行えるコンポーネントを公開」記事へのコメント

  • 不動産関係の仕事をしている私からすると、誤った方法で住所を勝手に正規化するシステムがあって腹が立ちます。

    内部的にその会社で都合の良い方法で正規化するのは仕方無いとしても、顧客が入力した住所を勝手に誤った方法で改変して、それを宛名として郵便物を送り付けることは大変失礼にあたるので止めていただきたいです。

    日本の住所表記を大きく分けると、住居表示の地域と、住居表示が実施されていない地域の2つがあるので、正規化するならそれを混同しないようにしましょう。

    ・住居表示の地域
    正)東京都千代田区永田町一丁目10番1号
    誤)東京都千代田区永田町1丁目10番1号 … 「永田町一丁目」という地名なので算用数字にしてはならない
    誤)東京都千代田区永田町一丁目10番地1 … 住居表示の地域では「番地」ではなく「番」を使う

    ・地番管理の地域
    正)大宮区吉敷町一丁目124番地1
    誤)大宮区吉敷町一丁目124番地1号 … 最後の「号」は地番管理の地域では使用しない
    誤)大宮区吉敷町一丁目124番1号 … 地番管理の地域では「A番B号」ではなく「A番地B」としなければならない

    また、エンジニアの中には全角数字を異常にまで嫌う人が居ますが、戸籍や住民基本台帳などの電算化に関する法令や規則等では住所の数字は「全角数字」で統一することとされています。
    正規化するなら、勝手に半角にしたりせず、全角に正規化しましょう。半角にしたら、マイナンバーカードから取得した電子データや住民票等と完全一致しなくなります。

    なお、運転免許証に表記されている住所は券面スペースの関係上省略表示される場合があり、必ずしも正しいとは限りません。

    あと、勝手に「大宮区吉敷町1-124-1」のようにハイフン表記するシステムもありますが、
    ・住居表示なのか地番管理なのかというその場所に辿り着く上で重要な情報を削除している
    ・部屋番号なのか番地なのか等が分かりにくくなる
    ・それによるスペースの節約は僅か(世の中には長すぎる地名・住所というものが存在するので、それに対応する空間を用意していたならばハイフン表記で節約できるスペースなんて誤差)
    という観点からデメリットが多いので止めていただきたいです。

    余談ですが、就活マナー本が間違いだらけで、履歴書で「大宮区吉敷町1丁目124番地1号」のような誤表記(地番管理なら最後の「号」が不要なので「A番地B号」とはしてはならない)をする人が大変多いです(正確に書いている人の方が稀)。
    不動産業界でそんな履歴書を出すと、住居表示と地番管理の区別すらできていないというマイナスのアピールにしかなりません。
    普段は「大宮区吉敷町1-124-1」のような省略表記をしていて正確に書こうとして間違えているのだと思いますが、それならハイフンで省略した表記の方がまだマシです。

    ここに返信
    • by Anonymous Coward on 2020年06月02日 19時43分 (#3826265)

      正規化(normalization)は一定の規則に則ってデータを変形することです.それと規範的な正しさとは別の問題です.
      元コメ氏の主張は「住居表示台帳」上の住所規則が,住民基本台帳上の住所にも完全に適応されているという前提に立っていることが問題です.

      住民基本台帳は自治体によって登録ルールを設けているところもありますが,ルールがないところもあります.
      登録時のルールを厳密に運用している自治体は,街区符号や住居番号,さらにマンション名の表記方法や部屋番号の位置などを登録時に住居表示台帳をもとに正規化します(住所に含めるか,マンション名の後にするか,「室」をつけるかなど).
      しかし,ルールがない自治体は同じ土地であっても町名(町丁)以下は,申請者の表記のまま登録します.おそろしいことに,これまで経験した中で地番までしか台帳に登録していない自治体も日本にはあるのです(なのに行政からの郵便物が届く不思議).

      したがって,個人にとっての住民票上の「正しい」住所は住民基本台帳に登録された住所となります.
      まぁ,履歴書程度なら勝手に「正しい」表記に書き換えても良いですね.

      • ですね。

        東京都某A区で、転入時に「一丁目」と書いたものは、発行された住民票では「1丁目」となっていて、同区内の戸籍では「一丁目」となっていました。
        部屋番号を「101号」と書いたものはそのままで、また、同室に別住民票で入居した人は「101」と書き、これもそのまま住民票に反映された。

        他方、某B区で、転入時に「1-2-3-456」と書いたものは、住民票では「一丁目2番3-456号」となっていました。

        どちらも漢数字が正式な町名のところ。
        正規化とは正式化ではないし、公的文書が正式に準拠しているとは限らないし、全ての公的機関が同じ基準でもないし、組織内で統一しているとも限らない。
        なかなか難しいですね。

      • by Anonymous Coward

        > これまで経験した中で地番までしか台帳に登録していない自治体も日本にはある

        どうも、住所で使う〇番-△号の「番」とoo番地の「番地」は違うものらしいです。
        番地もとい地番は土地を識別するものらしく、古くはその番号をとって
        住所を「△△1丁目oo番地」としていたのが、

        後の住居表示に関する法律により表示を変えたものが、よく見る△△1丁目〇番-△号だそうです。

        なので、「地番までしか台帳に登録されていない」ではなく、
        住居表示の実施がされていない番地方式(?)の住所が残っているというのが実態ではないかと

    • とりあえず、郵便番号が重宝される理由がわかりました。

    • by Anonymous Coward

      書いてる本人が「大宮区吉敷町1-124-1」みたく書いてたら、正規化して正しくなる方がマシじゃないのかな

      # ところで住所正規化システムって、そんなに種類あるの?

    • by Anonymous Coward

      その正しいやり方がクソだと思うのです。
      だれがやっても同じにならないと。

      仕方ないから半角カナ数字でマッチングになるんですよ。

      • by Anonymous Coward

        - 半角全角の問題

        - 住居表示の問題
        をごっちゃにしちゃいかん。
        後段の地番や街区符号の話は最もな話なのです。

    • by Anonymous Coward

      DBの設計として考えると、ユーザー入力と正規化した表現と両方持って、検索などは正規化した方を使うって流れなので、
      重要なのは一貫性のある正規化ルールなのであって、正しい方法ではない。
      このWeb APIがどっちなのかは知らない。

    • by Anonymous Coward

      以前に地図データベースの実験プロジェクトにいた時に、地図データと各施設の住所データのマッチング用に
      住所の正規化モジュールを(だいぶ雑なのでしたが)作ったことがあります。
      モジュールを作った時点では、検索用(つまり内部データ)ということで、正規化後はかなり
      見てくれの悪い状態だったのですが、地図データ内の住所を正規化しちゃった後で
      画面上に表示することになって「しまった!」となりました。
      その時はあくまで実験プロジェクトなんですみません!って感じでそのままで許してもらったんですが、
      表示用には元データをきっちり残しておくべきだったと反省しました。

      #「正しい書き方」がある場合も、お客様の入力したデータを(表示上だけでも)尊重することも大事ですしね。

      • by Anonymous Coward

        GISですよね?
        赤の他人の住所書く人いるんでそれを尊重なんて有り得ん!でしたが?
        自分やった実験と自治体で使った時は「表記ルールに合わせて修正し、データとして使えるようにする」でしたね。

        DB設計的にはメタデータは0〜nレコードで好きに扱えるんで別に取っとくことは可能だけど、存在自体が「どっちだ?」と作業滞らせるからと。

    • by Anonymous Coward

      > 誤)東京都千代田区永田町1丁目10番1号 … 「永田町一丁目」という地名なので算用数字にしてはならない

      住民票もマイナンバーカードも「永田町1丁目」だべや
      そんな書き方されたら、半角数字と同じく完全一致しないべ

      • ん?
        貴方が「永田町」に住んでいて「永田町1丁目」と住民票に表記されているの?
        それとも、別の市区町村の「〇丁目」の話?

        Wikipediaより [wikipedia.org]

        漢数字またはアラビア数字のいずれが丁目の数字の表記として正式であるかは、市町村により異なる(「#横浜市」の節で後述するように、同一の市町村内でも異なることがある)。地方自治法第260条では、町名・字名の新設や変更は、市町村長の告示により効力を生ずるとされている(かつては都道府県知事の告示により効力を生ずるとされていた)。よって、告示の表記が町名・字名の正式な表記であり、丁目の数字の表記についても、告示の表記により正式な表記が決まる。
        漢数字表記を正式とする市町村では、丁目は町名の一部または小字の名称であるので、丁目の数字は固有名詞の一部であるとされる。そして、固有名詞中の漢数字はアラビア数字に改めないのが原則であるので(「六本木」は「6本木」とは書かない)、この原則を丁目の表記にも厳格に適用して、横書きで地番や住居番号をアラビア数字で書くときも丁目の数字は漢数字で書くという立場もある(「六本木一丁目」を「六本木1丁目」と書かない)。

        「永田町」については漢数字を使用するのが正式。
        証拠: 「東京都千代田区永田町二丁目9番6号」
        https://pbs.twimg.com/media/DuQxfP8UcAAp_jz?format=jpg&name=large [twimg.com]

        元コメは 『「永田町一丁目」という地名なので~』という主張をしており、全ての「〇丁目」に対してそうしろとは言ってない。

        住民票(横書き)でアラビア数字を使うか漢数字を使うかも、市区町村が決めている。

        • by Anonymous Coward

          うん、ルールがクソ!

        • by Anonymous Coward

          自分ちがあるマンションを住居表示するときは、東京都千代田区永田町二丁目9番6-201号と表記して
          建物名は別に欄があればそこに。 市区町村で住民票を取ると二丁目が2丁目になってるなら、2丁目の表記。
          書類に証明書として添付するのであれば、証明書に記載されている通りに書類を書くのが基本。
          10万円の申請書とか、予め印刷されてるなら問題になりませんが、自分で記入するときは大量の申請を審査しな
          いといけない側の中の人の気持ちもちょっと察してあげてね。

      • by Anonymous Coward

        えっ、マイナンバーカードは一丁目10番になってるんだけど・・・
        どっちかが偽物?
        出力する自治体や担当者によって変わるとかあるのかな?

    • by Anonymous Coward

      imi-enrichment-address-2.0.0.src.tgzのREADME.mdをみると、

      霞が関2-1-10を入力すると、

      都道府県: 東京都
      町名 : 霞が関
      丁目 : 2
      番地 : 1
      号 : 10

      と出力されるらしいのですが、これは
      「最後の「号」は地番管理の地域では使用しない」
      に反するのですか?

      • by Anonymous Coward

        > 「最後の「号」は地番管理の地域では使用しない」に反するのですか?

        いいえ。

        住居表示実施地区と未実施地区一覧
        https://www.city.chiyoda.lg.jp/koho/machizukuri/tochi/jukyohyoji/jisshi.html [chiyoda.lg.jp]

        によると、「霞が関一丁目~三丁目」は住居表示実施地区です。
        従って、「東京都千代田区霞が関二丁目1番10号」が正しい表記です。「号」は必要で、「番地」ではなく「番」を使用します。

    • by Anonymous Coward

      > 正規化するなら、勝手に半角にしたりせず、全角に正規化しましょう

      勝手に全角にしてくれるならいいよ。勝手に変換すればいいものを、ユーザーに全角で入力させるから嫌ってるだけ。

      • by Anonymous Coward

        > ユーザーに全角で入力させるから嫌ってるだけ。

        んー?
        ユーザーに全角で入力させるから「何が」嫌いって?
        このスレッドは別に「○○を嫌わないでおくれよ」とか言ってるようではない気がするが。。。

    • by Anonymous Coward

      建物の名前が入る場合の住民票の独特の表記順序には、非常に違和感がある。

    • 地域を表す表記、例に挙げただけですでに2つある。
      用途に合わない「正しい表記」は他にも山ほどあるだろう。
      大事なのはデータベースの中で一貫しているかどうかだ。

      市区町村名ひとつとっても総務省と国交省でゆらぎがあるのに
      それを経産省が正規化したらどうなるのかは知らないが、
      「正規化」は「正規化」であって正しいも間違いも無い。

      • by Anonymous Coward

        データベースでっていうより、要は正規化の方法が一貫しているかどうかでしょ。正規化ってそういうもんだよ。

        親コメの例で考えると、「永田町1丁目」でデータを持っておいて、マイナンバーカードから得た「永田町一丁目」っていう文字列を正規化した時に「永田町1丁目」になれば何の問題もない。strcmpが通りさえすればいいんだから。データベース内で一貫したデータを持ってても、正規化方法を忘れちゃったら何にもならない。

        「永田町1丁目」と「永田町一丁目」や「永田町1丁目」が地理的に違う場所だった時のみ、この正規化が許されない。そうじゃないんだったら、数字を全角に揃えろって意見の方がおかしい。

    • by Anonymous Coward

      全角数字はどんな理由があっても許されてはならない
      駆逐すべきだ
      根絶すべきだ
      擁護する奴も皆殺しにすべきだ
      皆殺しを批判する者まで殺し尽くしてしまってもいい

    • by Anonymous Coward

      このツールは住所の比較に使うためのものであって、DB保存用の文字列を生成したり、宛名ラベルを印刷するためのものではないと思います。AとBの住所を比較するときにAもBも正規化したうえで比較するわけです。

    • by Anonymous Coward

      設計ミスを運用でカバーしろというのが無理。

    • by Anonymous Coward

      > 「永田町一丁目」という地名なので算用数字にしてはならない

      これですが、「漢数字が正式でも算用数字にしてもいいよ」という自治省の古い通達があって、今も生きてます。
      公務員でも「漢数字が正式だからそれしか使ってはいけない」と間違えて覚えている人がいるので、要注意です。

      以下、『東京都住民基本台帳事務質疑応答集』から引用

      住民登録法のもとでの先例である「住居表示に関する法律の施行に伴う住民登録の取扱い」(昭和37年5月29日民事甲第1448号通達)による住民票上の横書の場合の記載例は,アラビア数字となっている。これは,横書の場合は,そうした表記が慣習であり,能率的であることから取られた措置であると考えられる。したがって,固有名詞という概念からすれば,漢数字による表記をすることが適当と考えるが,便宜上アラビア数字による表記をしても差し支えない(昭和38年7月9日民事甲第1947号回答)。

あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー

処理中...