パスワードを忘れた? アカウント作成
13697393 journal
日記

route127の日記: 「牛」を「ご」と読む地名 11

日記 by route127

セブンイレブンでおにぎり品定めしてたら「牛ごぼう」というのがあって、なぜ牛蒡と煮た肉はおいしいのか考えそうになったが、それよりも全部漢字で書いたら「牛牛蒡」だなと思うとなんか御御御付みたいでくどくどしくておかしかった。

牛蒡以外に「牛」を「ご」と読むのは牛頭馬頭位しか思いつかなかったけど他にもあるかなと思い調べてみた。
漢字と読みがセットになったデータというと郵便番号簿があるなと思い「牛」を含む地名から「うし」「ぎゅう」を読みに含むレコードを除外して

青森県上北郡東北町数牛(アオモリケンカミキタグントウホクマチカソシ
宮城県大崎市田尻北小牛田(ミヤギケンオオサキシタジリキタコゴタ
宮城県遠田郡美里町南小牛田(ミヤギケントオダグンミサトマチミナミコゴタ
山形県尾花沢市牛房野(ヤマガタケンオバナザワシゴボウノ
福島県南相馬市原町区牛来(フクシマケンミナミソウマシハラマチクゴライ
山梨県南アルプス市野牛島(ヤマナシケンミナミアルプスシヤゴシマ
京都府京都市下京区佐女牛井町(キョウトフキョウトシシモギョウクサメガイチョウ
京都府舞鶴市室牛(キョウトフマイヅルシムロジ

のような8件の結果を得た。
数牛や室牛は「うし」の頭音が脱落したのだとしても「牛」をガ行の音で発音する地名は少なくとも日本国内に6箇所は存在するようである。

話は変わるが、上記の操作をする中で自分の操作が「『牛』を『ご』と読む地名を探す」のではなく「『牛』を『うし』『ぎゅう』と読まない地名を探す」という風にしていた事に違和感があった。
実際に考えなしに前者の操作をすれば偽陽性のデータ(牛込とか)が混入してくるので結果として得られるデータの品質としては後者の方が良くはあるのだが。

今回はこの方法が偶々上手くいったが他の漢字では必ずしもそうとは限らない。
例えば「疾風の『て』」のような「風」を「て」と読む例を探そうとした時は除去する読みは「かぜ」と「ふう」だけではなく連体形の「かざ」や風呂の「ふ」なども考慮する必要がある。
また「ふ」は濁って「屏風」の「ぶ」にもなるし、「東風」「南風」といった熟字訓まで考えるときりがない。
結局最低限の辞書形を除去した後に手選別することになり、網羅的な調査の妨げになる。

バイオインフォマティクスだと共通部分を括り出して整列させるアライメント作業がツール化されていたりするようなのだが、文学方面ではこういったツールが整備されていたりはしないのだろうか。
漢字と読みのデータ集合から共通した漢字と推定される読みのセットを抽出して、特異な読みが発現している箇所の表示が容易に出来たら面白いのだが。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

「毎々お世話になっております。仕様書を頂きたく。」「拝承」 -- ある会社の日常

読み込み中...