江戸時代の版本のくずし字を解読するアプリが開発される 35
ストーリー by nagazou
データセット変えれば筆記体とか行けそう 部門より
データセット変えれば筆記体とか行けそう 部門より
バンコク出身のカラーヌワット・タリンさんが、江戸初期の古い屏風などに使用されているくずし字を楷書に変換するアプリを開発したという。同市は源氏物語の研究をしている最中、くずし字が簡単に読めると便利だなと思ったとのことで、人工知能(AI)と画像認識技術を用いて開発を行ったという(読売新聞、ROIS-DS人文学オープンデータ共同利用センター)。
アプリの名称は「みを(miwo)」で、屏風などに描かれているくずし字をタブレットで撮影。2秒ほどの時間で解析が行われ元の画像の上に緑色で現代の楷書表記される仕組みとなっている。原本の状態が良ければ90%以上の精度で認識できるそうだ。人文学オープンデータ共同利用センタの記事によると、みを(miwo)は国文学研究資料館が作成した「くずし字データセット」を学習していることから、江戸時代の版本のくずし字認識が得意だとのこと。現在Android版とiOS版を同時に開発しているとのこと。アプリストアで無料公開する予定だとしている。
アプリの名称は「みを(miwo)」で、屏風などに描かれているくずし字をタブレットで撮影。2秒ほどの時間で解析が行われ元の画像の上に緑色で現代の楷書表記される仕組みとなっている。原本の状態が良ければ90%以上の精度で認識できるそうだ。人文学オープンデータ共同利用センタの記事によると、みを(miwo)は国文学研究資料館が作成した「くずし字データセット」を学習していることから、江戸時代の版本のくずし字認識が得意だとのこと。現在Android版とiOS版を同時に開発しているとのこと。アプリストアで無料公開する予定だとしている。
外国人が開発したのが新しいのか (スコア:2, 参考になる)
くずし字を解読するサービスはすでにあるけど....
AI 手書きくずし字検索
http://www.ai-kuzushiji.net/ [ai-kuzushiji.net]
くずし字OCR(AIくずし字認識)
http://codh.rois.ac.jp/char-shape/OCR/ [rois.ac.jp]
凸版印刷、AIでくずし字を読解 90%以上の精度で認識
https://ledge.ai/toppan-kuzushiji/ [ledge.ai]
Re: (スコア:0)
ニュース性よりも、ちょっとしたコラム記事という感じかな。無料アプリというポイントも利便性など付加価値を推している印象。
Re:外国人が開発したのが新しいのか (スコア:1)
でも、#4071155 が日本のサービスを紹介しなければ「外人に先越されて日本死亡www」的なコメント書くつもりだったろ?
便利そう (スコア:1)
1日もすると何を書いたか読んでも理解出来ない自分の手帳も解読出来るかなあ…
Re: (スコア:0)
まず最初に凡例を作ってAIに教え込めるデータを作れば、ね。
Re: (スコア:0)
教え込む際に自分も読めないのですが…
Re: (スコア:0)
さすがに書いた直後なら読めるでしょ。
Re:便利そう (スコア:1)
手が思考に追いつかない、もしくは思考が空回りするせいで、1文字目を2文字目が合体するような字を書いてしまうことがちょいちょいあります
まあ「書いた直後なら訂正できる」のですが、書かれた文字自体は「書いた直後から読めない」です
ただのへりくつです、ごめんなさい…
#うそではないんですけどね。神奈川と書こうとしてネ奈リみたいな字ができあがりかけたりして修正しなきゃいけなくなる
Re: (スコア:0)
学習させられるだけの字を書いたら字がうまくなって自分でも読めるようになる気がする。
Re: (スコア:0)
字がうまくならなくても、自分の字を自分で学習して読めるようになる気もする。
Re: (スコア:0)
そういう文字を書いた直後なら眠りの中ですねw
Re: (スコア:0)
昔は、偉い人が書いた原稿を清書する人がいたようですね。
「達筆で読めない」から解読専門の人がいたとか。
今なら機会に学習させれば、そのまま原稿になりそうだなと思ったけど、タイプしない人は少なくなっただろうなぁ。
くずし字講座 (スコア:1)
古文書なんかを多く所蔵してる大学とかが、外部の人も受けられる読み方講座をやっていて、半年ほどの受講でそこそこ読めるように成るらしい。ちょっとした趣味としても面白いのでお勧め。
と聞いたんだけど、あれって地域性って無いのかな。江戸時代に全国で均一に統一化されたくずし方が普及してたんだろうか? という疑問が。
Re:くずし字講座 (スコア:2)
国文学研究資料館と極地研究所が共同でやってるこんなのですね
オーロラ4Dプロジェクトがくずし字の教育コンテンツ「くずし字、いろいろ」を開発! [nipr.ac.jp]
Re:くずし字講座 (スコア:2)
#4071235は書く(変換する)ほうなので、こっちのリンクが良いかな
https://current.ndl.go.jp/node/35923 [ndl.go.jp]
Re: (スコア:0)
リンク先のリンク先 kuzusu.jp ドメイン乗っ取られてません?
#試そうと思ったら謎の勧誘が..
Re:くずし字講座 (スコア:2)
乗っ取られたというか、移転したあとに無関係な第三者がドメイン取得したんでしょうね…。
開設から3年しか経ってないけど。
いまのリンク先はこちら。
・くずし字
https://lab.nijl.ac.jp/kuzusu/ [nijl.ac.jp]
・オーロラ4dプロジェクト
https://lab.nijl.ac.jp/aurora4d/ [nijl.ac.jp]
Re: (スコア:0)
>江戸時代に全国で均一に統一化されたくずし方が普及してた
その辞書を見ればわかるけど、くずし字は同じ字(ひらがな、漢字)に五種類から十種類ぐらいの字があるよ。
くずす前の元の字だって何種類かあるものがあるしね。
まあ、人によって地方によって時代によって状況によって気分によっていろいろなくずし字を使ってたんじゃない。
Re: (スコア:0)
くずし字のデータセットをちら見したけど、ひらがなの同じ字ですら大量の(しかも全く異なるレベルの)バリエーションがあるから、地域や年代で大きく異なってて然るべきだと思う。
逆に、大学の読み方講座ではどうやってその差分を補完しているのか、その教え方に興味が湧いた。ありがとう。
Re: (スコア:0)
大学で国文学やってた者です。
前後から推測します。。
すごいねぇ (スコア:0)
画像認識って難しそうだし、ディープラーニングとPythonをじっくり学ばないとできないというイメージだけど…
最近はローコード的に組んでアプリ配信までできるかな?(原版と正解のデータセットがあれば)
Re:すごいねぇ (スコア:1)
Excelに近似曲線を描かせるのと似たようなものなので
プログラムを書かなくても試してみることはできます
MicrosoftのLobeはよくできてる
https://ledge.ai/lobe-try/ [ledge.ai]
これらとは目的が違うのかな (スコア:0)
https://pc.watch.impress.co.jp/docs/news/1195499.html [impress.co.jp]
http://codh.rois.ac.jp/char-shape/OCR/ [rois.ac.jp]
どうせなら古語の現代語訳もやったらより便利かな
Re:これらとは目的が違うのかな (スコア:2)
同一人物のように見えますが。
Re:これらとは目的が違うのかな (スコア:1)
こういうこと書く人の目には何が見えてるのだろう
Re:これらとは目的が違うのかな (スコア:1)
かまって貰えるからそれが目的で書いてるだけかも?
そうしてるうちに自己暗示にかかってしまいガチモンになってしまうケースもあるけど。
Re: (スコア:0)
凄くありそう…
まじめに考えて書いても無視され
口汚くののしれば相手してもらえる
そんな幼児体験があるのかもしれないな…
Re: (スコア:0)
「ネトウヨ嫌い」とか「バカ右翼」とか平気でのたまう人にろくな人間がいるわけない。
Re: (スコア:0)
パヨクはきれいな言葉
Re: (スコア:0)
まあ外国の反政府抗議手法を自国で取り入れて暴れ出すやり方は、自称知性主義者とパヨクの専門分野ですからね。どうりで気が会うわけだ。
そもそも (スコア:0)
当時の人達もくずし字読めてたんだろうか……なんか信じられないな。
Re:そもそも (スコア:1)
エンゲルスは本当にマルクスの草稿を読めていたのだろうか
Re: (スコア:0)
今やラテン文字筆記体も、同じように思われているらしい。