パスワードを忘れた? アカウント作成

zokkonさんのトモダチの日記。 アナウンス:スラドとOSDNは受け入れ先を募集中です。

21632233 journal
日記

yasuokaの日記: スラドからQiitaに移動 1

日記 by yasuoka

スラドの日記が思うように書けなくなって久しいので、最近はQiitaに退避中。また戻ってきたいけどなぁ。

20224764 journal
日記

torlyの日記: 本格的になくなってきた繊維 14

日記 by torly

 Oh, 金曜夕方とかいう週で一番一般ユーザのweb閲覧量が多いとされる時期…ってそりゃソーシャルメディアのことだったか。ともかく今日も普通のやり方では駄目だった。更新時間がこれなのは単に他のことで時間を奪われただけなので深い意味はない。

20126081 journal
日記

torlyの日記: テスト(本格的になくなってきた繊維) 1

日記 by torly
https://srad.jp/journal?new=11 ←これが普通の日記フォームurl(最近使用不能)
https://srad.jp/journal ←さくっと表示される(今これで作成中)
https://srad.jp/journal? ←何故かさくっと表示されない、すなわち通常のurlと同じ挙動
19799023 journal
バグ

torlyの日記: 実質的にもうなかった(日記フォームが)繊維 1

日記 by torly
 承前
 今日になって表示オプションが保存可能になったので、シンプルから省帯域+シンプルに変えてなんとかアレした。ログインの方は何故か携帯でも失敗した。何故。
19755608 journal
人工知能

yasuokaの日記: NDL古典籍OCR用RoBERTa-small ver.2は「いと小さく[MASK]ゆるはいとをかし」の[MASK]に何を埋めてくるのか

日記 by yasuoka

2021年12月23日の日記の読者から、NDL古典籍OCR用RoBERTa-small ver.2という単文字日本語モデルをお教えいただいた。以前、私(安岡孝一)が作ったroberta-small-japanese-aozora-charを再トレーニングして、TrOCRのデコーダーに使っているらしい。とりあえず、当該モデルをGoogle Colaboratoryで動かしてみよう。

!pip install transformers
!test -f model-ver2.zip || curl -LO https://lab.ndl.go.jp/dataset/ndlkotensekiocr/trocr/model-ver2.zip
!test -d model-ver2 || unzip model-ver2.zip
from transformers import pipeline
fmp=pipeline("fill-mask","model-ver2/decoder-roberta-v3")
print(fmp("いと小さく[MASK]ゆるはいとをかし"))

「いと小さく[MASK]ゆるはいとをかし」を穴埋めさせてみたところ、私の手元では以下の結果になった。

[{'score': 0.16102387011051178, 'token': 95, 'token_str': 'み', 'sequence': 'いと小さくみゆるはいとをかし'}, {'score': 0.05442138388752937, 'token': 51, 'token_str': 'こ', 'sequence': 'いと小さくこゆるはいとをかし'}, {'score': 0.050991836935281754, 'token': 45, 'token_str': 'き', 'sequence': 'いと小さくきゆるはいとをかし'}, {'score': 0.04673411697149277, 'token': 75, 'token_str': 'に', 'sequence': 'いと小さくにゆるはいとをかし'}, {'score': 0.0423908531665802, 'token': 108, 'token_str': 'れ', 'sequence': 'いと小さくれゆるはいとをかし'}]

漢字の「見」ではなく、ひらがなの「み」を埋めてきているが、それでも素晴らしい。だとすると、たとえば拓本文字データベースと絡めて再トレーニングすれば、さて、何かできるかなぁ。

19288037 journal
spam

torlyの日記: もうないかもしれない繊維 2

日記 by torly
 ここ最近定期的に話題になる怪しい広告だが、今日はとうとう堂々とNHKの名前を使ったものを見た。ガッタガタだし純正のデザインとはちょっと違う気がするがロゴもパクっているようだ。誘導先はもちろんNHKとは全く関連ない.comドメイン。
 文面と画像がいつもの感じだし、初雪が降ろうかという時期に台風の話題を出されても広告リテラシー低い勢すら食い付かないのではと思うが、ロゴまでパチって堂々と嘘の所属を名乗るのは一線越えた感がある。
18800792 journal
日記

torlyの日記: もうないかもしれない繊維

日記 by torly

 昨日の日記は正常に保存できたのだが、今日はGoogle Analyticsの読み込みがなかなか終わらず日記フォームがレンダリングされるまで待たされた。うーん、そのうちスラド日記も携帯から更新の時代か。

18782217 journal
日本

yasuokaの日記: アイヌ語の「イワイサルㇱペ」は「虎」なのか「オオカミ」なのか「六尾獣」なのか

日記 by yasuoka

一昨昨日の日記に関連して、アイヌ語の「イワイサルㇱペ」を調べていたところ、B・ピウスツキ『樺太アイヌの言語と民話についての研究資料<26>病弱な者でも有能な憑き神によって開運する由来話』(創造の世界, 第77号 (1991年2月), pp.138-145)に、以下の文章を見つけた(p.140)。

ネヤイケヘ         そうしたら(ちょうど、そこへ)
アンポニウネ       ぼくの年下の
ホㇱキラムフ       兄さんが
キラアニエㇸマヌ   逃げてやってきた。
オーポニ           (よく見ると)その後を
イワイサルㇱカムイ 六尾をもつ神(という魔性のオオカミ)が
アンホㇱキラムフ   ぼくの兄さんを
ノㇱパ             追いかけていた。
アノㇱキラムフ     ぼくの兄さんを
アネソㇹキ         ぼくは(わきに手早く)よけ(てやり過ごし)た。(夢中に兄さんを追いかける性悪のオオカミにぼくは目をすえて)
アヌッソロマレペ   ぼくが(かねて)内ふところにしのばせていたものを
アヌイナマヌ       ぼくは取り出した。
トイキエムシアニ   (鞘を払い)トイキ(という名)刀で
イワイサルㇱペ     六尾をもつ(というオオカミの)奴を
アンタウケ         ぼくはたたき斬った。
アルパㇵノㇱキケタ (みごと)ちょうど、ど真中を
アントゥイテㇸテ   ぼくは斬(ってしま)った。

「虎」ではなく「オオカミ」らしい。Bronisław Piłsudski『Materials for the Study of the Ainu Language and Folklore』(Cracow: Imperical Academy of Sciences, 1912)の原文にあたってみよう(pp.239-240 [in Nr.27. Dictated (December 1903) by Nita aged 28 of village of Aj.])。

Nejàjḱehé am-ponínue hóśki rámhu kira ani éx manu, opóni ivaj-saruś kamúi an-hóśki rámhu nośpa. Anóśki rámhu anesóxki. An-usòmarepé anújna manu. Tóiki emuś-ani ivaj-saruśpe antáwḱe, arúpax nóśḱe-ḱeta antújtexte.

Meanwhile the younger of my elder brothers came running; following (and) pursuing my brother, (there came) a beast with six tails. I made way for my elder brother. I seized the thing in my bosom: with (my) earthen sword, I struck the six-tailed beast; just in the middle did I cut it in two.

原文は「虎」とも「オオカミ」とも書いていないようだ。日本語訳をおこなった藤村久和は「H・Y媼によれば、この動物はオオカミであって」としているものの、それを裏付ける他の文献が引用されているわけでもない。また、Piłsudski自身は、アイヌ語の「horoḱéu」を「wolf」と訳している(『Materials for the Study of the Ainu Language and Folklore』pp.199-213)。さて、どうしたものかな。

typodupeerror

あと、僕は馬鹿なことをするのは嫌いですよ (わざとやるとき以外は)。-- Larry Wall

読み込み中...