
yasuokaの日記: SoMiyagawa/ainu-2-japaneseによるアイヌ語→日本語自動翻訳
SoMiyagawa/ainu-2-japaneseというアイヌ語→日本語自動翻訳モデルが無事にリリースされたので、transformersをアップデートしつつ試しに使ってみた。
$ pip3 install -U transformers --user
$ python3
>>> from transformers import AutoTokenizer,AutoModelForSeq2SeqLM,TranslationPipeline
>>> tkz=AutoTokenizer.from_pretrained("SoMiyagawa/ainu-2-japanese")
>>> mdl=AutoModelForSeq2SeqLM.from_pretrained("SoMiyagawa/ainu-2-japanese")
>>> pipeline=TranslationPipeline(model=mdl,tokenizer=tkz)
>>> print(pipeline("itak=as awa pon rupne aynu ene itaki"))
[{'translation_text': 'このように言いました。'}]
「itak=as awa pon rupne aynu ene itaki」を試してみたのだが、どうも前半しか訳せてない気がする。後半だけにしてみよう。
>>> print(pipeline("pon rupne aynu ene itak"))
[{'translation_text': '小さい年寄りたちは人間がこのように言いました。'}]
この文における「rupne」は自動詞(連体修飾語)にしたいところなのだが、まあ、それでもそこそこ訳せているようだ。すごいなぁ、どうやって作ってるんだろ。
SoMiyagawa/ainu-2-japaneseによるアイヌ語→日本語自動翻訳 More ログイン