yasuokaの日記: COMBO-pytorchのアイスランド語係り受け解析をGoogle Colaboratoryで動かす
COMBO-pytorchに言語モデルが大量追加されたので、ざっと見てみることにした。残念ながら日本語モデルは追加されていないものの、何とアイスランド語モデルが追加されている。とりあえず、Google Colaboratoryで動かしてみよう。
!pip install --index-url https://pypi.clarin-pl.eu/simple combo deplacy
import combo.predict
nlp=combo.predict.COMBO.from_pretrained("icelandic-ud27")
doc=nlp("Hugsjónina sakar ekkert þótt einstaklíngarnir deyi eða svíki.")
import deplacy
deplacy.render(doc)
deplacy.serve(doc,port=None)
「Hugsjónina sakar ekkert þótt einstaklíngarnir deyi eða svíki.」を係り受け解析してみたところ、私(安岡孝一)の手元では以下の結果になった。
Hugsjónina NOUN <════════════╗ nsubj
sakar VERB ═╗═════════╗═╝ root
ekkert DET <╝ ║ obj
þótt ADP <════════╗ ║ case
einstaklíngarnir NOUN <══════╗ ║ ║ nsubj
deyi VERB ═════╗═╝═╝<╝ obl
eða CCONJ <╗ ║ cc
svíki VERB ═╝═╗<╝ conj
. PUNCT <══╝ punct
1 Hugsjónina hugsjón NOUN NS-A Case=Nom|Definite=Def|Gender=Fem|Number=Plur 2 nsubj _ _
2 sakar saka VERB VBPI Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act 0 root _ _
3 ekkert enginn DET Q-A Case=Acc|Gender=Neut|Number=Sing|PronType=Ind 2 obj _ _
4 þótt þótt ADP P _ 6 case _ _
5 einstaklíngarnir einstaklíngir NOUN NS-N Case=Nom|Definite=Def|Gender=Masc|Number=Plur 6 nsubj _ _
6 deyi deyja VERB VBPS Mood=Sub|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act 2 obl _ _
7 eða eða CCONJ CONJ _ 8 cc _ _
8 svíki svíkja VERB VBPS Mood=Sub|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act 6 conj _ _
9 . . PUNCT . _ 8 punct _ _
SVGで可視化すると、こんな感じ。「sakar」=obl⇒「deyi」は、どう考えてもoblじゃなくて、advclの方が適切だが、それ以外はほぼ読めているようだ。ただ、相変わらずインストールに時間がかかり過ぎるのと、まだ精度が不十分なようなので、使う際には注意されたい。
COMBO-pytorchのアイスランド語係り受け解析をGoogle Colaboratoryで動かす More ログイン