yasuokaの日記: GLA (Gaelic Linguistic Analyser)でスコットランド・ゲール語の係り受け解析
ネットサーフィンしていたところ、GLA (Gaelic Linguistic Analyser)というツールを見つけた。ざっと読んでみたところ、curl一発でスコットランド・ゲール語の品詞付与や係り受け解析がおこなえるらしい。とりあえず、「Innsidh na geòidh as t-fhoghar e.」という文を、係り受け解析してみよう。
$ curl https://klc.vdu.lt/sgtoolkit/parser -d 'Innsidh na geòidh as t-fhoghar e.'
# newpar id = 1
# sent_id = 1
# text = Innsidh na geòidh as t- fhoghar e .
1 Innsidh innis VERB V-f Tense=Fut|VerbForm=Fin 0 root _ _
2 na na DET Tdpm Definite=Def|PronType=Art 3 det _ _
3 geòidh gèadh NOUN Ncpmn Case=Nom|Gender=Masc|Number=Plur 1 nsubj _ _
4 as as ADP Spa-s _ 6 case _ _
5 t- t- PART Uo _ 6 case _ _
6 fhoghar fhoghar NOUN Ncsmd Case=Dat|Gender=Masc|Number=Sing 3 obl _ _
7 e e PRON Pp3sm Gender=Masc|Number=Sing|Person=3|PronType=Prs 1 obj _ _
8 . . PUNCT Fe _ 1 punct _ _
SVGで可視化すると、こんな感じ。「geòidh」=obl⇒「fhoghar」については、私(安岡孝一)自身は納得がいかない(「Innsidh」=obl⇒「fhoghar」にすべきだと思う)が、それを除けば非常に良い。スコットランド・ゲール語の解析は、StanzaもUDPipeもイマイチ精度が上がらないので、GLAを使っていくべきかな。
GLA (Gaelic Linguistic Analyser)でスコットランド・ゲール語の係り受け解析 More ログイン