yasuokaの日記: タイ語係り受け解析器としてのlink-grammar
link-grammar 5.10.4がタイ語をサポートした、との連絡をいただいた。とりあえず、Google Colaboratoryで動かしてみよう。
!apt install automake autoconf-archive libtool swig flex
!test -d link-grammar-link-grammar-5.10.4 || curl -L https://github.com/opencog/link-grammar/archive/refs/tags/link-grammar-5.10.4.tar.gz | tar xvzf -
!test -x /usr/bin/link-parser || ( cd link-grammar-link-grammar-5.10.4 && ./autogen.sh && ./configure --prefix=/usr && make install )
!echo หลาย หัว ดี กว่า หัว เดียว | link-parser th -links=1 -postscript=1
「หลายหัวดีกว่าหัวเดียว」を手作業で単語に切った上で、係り受け解析してみたところ、私(安岡孝一)の手元では以下の結果になった。
+---------LWs--------+------->AVw------->+
| +<-AJj<+<-S<+>AVpr>+->PO->+ |
| | | | | | |
LEFT-WALL หลาย.jl หัว.n ดี.va กว่า.pva หัว.n เดียว.r
(v) LEFT-WALL LW ----LWs---- LWs ดี.va
หัว.n dS <---S-----< hS ดี.va
หลาย.jl dAJj <---AJj---< hAJj หัว.n
(v) ดี.va RW ----RW----- RW RIGHT-WALL
(v) ดี.va hAV >---AVw---> dAVw เดียว.r
(v) ดี.va hAV >---AVpr--> dAVpr กว่า.pva
(v) กว่า.pva hPO >---PO----> dPO หัว.n
[(LEFT-WALL)(หลาย.jl)(หัว.n)(ดี.va)(กว่า.pva)(หัว.n)(เดียว.r)]
[[0 3 0 (LWs)][2 3 0 (S)][1 2 0 (AJj)][3 6 1 (AVw)][3 4 1 (AVpr)][4 5 -744076288 (PO)]]
[0]
Bye.
SVGで可視化すると、こんな感じ。「ดี」=AVpr⇒「กว่า」=PO⇒「หัว」は何とかするとしても、「ดี」=AVw⇒「เดียว」は納得できない。うーん、タグも独特だし、さすがに使いにくいかなぁ。
タイ語係り受け解析器としてのlink-grammar More ログイン