yasuokaの日記: タイ語係り受け解析モジュールspaCy-Thai仮リリース
pythainlpとUDPipeとspaCyを組み合わせて、タイ語の係り受け解析モジュールspaCy-Thaiを作ってみた。インストールは
$ pip3 install spacy_thai --user
一発でOKのはずだが、インストールにはg++が必要だ。また、Cygwinの場合は
$ pip3.7 install spacy_thai --no-build-isolation
としてほしい。インストールがうまくいったら、昨日の日記で示した「แผนกนี้กำลังเผชิญกับความท้าทายใหม่」を係り受け解析してみよう。
$ python3
>>> import spacy_thai
>>> nlp=spacy_thai.load()
>>> doc=nlp("แผนกนี้กำลังเผชิญกับความท้าทายใหม่")
>>> import deplacy
>>> deplacy.render(doc)
แผนก NOUN ═╗<══════╗ nsubj
นี้ DET <╝ ║ det
กำลัง AUX <══════╗ ║ aux
เผชิญ VERB ═══╗═╗═╝═╝ ROOT
กับ ADP <╗ ║ ║ case
ความ PART ═╝<╝ ║ obl
ท้าทาย VERB ═╗<══╝ xcomp
ใหม่ ADV <╝ advmod
私(安岡孝一)の手元では上の結果になったのだが、うーむ、まだまだ解析が甘い。何とか「ความ」=acl⇒「ท้าทาย」になるよう、頑張ってチューニングしなきゃダメかな。
タイ語係り受け解析モジュールspaCy-Thai仮リリース More ログイン