パスワードを忘れた? アカウント作成
14457303 journal
人工知能

yasuokaの日記: タイ語係り受け解析モジュールspaCy-Thai仮リリース

日記 by yasuoka

pythainlpUDPipespaCyを組み合わせて、タイ語の係り受け解析モジュールspaCy-Thaiを作ってみた。インストールは

$ pip3 install spacy_thai --user

一発でOKのはずだが、インストールにはg++が必要だ。また、Cygwinの場合は

$ pip3.7 install spacy_thai --no-build-isolation

としてほしい。インストールがうまくいったら、昨日の日記で示した「แผนกนี้กำลังเผชิญกับความท้าทายใหม่」を係り受け解析してみよう。

$ python3
>>> import spacy_thai
>>> nlp=spacy_thai.load()
>>> doc=nlp("แผนกนี้กำลังเผชิญกับความท้าทายใหม่")
>>> import deplacy
>>> deplacy.render(doc)
แผนก  NOUN ═╗<══════╗ nsubj
นี้     DET  <╝       ║ det
กำลัง  AUX  <══════╗ ║ aux
เผชิญ  VERB ═══╗═╗═╝═╝ ROOT
กับ    ADP  <╗ ║ ║     case
ความ  PART ═╝<╝ ║     obl
ท้าทาย VERB ═╗<══╝     xcomp
ใหม่   ADV  <╝         advmod

私(安岡孝一)の手元では上の結果になったのだが、うーむ、まだまだ解析が甘い。何とか「ความ」=acl⇒「ท้าทาย」になるよう、頑張ってチューニングしなきゃダメかな。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

海軍に入るくらいなら海賊になった方がいい -- Steven Paul Jobs

読み込み中...