yasuokaの日記: バスク語係り受け解析モジュールspaCy-ixaKat仮リリース
一昨日・昨日の日記で紹介したixaKatを、Universal Dependencies化してspaCyと繋ぎ、spaCy-ixaKatというPyPIモジュールとして仮リリースした。Javaとpython3-pipとcurlとlibncursesw5が入ったLinuxなら
$ pip3 install spacy_ixakat --user
一発でインストールできる。ただし、インストール時に大量のダウンロードが起こるので、高速なネットワークの下でインストールしてほしい。インストールがうまくいったら、まずは「Euskaldun izatea lan extra bat izatea da.」を係り受け解析してみよう。
$ python3
>>> import spacy_ixakat
>>> nlp=spacy_ixakat.load()
>>> doc=nlp("Euskaldun izatea lan extra bat izatea da.")
>>> import deplacy
>>> deplacy.render(doc)
Euskaldun PROPN <╗ obl
izatea VERB ═╝<══════╗ csubj
lan NOUN ═╗═╗<╗ ║ obl
extra NOUN <╝ ║ ║ ║ nmod
bat NUM <══╝ ║ ║ nummod
izatea VERB ═════╝<╗ ║ ccomp
da VERB ═══════╝═╝═╗ ROOT
. PUNCT <══════════╝ punct
とりあえず、うまくいっているようだ。ただ、今のところspaCy-ixaKatは、Linuxでしか動作しない。WSLでも大丈夫なのだが、さて、Cygwinどうしよう…。
バスク語係り受け解析モジュールspaCy-ixaKat仮リリース More ログイン