パスワードを忘れた? アカウント作成
14340502 journal
人工知能

yasuokaの日記: バスク語係り受け解析モジュールspaCy-ixaKat仮リリース

日記 by yasuoka

一昨日昨日の日記で紹介したixaKatを、Universal Dependencies化してspaCyと繋ぎ、spaCy-ixaKatというPyPIモジュールとして仮リリースした。Javaとpython3-pipcurllibncursesw5が入ったLinuxなら

$ pip3 install spacy_ixakat --user

一発でインストールできる。ただし、インストール時に大量のダウンロードが起こるので、高速なネットワークの下でインストールしてほしい。インストールがうまくいったら、まずは「Euskaldun izatea lan extra bat izatea da.」を係り受け解析してみよう。

$ python3
>>> import spacy_ixakat
>>> nlp=spacy_ixakat.load()
>>> doc=nlp("Euskaldun izatea lan extra bat izatea da.")
>>> import deplacy
>>> deplacy.render(doc)
Euskaldun PROPN <╗           obl
izatea    VERB  ═╝<══════╗   csubj
lan       NOUN  ═╗═╗<╗   ║   obl
extra     NOUN  <╝ ║ ║   ║   nmod
bat       NUM   <══╝ ║   ║   nummod
izatea    VERB  ═════╝<╗ ║   ccomp
da        VERB  ═══════╝═╝═╗ ROOT
.         PUNCT <══════════╝ punct

とりあえず、うまくいっているようだ。ただ、今のところspaCy-ixaKatは、Linuxでしか動作しない。WSLでも大丈夫なのだが、さて、Cygwinどうしよう…。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家

読み込み中...