yasuokaの日記: オランダ語係り受け解析モジュールspaCy-Alpino仮リリース
一昨日・昨日の日記で紹介したAlpinoだが、Universal Dependenciesへの変換をlassy2udに分担させた上でspaCyと繋ぎ、spaCy-Alpinoというpython3モジュールとして仮リリースした。ただ、Alpinoのインストールは非常に時間がかかるので、とりあえずはWebAPIも使えるようにしておいた。この結果、spaCy-Alpinoのインストールは簡単で
$ pip3 install spacy_alpino --user
一発でOKだ。ただ、Cygwinの場合は
$ pip3.7 install spacy_alpino --no-build-isolation
としてほしい。インストールがうまくいったら、昨日と同様「Toch houd ik ze vast, ondanks alles, omdat ik nog steeds aan de innerlijke goedheid van den mens geloof.」を係り受け解析してみよう。
$ python3
>>> import spacy_alpino
>>> nlp=spacy_alpino.load()
>>> doc=nlp("Toch houd ik ze vast, ondanks alles, omdat ik nog steeds aan de innerlijke goedheid van den mens geloof.")
>>> import deplacy
>>> deplacy.render(doc)
Toch ADV <══════════════════════╗ advmod
houd VERB ═╗═╗═╗═══════════════╗═╝═╗═╗═╗═╗ ROOT
ik PRON ║<╝ ║ ║ ║ ║ ║ ║ nsubj
ze PRON ║<══╝ ║ ║ ║ ║ ║ obj
vast ADJ <╝ ║ ║ ║ ║ ║ compound:prt
, PUNCT <════════════════════║═══╝ ║ ║ ║ punct
ondanks ADP <╗ ║ ║ ║ ║ case
alles PRON ═╝<══════════════════║═════╝ ║ ║ obl
, PUNCT <════════════════════║═══════╝ ║ punct
omdat SCONJ <══════════════════╗ ║ ║ mark
ik PRON <════════════════╗ ║ ║ ║ nsubj
nog ADV <╗ ║ ║ ║ ║ advmod
steeds ADV ═╝<════════════╗ ║ ║ ║ ║ advmod
aan ADP <══════════╗ ║ ║ ║ ║ ║ case
de DET <════════╗ ║ ║ ║ ║ ║ ║ det
innerlijke ADJ <══════╗ ║ ║ ║ ║ ║ ║ ║ amod
goedheid NOUN ═════╗═╝═╝═╝<╗ ║ ║ ║ ║ ║ obl
van ADP <══╗ ║ ║ ║ ║ ║ ║ ║ case
den DET <╗ ║ ║ ║ ║ ║ ║ ║ ║ det
mens NOUN ═╝═╝<╝ ║ ║ ║ ║ ║ ║ nmod
geloof VERB ═════════════╝═╝═╝═╝<╝ ║ advcl
. PUNCT <══════════════════════════════╝ punct
とりあえず、うまくいっているようだ。なお、Google Colaboratoryにデモページも作っておいたので、そちらもぜひ試してほしい。
オランダ語係り受け解析モジュールspaCy-Alpino仮リリース More ログイン