yasuokaの日記: 現代日本語・近代文語・旧字旧仮名係り受け解析ツールUniDic-COMBOをPyPIからリリース
私(安岡孝一)の12月28日の日記で仮リリースしたUniDic-COMBOを、頑張ってPyPIからリリースした。Linux系マシンなら
$ pip3 install unidic_combo
一発でインストールできる。一方、Cygwin (64bit)に関しては、python37-devel python37-pip python37-cython python37-numpy python37-cffi gcc-g++ mingw64-x86_64-gcc-g++ gcc-fortran git curl make cmake libopenblas liblapack-devel libhdf5-devel libfreetype-devel libuv-develパッケージをCygwinに入れておけば
$ curl https://raw.githubusercontent.com/KoichiYasuoka/UniDic-COMBO/master/cygwin64.sh | sh
の一行でインストール可能である。単語間係り受けに加え、文節間係り受けもサポートしたので、インストールがうまくいったら、ぜひ「望遠鏡で泳ぐ彼女を見た」を係り受け解析してみてほしい。
$ python3
>>> import unidic_combo
>>> nlp=unidic_combo.load()
>>> doc=nlp("望遠鏡で泳ぐ彼女を見た")
>>> import deplacy
>>> deplacy.render(doc,Japanese=True)
望遠鏡 NOUN ═╗<════╗ obl(斜格補語)
で ADP <╝ ║ case(格表示)
泳ぐ VERB <══╗ ║ acl(連体修飾節)
彼女 PRON ═╗═╝<╗ ║ obj(目的語)
を ADP <╝ ║ ║ case(格表示)
見 VERB ═╗═══╝═╝ ROOT(親)
た AUX <╝ aux(動詞補助成分)
>>> from deplacy.deprelja import deprelja
>>> for b in unidic_combo.bunsetu_spans(doc):
... for t in b.lefts:
... print(unidic_combo.bunsetu_span(t),"->",b,"("+deprelja[t.dep_]+")")
...
泳ぐ -> 彼女を (連体修飾節)
望遠鏡で -> 見た (斜格補語)
彼女を -> 見た (目的語)
現代日本語・近代文語・旧字旧仮名係り受け解析ツールUniDic-COMBOをPyPIからリリース More ログイン