パスワードを忘れた? アカウント作成
15037498 journal
人工知能

yasuokaの日記: 現代日本語・近代文語・旧字旧仮名係り受け解析ツールUniDic-COMBOをPyPIからリリース

日記 by yasuoka

私(安岡孝一)の12月28日の日記で仮リリースしたUniDic-COMBOを、頑張ってPyPIからリリースした。Linux系マシンなら

$ pip3 install unidic_combo

一発でインストールできる。一方、Cygwin (64bit)に関しては、python37-devel python37-pip python37-cython python37-numpy python37-cffi gcc-g++ mingw64-x86_64-gcc-g++ gcc-fortran git curl make cmake libopenblas liblapack-devel libhdf5-devel libfreetype-devel libuv-develパッケージをCygwinに入れておけば

$ curl https://raw.githubusercontent.com/KoichiYasuoka/UniDic-COMBO/master/cygwin64.sh | sh

の一行でインストール可能である。単語間係り受けに加え、文節間係り受けもサポートしたので、インストールがうまくいったら、ぜひ「望遠鏡で泳ぐ彼女を見た」を係り受け解析してみてほしい。

$ python3
>>> import unidic_combo
>>> nlp=unidic_combo.load()
>>> doc=nlp("望遠鏡で泳ぐ彼女を見た")
>>> import deplacy
>>> deplacy.render(doc,Japanese=True)
望遠鏡 NOUN ═╗<════╗ obl(斜格補語)
で     ADP  <╝     ║ case(格表示)
泳ぐ   VERB <══╗   ║ acl(連体修飾節)
彼女   PRON ═╗═╝<╗ ║ obj(目的語)
を     ADP  <╝   ║ ║ case(格表示)
見     VERB ═╗═══╝═╝ ROOT(親)
た     AUX  <╝       aux(動詞補助成分)
>>> from deplacy.deprelja import deprelja
>>> for b in unidic_combo.bunsetu_spans(doc):
...   for t in b.lefts:
...     print(unidic_combo.bunsetu_span(t),"->",b,"("+deprelja[t.dep_]+")")
...
泳ぐ -> 彼女を (連体修飾節)
望遠鏡で -> 見た (斜格補語)
彼女を -> 見た (目的語)

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー

読み込み中...