パスワードを忘れた? アカウント作成
14255230 journal
Google

yasuokaの日記: spaCy-SynChaをGoogle Colaboratoryで動かすには

日記 by yasuoka

spaCy-SynChaをGoogle Colaboratoryで動かす場合、毎回MeCab・CaboCha・SynChaをインストールする必要がある。

!apt install mecab libmecab-dev mecab-ipadic-utf8 lp-solve
!test -f crfpp.tar.gz || wget -O crfpp.tar.gz 'https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7QVR6VXJ5dWExSTQ'
!test -d CRF++-0.58 || ( tar xzf crfpp.tar.gz && cd CRF++-0.58 && ./configure --prefix=/usr && make install )
!curl -sc cabocha.cookie 'https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7SDd1Q1dUQkZQaUU'
!test -f cabocha.tar.bz2 || curl -Lb cabocha.cookie 'https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7SDd1Q1dUQkZQaUU&confirm='`tr -d '\015' < cabocha.cookie | awk '/_warning_/{print $NF}'` -o cabocha.tar.bz2
!test -d cabocha-0.69 || ( tar xjf cabocha.tar.bz2 && cd cabocha-0.69 && ./configure --prefix=/usr --with-charset=UTF8 && make install )
!test -f syncha.tar.gz || wget -O syncha.tar.gz 'https://drive.google.com/uc?export=download&id=0B4wOZ_esMVcMazQ0eGdtMnBCaWs'
!test -d syncha-0.3.1.1 || ( tar xzf syncha.tar.gz && echo 'exec /content/syncha-0.3.1.1/syncha "$@"' > /usr/bin/syncha && chmod 755 /usr/bin/syncha )
!pip install spacy_syncha

かなり手間なのだが、まあ、これ以上は手を抜けそうにないので、notebookの形にまとめておいた。ついでに『Web茶まめ』に接続するモジュールを組み込んだので、たとえば旧仮名口語UniDicを使って、以下のように係り受け解析できる。

import spacy_syncha
nlp=spacy_syncha.load("qkana")
doc=nlp("其國を治めんと欲する者は先づ其家を齊ふ")
import deplacy
deplacy.render(doc,Japanese=True)
deplacy.serve(doc,port=None)

解析精度も、そこそこ高いようなので、よければ試してみてほしい。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

最初のバージョンは常に打ち捨てられる。

読み込み中...