パスワードを忘れた? アカウント作成
14262480 journal
Google

yasuokaの日記: ChaPASをGoogle Colaboratoryで動かすには

日記 by yasuoka

7月18日の日記の読者から、ChaPASも試してみてほしい、との御相談をいただいた。とりあえず、「私と彼女が行きます」の解析結果を、Google Colaboratoryで眺めてみることにした。

!apt install mecab libmecab-dev mecab-ipadic-utf8
!test -f crfpp.tar.gz || curl -L 'https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7QVR6VXJ5dWExSTQ' -o crfpp.tar.gz
!test -d CRF++-0.58 || ( tar xzf crfpp.tar.gz && cd CRF++-0.58 && ./configure --prefix=/usr && make install )
!curl -sc cabocha.cookie 'https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7SDd1Q1dUQkZQaUU'
!test -f cabocha.tar.bz2 || curl -Lb cabocha.cookie 'https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7SDd1Q1dUQkZQaUU&confirm='`tr -d '\015' < cabocha.cookie | awk '/_warning_/{print $NF}'` -o cabocha.tar.bz2
!test -d cabocha-0.69 || ( tar xjf cabocha.tar.bz2 && cd cabocha-0.69 && ./configure --prefix=/usr --with-charset=UTF8 && make install )
!curl -sc chapas.cookie 'https://drive.google.com/uc?export=download&id=0BwG_CvJHq43fNDlqSkVSREkzaEk'
!test -f chapas.tar.gz || curl -Lb chapas.cookie 'https://drive.google.com/uc?export=download&id=0BwG_CvJHq43fNDlqSkVSREkzaEk&confirm='`tr -d '\015' < chapas.cookie | awk '/_warning_/{print $NF}'` -o chapas.tar.gz
!test -d chapas-0.742 || ( tar xzf chapas.tar.gz && echo 'exec java -Xmx1g -jar /content/chapas-0.742/chapas.jar "$@"' > /usr/bin/chapas && chmod 755 /usr/bin/chapas )
!echo 私と彼女が行きます | chapas -I RAW

私(安岡孝一)の手元では、以下の結果が得られた。

WARNING: An illegal reflective access operation has occurred
WARNING: Illegal reflective access by org.mapdb.Volume$ByteBufferVol (file:/content/chapas-0.742/chapas.jar) to method java.nio.DirectByteBuffer.cleaner()
WARNING: Please consider reporting this to the maintainers of org.mapdb.Volume$ByteBufferVol
WARNING: Use --illegal-access=warn to enable warnings of further illegal reflective access operations
WARNING: All illegal access operations will be denied in a future release
Aug 08, 2020 12:16:39 PM org.mapdb.Volume$ByteBufferVol unmap
WARNING: ByteBufferVol Unmap failed
java.lang.IllegalAccessException: class org.mapdb.Volume$ByteBufferVol cannot access class jdk.internal.ref.Cleaner (in module java.base) because module java.base does not export jdk.internal.ref to unnamed module @27ddd392
    at java.base/jdk.internal.reflect.Reflection.newIllegalAccessException(Reflection.java:361)
    at java.base/java.lang.reflect.AccessibleObject.checkAccess(AccessibleObject.java:591)
    at java.base/java.lang.reflect.Method.invoke(Method.java:558)
    at org.mapdb.Volume$ByteBufferVol.unmap(Volume.java:401)
    at org.mapdb.Volume$MappedFileVol.close(Volume.java:485)
    at org.mapdb.StoreWAL.replayLogFile(StoreWAL.java:603)
    at org.mapdb.StoreWAL.<init>(StoreWAL.java:60)
    at org.mapdb.DBMaker.extendStoreWAL(DBMaker.java:879)
    at org.mapdb.DBMaker.makeEngine(DBMaker.java:677)
    at org.mapdb.DBMaker.make(DBMaker.java:636)
    at jp.ac.tohoku.ecei.cl.www.chapas.PLSICooccurenceInfoManagerMapDB.<init>(PLSICooccurenceInfoManagerMapDB.java:76)
    at jp.ac.tohoku.ecei.cl.www.chapas.PLSICooccurenceInfoManagerMapDB.getInstance(PLSICooccurenceInfoManagerMapDB.java:148)
    at jp.ac.tohoku.ecei.cl.www.chapas.PLSICooccurenceInfoManagerMapDB.getInstance(PLSICooccurenceInfoManagerMapDB.java:142)
    at jp.ac.tohoku.ecei.cl.www.chapas.ChaPAS.init(ChaPAS.java:144)
    at jp.ac.tohoku.ecei.cl.www.chapas.ChaPAS.<init>(ChaPAS.java:122)
    at jp.ac.tohoku.ecei.cl.www.chapas.ChaPAS.main(ChaPAS.java:1353)

* 0 2D 0/1 -0.531668
私    名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ    O
と    助詞,格助詞,一般,*,*,*,と,ト,ト    O
* 1 2D 0/1 -0.531668
彼女    名詞,代名詞,一般,*,*,*,彼女,カノジョ,カノジョ    O    ID="1"
が    助詞,格助詞,一般,*,*,*,が,ガ,ガ    O
* 2 -1D 0/1 0.000000
行き    動詞,自立,*,*,五段・カ行促音便,連用形,行く,イキ,イキ    O    type="pred" ga="1"
ます    助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス    O
EOS

一応「彼女」と「行く」の間に、ガ格の述語項構造が解析されている。ただ、javaのバージョンが合ってないのか、解析時にIllegalAccessExceptionが起こっていて、ちょっとマズイ気がする。うーん、やっぱりSynChaの方がいいかなぁ。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

弘法筆を選ばず、アレゲはキーボードを選ぶ -- アレゲ研究家

読み込み中...