パスワードを忘れた? アカウント作成
14404514 journal
Google

yasuokaの日記: coptic-nlpのコプト語係り受け解析をGoogle Colaboratoryで動かす

日記 by yasuoka

思うところあって、コプト語係り受け解析器coptic-nlpを、Google Colaboratoryで動かしてみた。

!apt install foma-bin
!test -d coptic-nlp || git clone --depth=1 https://github.com/CopticScriptorium/coptic-nlp
!test -f coptic-nlp/bin/foma/foma || ln -s /usr/bin/foma /usr/bin/flookup coptic-nlp/bin/foma
!echo Y | python coptic-nlp/coptic_nlp.py -penmult -
!echo ⲙⲟⲟϣⲉ ϩⲱⲥ ϣⲏⲣⲉ ⲙ̄ⲡⲟⲩⲟⲉⲓⲛ > tmpin.txt
!python coptic-nlp/coptic_nlp.py -penmult tmpin.txt

「ⲙⲟⲟϣⲉ ϩⲱⲥ ϣⲏⲣⲉ ⲙ̄ⲡⲟⲩⲟⲉⲓⲛ」という例文を係り受け解析してみたところ、私(安岡孝一)の手元では、以下のようになった。

<norm_group orig_group="ⲙⲟⲟϣⲉ" norm_group="ⲙⲟⲟϣⲉ">
<norm xml:id="u1" pos="V" lemma="ⲙⲟⲟϣⲉ" func="root" orig="ⲙⲟⲟϣⲉ" norm="ⲙⲟⲟϣⲉ">
ⲙⲟⲟϣⲉ
</norm>
</norm_group>
<norm_group orig_group="ϩⲱⲥ" norm_group="ϩⲱⲥ">
<norm xml:id="u2" pos="CONJ" lemma="ϩⲱⲥ" lang="Greek" func="mark" head="#u3" orig="ϩⲱⲥ" norm="ϩⲱⲥ">
ϩⲱⲥ
</norm>
</norm_group>
<norm_group orig_group="ϣⲏⲣⲉ" norm_group="ϣⲏⲣⲉ">
<norm xml:id="u3" pos="N" lemma="ϣⲏⲣⲉ" func="advcl" head="#u1" orig="ϣⲏⲣⲉ" norm="ϣⲏⲣⲉ">
ϣⲏⲣⲉ
</norm>
</norm_group>
<norm_group orig_group="ⲙ̄ⲡⲟⲩⲟⲉⲓⲛ" norm_group="ⲙⲡⲟⲩⲟⲉⲓⲛ">
<norm xml:id="u4" pos="PREP" lemma="ⲛ" func="case" head="#u6" orig="ⲙ̄" norm="ⲙ">
ⲙ̄
</norm>
<norm xml:id="u5" pos="ART" lemma="ⲡ" func="det" head="#u6" orig="ⲡ" norm="ⲡ">

</norm>
<norm xml:id="u6" pos="N" lemma="ⲟⲩⲟⲉⲓⲛ" func="nmod" head="#u3" orig="ⲟⲩⲟⲉⲓⲛ" norm="ⲟⲩⲟⲉⲓⲛ">
ⲟⲩⲟⲉⲓⲛ
</norm>
</norm_group>

うーむ、なかなかフォーマットが手ごわい。マニュアルによれば「--outmode conllu」というオプションもあるはずなのだが、係り受け解析では動作しないようだ。さて、どうしたらいいかな。

この議論は、yasuoka (21275)によって「 ログインユーザだけ」として作成されている。 ログインしてから来てね。
typodupeerror

計算機科学者とは、壊れていないものを修理する人々のことである

読み込み中...