パスワードを忘れた? アカウント作成
14008486 journal
人工知能

yasuokaの日記: UD-KanbunとUniDic2UDをCygwinで使うためのmecab-cygwin64

日記 by yasuoka

古典中国語(漢文)向け係り受け解析エンジンUD-Kanbunを、Cygwinで使えるようにできないか、との御相談を受けたので、私(安岡孝一)なりに何とか戦ってみた。何とかなるにはなったのだが、64ビット版Cygwinでpython37-pippython37-develが必要なだけでなく、gcc-g++gitswigもCygwin64に入れておく必要がある、という物凄い事態になってしまった。インストールもちょっと手間で

$ cd /tmp
$ git clone https://github.com/KoichiYasuoka/mecab-cygwin64.git
$ cd mecab-cygwin64
$ sh -x ./install.sh /usr/local
$ pip3.7 install udkanbun

という手順が必要だったりする。ただ、この結果mecabもインストールされてしまうので

$ echo 望遠鏡で泳ぐ彼女を見た | mecab
望遠鏡  名詞,一般,*,*,*,*,望遠鏡,ボウエンキョウ,ボーエンキョー
で      助詞,格助詞,一般,*,*,*,で,デ,デ
泳ぐ    動詞,自立,*,*,五段・ガ行,基本形,泳ぐ,オヨグ,オヨグ
彼女    名詞,代名詞,一般,*,*,*,彼女,カノジョ,カノジョ
を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
見      動詞,自立,*,*,一段,連用形,見る,ミ,ミ
た      助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS

がCygwin64で動いてしまう。もちろんudkanbunもインストールされるので

$ echo 不入虎穴不得虎子 | udkanbun
# text = 不入虎穴不得虎子
1       不      不      ADV     v,副詞,否定,無界        Polarity=Neg    2      advmod   _       Gloss=not|SpaceAfter=No
2       入      入      VERB    v,動詞,行為,移動        _       0       root   _Gloss=enter|SpaceAfter=No
3       虎      虎      NOUN    n,名詞,主体,動物        _       4       nmod   _Gloss=tiger|SpaceAfter=No
4       穴      穴      NOUN    n,名詞,固定物,地形      Case=Loc        2      obj      _       Gloss=cave|SpaceAfter=No
5       不      不      ADV     v,副詞,否定,無界        Polarity=Neg    6      advmod   _       Gloss=not|SpaceAfter=No
6       得      得      VERB    v,動詞,行為,得失        _       2       parataxis       _       Gloss=get|SpaceAfter=No
7       虎      虎      NOUN    n,名詞,主体,動物        _       8       nmod   _Gloss=tiger|SpaceAfter=No
8       子      子      NOUN    n,名詞,人,関係  _       6       obj     _      Gloss=child|SpaceAfter=No

がCygwin64で動作するはずである。ちなみに、ここまでが動いたら、日本語向け係り受け解析エンジンUniDic2UD

$ pip3.7 install unidic2ud

でCygwin64にインストールできるはずなので、ぜひ試してみてほしい。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

Stay hungry, Stay foolish. -- Steven Paul Jobs

読み込み中...