yasuokaの日記: UD-KanbunとUniDic2UDをCygwinで使うためのmecab-cygwin64
古典中国語(漢文)向け係り受け解析エンジンUD-Kanbunを、Cygwinで使えるようにできないか、との御相談を受けたので、私(安岡孝一)なりに何とか戦ってみた。何とかなるにはなったのだが、64ビット版Cygwinでpython37-pipとpython37-develが必要なだけでなく、gcc-g++もgitもswigもCygwin64に入れておく必要がある、という物凄い事態になってしまった。インストールもちょっと手間で
$ cd /tmp
$ git clone https://github.com/KoichiYasuoka/mecab-cygwin64.git
$ cd mecab-cygwin64
$ sh -x ./install.sh /usr/local
$ pip3.7 install udkanbun
という手順が必要だったりする。ただ、この結果mecabもインストールされてしまうので
$ echo 望遠鏡で泳ぐ彼女を見た | mecab
望遠鏡 名詞,一般,*,*,*,*,望遠鏡,ボウエンキョウ,ボーエンキョー
で 助詞,格助詞,一般,*,*,*,で,デ,デ
泳ぐ 動詞,自立,*,*,五段・ガ行,基本形,泳ぐ,オヨグ,オヨグ
彼女 名詞,代名詞,一般,*,*,*,彼女,カノジョ,カノジョ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
見 動詞,自立,*,*,一段,連用形,見る,ミ,ミ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS
がCygwin64で動いてしまう。もちろんudkanbunもインストールされるので
$ echo 不入虎穴不得虎子 | udkanbun
# text = 不入虎穴不得虎子
1 不 不 ADV v,副詞,否定,無界 Polarity=Neg 2 advmod _ Gloss=not|SpaceAfter=No
2 入 入 VERB v,動詞,行為,移動 _ 0 root _Gloss=enter|SpaceAfter=No
3 虎 虎 NOUN n,名詞,主体,動物 _ 4 nmod _Gloss=tiger|SpaceAfter=No
4 穴 穴 NOUN n,名詞,固定物,地形 Case=Loc 2 obj _ Gloss=cave|SpaceAfter=No
5 不 不 ADV v,副詞,否定,無界 Polarity=Neg 6 advmod _ Gloss=not|SpaceAfter=No
6 得 得 VERB v,動詞,行為,得失 _ 2 parataxis _ Gloss=get|SpaceAfter=No
7 虎 虎 NOUN n,名詞,主体,動物 _ 8 nmod _Gloss=tiger|SpaceAfter=No
8 子 子 NOUN n,名詞,人,関係 _ 6 obj _ Gloss=child|SpaceAfter=No
がCygwin64で動作するはずである。ちなみに、ここまでが動いたら、日本語向け係り受け解析エンジンUniDic2UDも
$ pip3.7 install unidic2ud
でCygwin64にインストールできるはずなので、ぜひ試してみてほしい。
UD-KanbunとUniDic2UDをCygwinで使うためのmecab-cygwin64 More ログイン