yasuokaの日記: UniDic2UDによるCaboChaエミュレータをWindowsで動かすには
一昨日の日記で公開したUniDic2UDを、MS Windowsで動かしてみたい、との御要望をいただいた。Windows 10ならば、WSLにDebianかUbuntuを載せるところだが、Windows 8では動かない。公式のPythonモジュールだと、コンパイラとかを別だてでインストールしなきゃいけないので、どこかでしくじる可能性が高い。となるとCygwinかな、というのが私(安岡孝一)なりの答で、まあ、Cygwinなら64bit版でも32bit版でも大丈夫なので、以下では64bit版でインストール手順を説明する。
まずは、Cygwin 64bit版のインストール。公式サイトから「setup-x86_64.exe」をダウンロードして実行する。あとは基本的に「次へ」で進めていけばいいが、「Choose A Download Site」の画面にきたら、どこか日本(jp)のhttpサイトを選ぶ必要がある。次の「Select Packages」の画面では、Viewのところを「Full」にして、gcc-g++とgitとpython37-pipとpython37-develとpython37-cythonとswigは追加インストール(「Skip」の代わりに最新のバージョン番号を選ぶ)する必要がある。よく似た名前のパッケージがあるので、注意が必要だ。その後は、また「次へ」を順に押していくと、最後に「完了」ボタンを押して、CygwinのインストールはOKだ。
ここまでがうまく行けば、デスクトップに「Cygwin64 Terminal」が出来ているので、それを起動して、ターミナルコンソール上で、以下のコマンドを順に実行する。なお、ターミナルコンソールへのコピペは、Ctrl-VではなくShift-Insなので注意されたい。
$ pip3.7 install git+https://github.com/KoichiYasuoka/mecab-cygwin64
$ pip3.7 install 'unidic2ud>=1.3.6'
$ udcabocha --download=japanese-gsd
フォントの設定とかが気持ち悪い場合が多いので、待っている間に、右クリックで「Options...」を開いて「Text」のあたりを直しておいた方がいいだろう。これで、UniDic2UDのインストール完了である。試しに「太郎はこの本を二郎を見た女性に渡した。」を係り受け解析してみよう。解析用のコマンドはudcabochaだ。
$ echo 太郎はこの本を二郎を見た女性に渡した。 | udcabocha -f 0
太郎は-----------D
この-D |
本を---D |
二郎を-D |
見た-D |
女性に-D
渡した。
EOS
-fオプションの数字は、0がtree、1がlattice、2がtree+lattice、3がXML、4がUniversal Dependenciesである。なお、udcabochaは、入力ファイルはパラメータに書けるが、出力ファイルのオプションは今のところ無いので、ファイルの入出力は以下のようにしてほしい。
$ udcabocha -f 0 input.txt > output.txt
ちなみに、Cygwin 64bit版だと、本物のCaboCha 0.69 (UTF-8版)も、以下の手順でインストールできる。
$ pip3.7 install git+https://github.com/KoichiYasuoka/cabocha-cygwin64
$ pip3.7 install 'git+https://github.com/taku910/cabocha#subdirectory=python'
両方入れてみて、cabochaとudcabochaで結果を比べる(特に-f 4オプション)、というのも案外オツかもしれない。
UniDic2UDによるCaboChaエミュレータをWindowsで動かすには More ログイン