パスワードを忘れた? アカウント作成
14042974 journal
マイクロソフト

yasuokaの日記: UniDic2UDによるCaboChaエミュレータをWindowsで動かすには

日記 by yasuoka

一昨日の日記で公開したUniDic2UDを、MS Windowsで動かしてみたい、との御要望をいただいた。Windows 10ならば、WSLにDebianかUbuntuを載せるところだが、Windows 8では動かない。公式のPythonモジュールだと、コンパイラとかを別だてでインストールしなきゃいけないので、どこかでしくじる可能性が高い。となるとCygwinかな、というのが私(安岡孝一)なりの答で、まあ、Cygwinなら64bit版でも32bit版でも大丈夫なので、以下では64bit版でインストール手順を説明する。

まずは、Cygwin 64bit版のインストール。公式サイトから「setup-x86_64.exe」をダウンロードして実行する。あとは基本的に「次へ」で進めていけばいいが、「Choose A Download Site」の画面にきたら、どこか日本(jp)のhttpサイトを選ぶ必要がある。次の「Select Packages」の画面では、Viewのところを「Full」にして、gcc-g++gitpython37-pippython37-develpython37-cythonswigは追加インストール(「Skip」の代わりに最新のバージョン番号を選ぶ)する必要がある。よく似た名前のパッケージがあるので、注意が必要だ。その後は、また「次へ」を順に押していくと、最後に「完了」ボタンを押して、CygwinのインストールはOKだ。

ここまでがうまく行けば、デスクトップに「Cygwin64 Terminal」が出来ているので、それを起動して、ターミナルコンソール上で、以下のコマンドを順に実行する。なお、ターミナルコンソールへのコピペは、Ctrl-VではなくShift-Insなので注意されたい。

$ pip3.7 install git+https://github.com/KoichiYasuoka/mecab-cygwin64
$ pip3.7 install 'unidic2ud>=1.3.6'
$ udcabocha --download=japanese-gsd

フォントの設定とかが気持ち悪い場合が多いので、待っている間に、右クリックで「Options...」を開いて「Text」のあたりを直しておいた方がいいだろう。これで、UniDic2UDのインストール完了である。試しに「太郎はこの本を二郎を見た女性に渡した。」を係り受け解析してみよう。解析用のコマンドはudcabochaだ。

$ echo 太郎はこの本を二郎を見た女性に渡した。 | udcabocha -f 0
太郎は-----------D
    この-D       |
      本を---D   |
      二郎を-D   |
          見た-D |
          女性に-D
          渡した。
EOS

-fオプションの数字は、0がtree、1がlattice、2がtree+lattice、3がXML、4がUniversal Dependenciesである。なお、udcabochaは、入力ファイルはパラメータに書けるが、出力ファイルのオプションは今のところ無いので、ファイルの入出力は以下のようにしてほしい。

$ udcabocha -f 0 input.txt > output.txt

ちなみに、Cygwin 64bit版だと、本物のCaboCha 0.69 (UTF-8版)も、以下の手順でインストールできる。

$ pip3.7 install git+https://github.com/KoichiYasuoka/cabocha-cygwin64
$ pip3.7 install 'git+https://github.com/taku910/cabocha#subdirectory=python'

両方入れてみて、cabochaudcabochaで結果を比べる(特に-f 4オプション)、というのも案外オツかもしれない。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

計算機科学者とは、壊れていないものを修理する人々のことである

読み込み中...