パスワードを忘れた? アカウント作成
14069519 journal
人工知能

yasuokaの日記: UD-Kundoku正式?リリース

日記 by yasuoka

今日のじんもんこん:-)2019の発表で、はからずもUD-Kundokuを正式リリースした感じになってしまったので、とりあえずインストール手順と使い方を、私(安岡孝一)の日記に載せておく。

インストールは、かなり簡単で「pip3 install udkundoku」一発で済むのだが、Cygwin (64bit版)だとちょっと手間なので、私の11月11日の日記に従ってUniDic2UDをインストールした上「pip3.7 install udkundoku」してほしい。インストールがうまくいったなら、まずは「不入虎穴不得虎子」を訓読してみよう。

$ python3
>>> import udkundoku
>>> lzh=udkundoku.load()
>>> s=lzh("不入虎穴不得虎子")
>>> t=udkundoku.translate(s)
>>> print(t.sentence())

さて、どういう文字列が出力されるか、文字コードの言う通りである。解析の途中経過を知りたい場合は、次の3つの解析を試してほしい。

>>> print(s.to_tree())
>>> print(s.to_tree(kaeriten=True))
>>> print(t.to_tree())

これら3つの解析は、今日の発表で話した3段階の解析

  1. 白文から古典中国語Universal Dependenciesを生成
  2. 古典中国語Universal Dependenciesの語順入替
  3. 助詞と送り仮名の追加

にほぼ対応している。ぜひ発表内容を思い出しつつ、様々な漢文にチャレンジしてほしい。なお、自然言語処理 #2 Advent Calendar 2019の12月13日があいてたので、一日遅れだけど参加させていただいた。皆様よろしく。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

最初のバージョンは常に打ち捨てられる。

読み込み中...