パスワードを忘れた? アカウント作成
13951200 journal
人工知能

yasuokaの日記: 「知を致すは物に格るに在り」の「に」はcliticかaffixか

日記 by yasuoka

一昨日のChamame2UD.pyを使って、漢文の読み下し文を係り受け解析していたところ、「知を致すは物に格るに在り」がうまく解析できないことに気づいた。

% python -i Chamame2UD.py
>>> qkana=Chamame2UD("qkana")
>>> s=qkana("知を致すは物に格るに在り")
>>> s.editor()
>>> print(s)
1    知    知    NOUN    名詞-普通名詞-一般    _    3    obj    _    SpaceAfter=No
2    を    を    ADP    助詞-格助詞    _    1    case    _    SpaceAfter=No
3    致す    致す    VERB    動詞-非自立可能    _    10    advcl    _    SpaceAfter=No
4    は    は    ADP    助詞-係助詞    _    3    case    _    SpaceAfter=No
5    物    物    NOUN    名詞-普通名詞-サ変可能    _    10    iobj    _    SpaceAfter=No
6    に    に    ADP    助詞-格助詞    _    5    case    _    SpaceAfter=No
7    格    格    NOUN    名詞-普通名詞-一般    _    10    iobj    _    SpaceAfter=No
8    る    り    AUX    助動詞    _    7    aux    _    SpaceAfter=No
9    に    に    ADP    助詞-格助詞    _    7    case    _    SpaceAfter=No
10    在り    有る    VERB    動詞-非自立可能    _    0    root    _    SpaceAfter=No

「CoNLL-U SVG Editor」で見ると、こんな感じ。どうやら、「格る」という動詞を旧仮名口語UniDicは知らないようだ。とりあえず、私(安岡孝一)なりに、このUniversal Dependenciesを手作業で修正しようとしたのだが、修正するにしても「短単位」を採用すべきか、「Syntactic Word」を採用すべきかで、迷ってしまった。「短単位」を採用するなら、「格」と「る」をまとめてVERBとみなし、

1    知    知    NOUN    名詞-普通名詞-一般    _    3    obj    _    SpaceAfter=No
2    を    を    ADP    助詞-格助詞    _    1    case    _    SpaceAfter=No
3    致す    致す    VERB    動詞-非自立可能    _    9    csubj    _    SpaceAfter=No
4    は    は    ADP    助詞-係助詞    _    3    case    _    SpaceAfter=No
5    物    物    NOUN    名詞-普通名詞-サ変可能    _    7    obj    _    SpaceAfter=No
6    に    に    ADP    助詞-格助詞    _    5    case    _    SpaceAfter=No
7    格る    格る    VERB    動詞-一般    _    9    advcl    _    SpaceAfter=No|Translit=イタル
8    に    に    ADP    助詞-格助詞    _    7    case    _    SpaceAfter=No
9    在り    有る    VERB    動詞-非自立可能    _    0    root    _    SpaceAfter=No

とすることになる。一方、「Syntactic Word」を採用するなら、「格るに」をひとまとめにするかどうかが議論の対象となる。この「に」をcliticと見るなら「短単位」と同じになるが、affixと見るなら以下のようにせざるを得ない。

1    知    知    NOUN    名詞-普通名詞-一般    _    3    obj    _    SpaceAfter=No
2    を    を    ADP    助詞-格助詞    _    1    case    _    SpaceAfter=No
3    致す    致す    VERB    動詞-非自立可能    _    8    csubj    _    SpaceAfter=No
4    は    は    ADP    助詞-係助詞    _    3    case    _    SpaceAfter=No
5    物    物    NOUN    名詞-普通名詞-サ変可能    _    7    obj    _    SpaceAfter=No
6    に    に    ADP    助詞-格助詞    _    5    case    _    SpaceAfter=No
7    格るに    格る    VERB    動詞-一般    _    8    advcl    _    SpaceAfter=No|Translit=イタルニ
8    在り    有る    VERB    動詞-非自立可能    _    0    root    _    SpaceAfter=No

でも、現時点の私には、この「に」がcliticなのかaffixなのか、ハッキリとは断言できない。6月27日の日記のアイデアも、今のところはCotoha2UD.py限定実装なので、旧字旧かなの読み下し文には適用できなさそうだ。さて、どうしたらいいかな。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

未知のハックに一心不乱に取り組んだ結果、私は自然の法則を変えてしまった -- あるハッカー

読み込み中...