yasuokaの日記: 「知を致すは物に格るに在り」の「に」はcliticかaffixか
一昨日の「Chamame2UD.py」を使って、漢文の読み下し文を係り受け解析していたところ、「知を致すは物に格るに在り」がうまく解析できないことに気づいた。
% python -i Chamame2UD.py
>>> qkana=Chamame2UD("qkana")
>>> s=qkana("知を致すは物に格るに在り")
>>> s.editor()
>>> print(s)
1 知 知 NOUN 名詞-普通名詞-一般 _ 3 obj _ SpaceAfter=No
2 を を ADP 助詞-格助詞 _ 1 case _ SpaceAfter=No
3 致す 致す VERB 動詞-非自立可能 _ 10 advcl _ SpaceAfter=No
4 は は ADP 助詞-係助詞 _ 3 case _ SpaceAfter=No
5 物 物 NOUN 名詞-普通名詞-サ変可能 _ 10 iobj _ SpaceAfter=No
6 に に ADP 助詞-格助詞 _ 5 case _ SpaceAfter=No
7 格 格 NOUN 名詞-普通名詞-一般 _ 10 iobj _ SpaceAfter=No
8 る り AUX 助動詞 _ 7 aux _ SpaceAfter=No
9 に に ADP 助詞-格助詞 _ 7 case _ SpaceAfter=No
10 在り 有る VERB 動詞-非自立可能 _ 0 root _ SpaceAfter=No
「CoNLL-U SVG Editor」で見ると、こんな感じ。どうやら、「格る」という動詞を旧仮名口語UniDicは知らないようだ。とりあえず、私(安岡孝一)なりに、このUniversal Dependenciesを手作業で修正しようとしたのだが、修正するにしても「短単位」を採用すべきか、「Syntactic Word」を採用すべきかで、迷ってしまった。「短単位」を採用するなら、「格」と「る」をまとめてVERBとみなし、
1 知 知 NOUN 名詞-普通名詞-一般 _ 3 obj _ SpaceAfter=No
2 を を ADP 助詞-格助詞 _ 1 case _ SpaceAfter=No
3 致す 致す VERB 動詞-非自立可能 _ 9 csubj _ SpaceAfter=No
4 は は ADP 助詞-係助詞 _ 3 case _ SpaceAfter=No
5 物 物 NOUN 名詞-普通名詞-サ変可能 _ 7 obj _ SpaceAfter=No
6 に に ADP 助詞-格助詞 _ 5 case _ SpaceAfter=No
7 格る 格る VERB 動詞-一般 _ 9 advcl _ SpaceAfter=No|Translit=イタル
8 に に ADP 助詞-格助詞 _ 7 case _ SpaceAfter=No
9 在り 有る VERB 動詞-非自立可能 _ 0 root _ SpaceAfter=No
とすることになる。一方、「Syntactic Word」を採用するなら、「格るに」をひとまとめにするかどうかが議論の対象となる。この「に」をcliticと見るなら「短単位」と同じになるが、affixと見るなら以下のようにせざるを得ない。
1 知 知 NOUN 名詞-普通名詞-一般 _ 3 obj _ SpaceAfter=No
2 を を ADP 助詞-格助詞 _ 1 case _ SpaceAfter=No
3 致す 致す VERB 動詞-非自立可能 _ 8 csubj _ SpaceAfter=No
4 は は ADP 助詞-係助詞 _ 3 case _ SpaceAfter=No
5 物 物 NOUN 名詞-普通名詞-サ変可能 _ 7 obj _ SpaceAfter=No
6 に に ADP 助詞-格助詞 _ 5 case _ SpaceAfter=No
7 格るに 格る VERB 動詞-一般 _ 8 advcl _ SpaceAfter=No|Translit=イタルニ
8 在り 有る VERB 動詞-非自立可能 _ 0 root _ SpaceAfter=No
でも、現時点の私には、この「に」がcliticなのかaffixなのか、ハッキリとは断言できない。6月27日の日記のアイデアも、今のところは「Cotoha2UD.py」限定実装なので、旧字旧かなの読み下し文には適用できなさそうだ。さて、どうしたらいいかな。
「知を致すは物に格るに在り」の「に」はcliticかaffixか More ログイン