yasuokaの日記: 日本語Universal Dependenciesにおける名詞句の並列はconjの夢を見るか 3
浅原正幸・金山博・宮尾祐介・田中貴秋・大村舞・村脇雄吾・松本裕治の『Universal Dependencies日本語コーパス』(自然言語処理, 第26巻, 第1号, pp.3-36)を読みつつ、日本語における名詞句の並列をどうすべきか、少し考えてみた。この論文の例(31)に従うなら、「私と彼女が行きます」という文は、こんな風に記述される。
1 私 私 PRON 代名詞 _ 3 nmod _ SpaceAfter=No
2 と と ADP 助詞-格助詞 _ 1 case _ SpaceAfter=No
3 彼女 彼女 PRON 代名詞 _ 5 nsubj _ SpaceAfter=No
4 が が ADP 助詞-格助詞 _ 3 case _ SpaceAfter=No
5 行き 行く VERB 動詞-非自立可能 _ 0 root _ SpaceAfter=No
6 ます ます AUX 助動詞 _ 5 aux _ SpaceAfter=No
実際、GiNZAで「私と彼女が行きます」を係り受け解析すると、この結果になる。けれど正直なところ、私(安岡孝一)は、この結果が気に入らない。だって、「私」←nmod─「彼女」は、Universal Dependenciesの定義上、「私の彼女」であって「私と彼女」ではない。「私と彼女」を表現するなら、nmodは不適切で、別のタグを使うべきだ。ただ、並列を表すconjは、矢印を→(文頭から文末へ)としなければならない(らしい)ので、上のnmodをconjに変えるだけでは、方向が逆になってしまう。
そのあたりをざっと考えていくと、この論文の例(31)と(30)は、どちらも無理があって、どこか妥協点を見つける必要がありそうだ。たとえば、こんな感じ。
1 私 私 PRON 代名詞 _ 5 nsubj _ SpaceAfter=No
2 と と ADP 助詞-格助詞 _ 1 case _ SpaceAfter=No
3 彼女 彼女 PRON 代名詞 _ 1 conj _ SpaceAfter=No
4 が が ADP 助詞-格助詞 _ 3 case _ SpaceAfter=No
5 行き 行く VERB 動詞-非自立可能 _ 0 root _ SpaceAfter=No
6 ます ます AUX 助動詞 _ 5 aux _ SpaceAfter=No
つまり、「私」─conj→「彼女」のところと、それに伴うnsubjの張り換えはおこなうが、他のリンク(特に助詞に関するcase)は張り換えない。これで何とか妥協できるんじゃないか、と思いつつ、CamphrへのPull Requestを書いてみたのだが、さて、どうなるかしら。
PRありがとうございました! (スコア:1)
Camphr 0.5.20ありがとうございます (スコア:2)
Camphr 0.5.20のリリースありがとうございます。とりあえず、「私と彼女が行きます」をKNPで係り受け解析して、Camphrとdeplacyで可視化してみました。
「私」=conj⇒「彼女」が、ちゃんと係り受け解析できてます。素晴らしい。
Re:Camphr 0.5.20ありがとうございます (スコア:1)