パスワードを忘れた? アカウント作成
14161002 journal
人工知能

yasuokaの日記: 日本語Universal Dependenciesにおける名詞句の並列はconjの夢を見るか 3

日記 by yasuoka

浅原正幸・金山博・宮尾祐介・田中貴秋・大村舞・村脇雄吾・松本裕治の『Universal Dependencies日本語コーパス』(自然言語処理, 第26巻, 第1号, pp.3-36)を読みつつ、日本語における名詞句の並列をどうすべきか、少し考えてみた。この論文の例(31)に従うなら、「私と彼女が行きます」という文は、こんな風に記述される。

1       私      私      PRON    代名詞  _       3       nmod    _       SpaceAfter=No
2       と      と      ADP     助詞-格助詞     _       1       case    _       SpaceAfter=No
3       彼女    彼女    PRON    代名詞  _       5       nsubj   _       SpaceAfter=No
4       が      が      ADP     助詞-格助詞     _       3       case    _       SpaceAfter=No
5       行き    行く    VERB    動詞-非自立可能 _       0       root    _       SpaceAfter=No
6       ます    ます    AUX     助動詞  _       5       aux     _       SpaceAfter=No

実際、GiNZAで「私と彼女が行きます」を係り受け解析すると、この結果になる。けれど正直なところ、私(安岡孝一)は、この結果が気に入らない。だって、「私」←nmod─「彼女」は、Universal Dependenciesの定義上、「私の彼女」であって「私と彼女」ではない。「私と彼女」を表現するなら、nmodは不適切で、別のタグを使うべきだ。ただ、並列を表すconjは、矢印を→(文頭から文末へ)としなければならない(らしい)ので、上のnmodconjに変えるだけでは、方向が逆になってしまう。

そのあたりをざっと考えていくと、この論文の例(31)と(30)は、どちらも無理があって、どこか妥協点を見つける必要がありそうだ。たとえば、こんな感じ

1       私      私      PRON    代名詞  _       5       nsubj    _       SpaceAfter=No
2       と      と      ADP     助詞-格助詞     _       1       case    _       SpaceAfter=No
3       彼女    彼女    PRON    代名詞  _       1       conj   _       SpaceAfter=No
4       が      が      ADP     助詞-格助詞     _       3       case    _       SpaceAfter=No
5       行き    行く    VERB    動詞-非自立可能 _       0       root    _       SpaceAfter=No
6       ます    ます    AUX     助動詞  _       5       aux     _       SpaceAfter=No

つまり、「私」─conj→「彼女」のところと、それに伴うnsubjの張り換えはおこなうが、他のリンク(特に助詞に関するcase)は張り換えない。これで何とか妥協できるんじゃないか、と思いつつ、CamphrへのPull Requestを書いてみたのだが、さて、どうなるかしら。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond

読み込み中...