パスワードを忘れた? アカウント作成
13880198 journal
日本

yasuokaの日記: 「駆け抜ける」と「走り切る」は複合動詞なのか動詞連続なのか

日記 by yasuoka

一昨日以来GiNZA (Ver.1.0.1令和版)と戯れていたのだが、どうも妙なUniversal Dependenciesが出力されるのに気づいた。たとえば「都大路を駆け抜けてゴールまで走り切った」という文に対し

% python3
>>> import spacy
>>> from spacy.lang.ja_ginza.cli import token_line
>>> ja=spacy.load("ja_ginza_nopn")
>>> d=ja("都大路を駆け抜けてゴールまで走り切った")
>>> u="".join("".join(token_line(t,{})+"\n" for t in s)+"\n" for s in d.sents)
>>> print(u)

で依存文法解析をおこなうと、以下のUniversal Dependenciesが出力される。

1 都大路 都大路 NOUN 名詞-普通名詞-一般 _ 3 obj _ SpaceAfter=No
2 を を ADP 助詞-格助詞 _ 1 case _ SpaceAfter=No
3 駆け抜け 駆け抜ける VERB 動詞-一般 _ 8 advcl _ SpaceAfter=No
4 て て SCONJ 助詞-接続助詞 _ 3 mark _ SpaceAfter=No
5 ゴール ゴール VERB 名詞-普通名詞-サ変可能 _ 8 nmod _ SpaceAfter=No
6 まで まで ADP 助詞-副助詞 _ 5 case _ SpaceAfter=No
7 走り 走る VERB 動詞-一般 _ 8 aux _ SpaceAfter=No
8 切っ 切る VERB 動詞-非自立可能 _ 8 root _ SpaceAfter=No
9 た た AUX 助動詞 _ 8 aux _ SpaceAfter=No

8 root」となっている部分に関しては、ちゃんと「0 root」となるようパッチを当ててもらったのだが、問題は「走り←aux─切っ」のauxだ。もし、「走り切る」を動詞連続(serial verb construction)だとみなすなら、auxではなくcompound:svcあたりを使うべきだろう。ただ、それは「駆け抜け」を、いわゆる複合動詞(compound verb)とみなして、一語として処理していることとと、スジが合わない気がするのだ。何というか、どっちつかずなのだが、さて、こういうの、どうしたらいいんだろ?

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

アレゲは一日にしてならず -- アレゲ見習い

読み込み中...