yasuokaの日記: 「港の見える丘」の「港」は「見える」の主語なのか
昨晩リリースしたUniDic2UD 1.9.4で「港の見える丘」を係り受け解析してみたところ、面白い結果を出力するようになったので、とりあえず私(安岡孝一)の日記に記録しておくことにする。
$ echo 港の見える丘 | unidic2ud -U gendai
# text = 港の見える丘
1 港 港 NOUN 名詞-普通名詞-一般 _ 3 nsubj _ SpaceAfter=No|Translit=ミナト
2 の の ADP 助詞-格助詞 _ 1 case _ SpaceAfter=No|Translit=ノ
3 見える 見える VERB 動詞-一般 _ 4 acl _ SpaceAfter=No|Translit=ミエル
4 丘 丘 NOUN 名詞-普通名詞-一般 _ 0 root _ SpaceAfter=No|Translit=オカ
SVGで可視化すると、こんな感じ。「港」←nsubj─「見える」となっていて、「港」が「見える」の主語だと解析されている。一方、Camphr-Udifyのja_mecab_udify 0.5で「港の見える丘」を係り受け解析すると、以下のようになる。
$ python3
>>> import spacy
>>> ja=spacy.load("ja_mecab_udify")
>>> s=ja("港の見える丘")
>>> print("".join("\t".join([str(t.i+1),t.orth_,t.lemma_,t.pos_,t.tag_,"_",str(0 if t.head==t else t.head.i+1),t.dep_,"_","_" if t.whitespace_ else "SpaceAfter=No"])+"\n" for t in s))
1 港 港 NOUN 名詞,一般,*,* _ 3 obl _ SpaceAfter=No
2 の の ADP 助詞,格助詞,一般,* _ 1 case _ SpaceAfter=No
3 見える 見える VERB 動詞,自立,*,* _ 4 acl _ SpaceAfter=No
4 丘 丘 NOUN 名詞,一般,*,* _ 0 root _ SpaceAfter=No
SVGで可視化すると、こんな感じ。nsubj(主語)ではなくobl(斜格補語)となっている。あるいは、GiNZA 3.1.2で「港の見える丘」を係り受け解析すると、以下のようになる。
$ echo 港の見える丘 | ginza
# text = 港の見える丘
1 港 港 NOUN 名詞-普通名詞-一般 _ 3 iobj _ BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|SpaceAfter=No|NP_B
2 の の ADP 助詞-格助詞 _ 1 case _ BunsetuBILabel=I|BunsetuPositionType=SYN_HEAD|SpaceAfter=No
3 見える 見える VERB 動詞-一般 _ 4 acl _ BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|SpaceAfter=No
4 丘 丘 NOUN 名詞-普通名詞-一般 _ 0 root _ BunsetuBILabel=I|BunsetuPositionType=ROOT|SpaceAfter=No|NP_B
iobj(間接目的語)になってしまっている。学校文法における「の」は「部分の主語」を表す場合があるので、私(安岡孝一)個人としてはUniDic2UD 1.9.4の解析結果の方が好きなのだけど、このあたり、他の解析エンジンの設計者たちは、どう考えてるんだろ。
「港の見える丘」の「港」は「見える」の主語なのか More ログイン