パスワードを忘れた? アカウント作成
14120393 journal
人工知能

yasuokaの日記: 「港の見える丘」の「港」は「見える」の主語なのか

日記 by yasuoka

昨晩リリースしたUniDic2UD 1.9.4で「港の見える丘」を係り受け解析してみたところ、面白い結果を出力するようになったので、とりあえず私(安岡孝一)の日記に記録しておくことにする。

$ echo 港の見える丘 | unidic2ud -U gendai
# text = 港の見える丘
1    港    港    NOUN    名詞-普通名詞-一般    _    3    nsubj    _    SpaceAfter=No|Translit=ミナト
2    の    の    ADP    助詞-格助詞    _    1    case    _    SpaceAfter=No|Translit=ノ
3    見える    見える    VERB    動詞-一般    _    4    acl    _    SpaceAfter=No|Translit=ミエル
4    丘    丘    NOUN    名詞-普通名詞-一般    _    0    root    _    SpaceAfter=No|Translit=オカ

SVGで可視化すると、こんな感じ。「港」←nsubj─「見える」となっていて、「港」が「見える」の主語だと解析されている。一方、Camphr-Udifyのja_mecab_udify 0.5で「港の見える丘」を係り受け解析すると、以下のようになる。

$ python3
>>> import spacy
>>> ja=spacy.load("ja_mecab_udify")
>>> s=ja("港の見える丘")
>>> print("".join("\t".join([str(t.i+1),t.orth_,t.lemma_,t.pos_,t.tag_,"_",str(0 if t.head==t else t.head.i+1),t.dep_,"_","_" if t.whitespace_ else "SpaceAfter=No"])+"\n" for t in s))
1    港    港    NOUN    名詞,一般,*,*    _    3    obl    _    SpaceAfter=No
2    の    の    ADP    助詞,格助詞,一般,*    _    1    case    _    SpaceAfter=No
3    見える    見える    VERB    動詞,自立,*,*    _    4    acl    _    SpaceAfter=No
4    丘    丘    NOUN    名詞,一般,*,*    _    0    root    _    SpaceAfter=No

SVGで可視化すると、こんな感じnsubj(主語)ではなくobl(斜格補語)となっている。あるいは、GiNZA 3.1.2で「港の見える丘」を係り受け解析すると、以下のようになる。

$ echo 港の見える丘 | ginza
# text = 港の見える丘
1    港    港    NOUN    名詞-普通名詞-一般    _    3    iobj    _    BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|SpaceAfter=No|NP_B
2    の    の    ADP    助詞-格助詞    _    1    case    _    BunsetuBILabel=I|BunsetuPositionType=SYN_HEAD|SpaceAfter=No
3    見える    見える    VERB    動詞-一般    _    4    acl    _    BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|SpaceAfter=No
4    丘    丘    NOUN    名詞-普通名詞-一般    _    0    root    _    BunsetuBILabel=I|BunsetuPositionType=ROOT|SpaceAfter=No|NP_B

iobj(間接目的語)になってしまっている。学校文法における「の」は「部分の主語」を表す場合があるので、私(安岡孝一)個人としてはUniDic2UD 1.9.4の解析結果の方が好きなのだけど、このあたり、他の解析エンジンの設計者たちは、どう考えてるんだろ。

この議論は、yasuoka (21275)によって「 ログインユーザだけ」として作成されている。 ログインしてから来てね。
typodupeerror

弘法筆を選ばず、アレゲはキーボードを選ぶ -- アレゲ研究家

読み込み中...