パスワードを忘れた? アカウント作成
14107428 journal
人工知能

yasuokaの日記: UniDic2UDとGiNZAで読む「難儀な難儀は難儀する」

日記 by yasuoka

昨日の日記で示したUniDic品詞とUniversal Dependencies品詞の対応だが、かなり難儀なのが「名詞-普通名詞-サ変形状詞可能」だったりする。何せ「名詞」のくせにNOUNとは限らず、VERBだったりADJ(adjective)だったりするのだ。最新のUniDic2UD 1.9.1+現代話し言葉UniDicで、「難儀な難儀は難儀する」を解析してみよう。

$ echo 難儀な難儀は難儀する | unidic2ud -U spoken
# text = 難儀な難儀は難儀する
1       難儀    難儀    ADJ     名詞-普通名詞-サ変形状詞可能    _       3      acl      _       SpaceAfter=No|Translit=ナンギ
2       な      だ      AUX     助動詞  _       1       aux     _       SpaceAfter=No|Translit=ナ
3       難儀    難儀    NOUN    名詞-普通名詞-サ変形状詞可能    _       5      nsubj    _       SpaceAfter=No|Translit=ナンギ
4       は      は      ADP     助詞-係助詞     _       3       case    _      SpaceAfter=No|Translit=ハ
5       難儀    難儀    VERB    名詞-普通名詞-サ変形状詞可能    _       0      root     _       SpaceAfter=No|Translit=ナンギ
6       する    為る    AUX     動詞-非自立可能 _       5       aux     _      SpaceAfter=No|Translit=スル

SVGで可視化すると、こんな感じ。3つある「難儀」に対して、「難儀な」がADJ+AUX、「難儀は」がNOUN+ADP、「難儀する」がVERB+AUXになっている。「学校文法」では「難儀な」がいわゆる形容動詞の連体形で、「難儀する」がサ変動詞の終止形だと習うわけだが、これに対する国語研短単位とUniversal Dependencies品詞のミツドモエが、こういう難儀な結果を生んでいるわけだ。一方、GiNZA 3.1.1だと「難儀な難儀は難儀する」は、私(安岡孝一)の手元では以下のように解析された。

$ echo 難儀な難儀は難儀する | ginza
# text = 難儀な難儀は難儀する
1       難儀    難儀    ADJ     名詞-普通名詞-サ変形状詞可能    _       3      amod     _       BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|SpaceAfter=No
2       な      だ      AUX     助動詞  _       1       aux     _       BunsetuBILabel=I|BunsetuPositionType=SYN_HEAD|SpaceAfter=No
3       難儀    難儀    NOUN    名詞-普通名詞-サ変形状詞可能    _       6      nsubj    _       BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|SpaceAfter=No|NP_B
4       は      は      ADP     助詞-係助詞     _       3       case    _      BunsetuBILabel=I|BunsetuPositionType=SYN_HEAD|SpaceAfter=No
5       難儀    難儀    ADJ     名詞-普通名詞-サ変形状詞可能    _       6      amod     _       BunsetuBILabel=B|BunsetuPositionType=CONT|SpaceAfter=No
6       する    為る    AUX     動詞-非自立可能 _       0       root    _      BunsetuBILabel=I|BunsetuPositionType=ROOT|SpaceAfter=No

「難儀する」をADJ+AUXと解析している点で、かなり特徴的である。GiNZAも難儀しているのだろう。よければ「pip3 install -U unidic2ud ginza」で最新版をインストールして、ぜひ比較してみてほしい。

この議論は、yasuoka (21275)によって「 ログインユーザだけ」として作成されている。 ログインしてから来てね。
typodupeerror

最初のバージョンは常に打ち捨てられる。

読み込み中...