![人工知能 人工知能](https://srad.jp/static/topics/ai_64.png)
yasuokaの日記: UniDic2UDとGiNZAで読む「難儀な難儀は難儀する」
昨日の日記で示したUniDic品詞とUniversal Dependencies品詞の対応だが、かなり難儀なのが「名詞-普通名詞-サ変形状詞可能」だったりする。何せ「名詞」のくせにNOUNとは限らず、VERBだったりADJ(adjective)だったりするのだ。最新のUniDic2UD 1.9.1+現代話し言葉UniDicで、「難儀な難儀は難儀する」を解析してみよう。
$ echo 難儀な難儀は難儀する | unidic2ud -U spoken
# text = 難儀な難儀は難儀する
1 難儀 難儀 ADJ 名詞-普通名詞-サ変形状詞可能 _ 3 acl _ SpaceAfter=No|Translit=ナンギ
2 な だ AUX 助動詞 _ 1 aux _ SpaceAfter=No|Translit=ナ
3 難儀 難儀 NOUN 名詞-普通名詞-サ変形状詞可能 _ 5 nsubj _ SpaceAfter=No|Translit=ナンギ
4 は は ADP 助詞-係助詞 _ 3 case _ SpaceAfter=No|Translit=ハ
5 難儀 難儀 VERB 名詞-普通名詞-サ変形状詞可能 _ 0 root _ SpaceAfter=No|Translit=ナンギ
6 する 為る AUX 動詞-非自立可能 _ 5 aux _ SpaceAfter=No|Translit=スル
SVGで可視化すると、こんな感じ。3つある「難儀」に対して、「難儀な」がADJ+AUX、「難儀は」がNOUN+ADP、「難儀する」がVERB+AUXになっている。「学校文法」では「難儀な」がいわゆる形容動詞の連体形で、「難儀する」がサ変動詞の終止形だと習うわけだが、これに対する国語研短単位とUniversal Dependencies品詞のミツドモエが、こういう難儀な結果を生んでいるわけだ。一方、GiNZA 3.1.1だと「難儀な難儀は難儀する」は、私(安岡孝一)の手元では以下のように解析された。
$ echo 難儀な難儀は難儀する | ginza
# text = 難儀な難儀は難儀する
1 難儀 難儀 ADJ 名詞-普通名詞-サ変形状詞可能 _ 3 amod _ BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|SpaceAfter=No
2 な だ AUX 助動詞 _ 1 aux _ BunsetuBILabel=I|BunsetuPositionType=SYN_HEAD|SpaceAfter=No
3 難儀 難儀 NOUN 名詞-普通名詞-サ変形状詞可能 _ 6 nsubj _ BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|SpaceAfter=No|NP_B
4 は は ADP 助詞-係助詞 _ 3 case _ BunsetuBILabel=I|BunsetuPositionType=SYN_HEAD|SpaceAfter=No
5 難儀 難儀 ADJ 名詞-普通名詞-サ変形状詞可能 _ 6 amod _ BunsetuBILabel=B|BunsetuPositionType=CONT|SpaceAfter=No
6 する 為る AUX 動詞-非自立可能 _ 0 root _ BunsetuBILabel=I|BunsetuPositionType=ROOT|SpaceAfter=No
「難儀する」をADJ+AUXと解析している点で、かなり特徴的である。GiNZAも難儀しているのだろう。よければ「pip3 install -U unidic2ud ginza」で最新版をインストールして、ぜひ比較してみてほしい。
UniDic2UDとGiNZAで読む「難儀な難儀は難儀する」 More ログイン