パスワードを忘れた? アカウント作成
13614527 journal
地球

yasuokaの日記: Universal Dependenciesにおける「二重主語」の問題

日記 by yasuoka

5月22日の日記に続いて、「是民受之也」をもう少し考えてみた。現時点のUniversal Dependenciesでは、「受」からnsubjを2本出して、それぞれ「民」と「是」に突き刺すしか無いように思える。

1 是 是 PRON n,代名詞,指示,* _ 3 nsubj _ SpaceAfter=No
2 民 民 NOUN n,名詞,人,人 _ 3 nsubj _ SpaceAfter=No
3 受 受 VERB v,動詞,行為,得失 _ 0 root _ SpaceAfter=No
4 之 之 PRON n,代名詞,人称,止格 _ 3 obj _ SpaceAfter=No
5 也 也 PART p,助詞,句末,* _ 3 discourse:sp _ SpaceAfter=No

これに対し、Universal Dependenciesの少し古いドキュメントでは、nsubj:copの導入が検討されていたようだ。たとえば「The main thing is that the device works」という英文では、「works」にrootを突き刺した上で、「thing ←nsubj:cop─ works ─nsubj→ device」とすることが検討されたようである。しかしながら、現時点のドキュメントでは、「is」にrootを突き刺して、「thing ←nsubj─ is ─ccomp→ works ─nsubj→ device」としている。ヒドイ。

ちなみにチェコ語では、コピュラ文での主語の矢印の向きを逆転するという大技が使われている。たとえば「Faktem je, že ona je moje matka」という文では、「Faktem」にrootを突き刺して、「Faktem ─csubj→ matka ─nsubj→ ona」としているようだ。一方、『Universal Dependencies Version 2 for Japanese』の日本語(長単位)では、この手の文はdislocatedで対応している。たとえば「象は鼻が長い」という文では、「長い」にrootを突き刺して、「象は ←dislocated─ 長い ─nsubj→ 鼻が」とするやり方である。その一方で、アラビア語は(実は私(安岡孝一)自身はイマイチ読めないのだけど)、「二重主語」だろうと何だろうと、2本でも3本でもnsubj使いまくっているようだ。うーん、全然Universalじゃないんだけど、さて、古典中国語(漢文)では、どれにするのがいいんだろう?

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ

読み込み中...