yasuokaの日記: 「ความท้าทาย」は1語なのか2語なのか
UD_Thai-PUDをチェックしていたところ、「แผนกนี้กำลังเผชิญกับความท้าทายใหม่」という例文が目にとまった。
# text = แผนกนี้กำลังเผชิญกับความท้าทายใหม่
# text_en = This department now faces new challenges.
1 แผนก _ NOUN NN _ 4 nsubj _ SpaceAfter=No
2 นี้ _ DET DT _ 1 det _ SpaceAfter=No
3 กำลัง _ PART AS Aspect=Prog 4 aux _ SpaceAfter=No
4 เผชิญ _ VERB VV _ 0 root _ SpaceAfter=No
5 กับ _ ADP IN _ 6 case _ SpaceAfter=No
6 ความท้าทาย _ VERB VV _ 4 obl _ SpaceAfter=No
7 ใหม่ _ ADJ JJ _ 6 amod _ _
「ความท้าทาย」(挑戦)をVERB(動詞)とみなしていて、かなり気持ち悪い。「ท้าทาย」(挑戦する)を「ความ」で体言化しているのだから、「ความท้าทาย」全体としてはNOUN(名詞)とみなすのが適切だと、私(安岡孝一)には思える。
一方、この例文「แผนกนี้กำลังเผชิญกับความท้าทายใหม่」をpythainlp 2.1.4で形態素解析すると、以下の結果になった。
>>> from pythainlp import word_tokenize,pos_tag
>>> nlp=lambda txt:pos_tag(word_tokenize(txt))
>>> doc=nlp("แผนกนี้กำลังเผชิญกับความท้าทายใหม่")
>>> print(doc)
[('แผนก', 'NCMN'), ('นี้', 'DDAC'), ('กำลัง', 'XVBM'), ('เผชิญ', 'VSTA'), ('กับ', 'RPRE'), ('ความ', 'FIXN'), ('ท้าทาย', 'VACT'), ('ใหม่', 'ADVN')]
ORCHIDの品詞タグが読みにくいのだが、「ความท้าทาย」を2語に分けて、「ความ」を名詞化接頭辞、「ท้าทาย」を動作動詞だとみなしているようだ。うーむ、これはこれで困ったな…。
「ความท้าทาย」は1語なのか2語なのか More ログイン