パスワードを忘れた? アカウント作成
16702055 journal
中国

yasuokaの日記: esuparの古典中国語モジュールは「可怜人似月中霜」をどう解析するのか

日記 by yasuoka

Shitou Zhang, Ping Wang, Zuchao Li, Jingrui Hou 『Enhancing Ancient Chinese Understanding with Derived Noisy Syntax Trees』(Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (July 2023), Volume 4: Student Research Workshop, pp.83-92)を読んでいたところ、Figure 1に妙な違和感を覚えた。「可怜人似月中霜」を係り受け解析しているのだが、Supervised Parser (BiAF)の結果が悪すぎるのだ。deplacy風に書くと、こんな感じ。

可 ═╗<══╗
怜 <╝   ║
人 ═╗<╗ ║
似 <╝ ║ ║
月 ═══╝═╝<╗
中 <╗     ║
霜 ═╝═════╝ ROOT

いくらBiaffineパーサーが、ラベル付きリンク向けに設計されているからと言って、ラベル無しリンクでも、ここまでヒドイことにはならないはずだ。私(安岡孝一)のグループが構築中のesuparで試してみよう。

$ pip3 install -U esupar
$ python3
>>> import esupar
>>> nlp=esupar.load("lzh")
>>> doc=nlp("可怜人似月中霜")
>>> import deplacy
>>> deplacy.render(doc)
可 AUX  <══════════╗ aux
怜 VERB ═════════╗═╝ root
人 NOUN <══════╗ ║   nsubj
似 VERB ═════╗═╝<╝   ccomp
月 NOUN <╗   ║       nmod
中 NOUN ═╝<╗ ║       nmod
霜 NOUN ═══╝<╝       obj

esuparは、内部的にはBiaffineパーサーで実装しているのだが、ちゃんと「可怜人似月中霜」を読めている。この論文、武漢大学のグループ(張石頭・王平・李祖超・侯景瑞)らしいのだけど、Universal Dependenciesへの言及も無いし、本当にBiaffineパーサーを実装できてるのかしら?

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

物事のやり方は一つではない -- Perlな人

読み込み中...