yasuokaの日記: Question Answeringを係り受け解析に応用するには
Leilei Gan, Yuxian Meng, Kun Kuang, Xiaofei Sun, Chun Fan, Fei Wu, Jiwei Li『Dependency Parsing as MRC-based Span-Span Prediction』(60th Annual Meeting of the ACM (May 2022), Vol.1: Long Papers, pp.2427-2437)を、私(安岡孝一)なりに検討してみた。単語間に区切りの無い言語においては、この論文のtokenやspanをそのまま当てはめるのは難しく、あえて単語(word)と構成鎖(catena)を使うべきではないか、というのが現時点での結論だ。ただ、全ての構成鎖を使うと大変なことになってしまうので、各単語を起点とする最大の構成鎖だけを、とりあえず見てみよう。たとえば「世界中が刮目している」の国語研長単位Universal Dependencies係り受け解析木
世界中 NOUN ═╗<╗ nsubj
が ADP <╝ ║ case
刮目し VERB ═╗═╝ root
ている AUX <╝ aux
に対するQuestion Answeringは、尋ねる単語や構成鎖を[MASK]で表すことにすると、以下のように表現できる(気がする)。
{ "context":"世界中が刮目している",
"qas":[{ "question":"[MASK]が刮目している",
"answer":{ "start":4, "end":7, "text":"刮目し", "label":"nsubj" }},
{ "question":"[MASK]刮目している",
"answer":{ "start":4, "end":7, "text":"刮目し", "label":"nsubj" }},
{ "question":"世界中[MASK]刮目している",
"answer":{ "start":0, "end":3, "text":"世界中", "label":"case" }},
{ "question":"世界中が[MASK]ている",
"answer":{ "start":4, "end":7, "text":"刮目し", "label":"root" }},
{ "question":"[MASK]",
"answer":{ "start":4, "end":7, "text":"刮目し", "label":"root" }},
{ "question":"世界中が刮目し[MASK]",
"answer":{ "start":4, "end":7, "text":"刮目し", "label":"aux" }}]}
ただ、こういう形でQuestion Answeringを作ったとしても、構成鎖を順に狭めていくのと、隣接確率行列を作ってChu-Liu-Edmondsを解くのでは、あまり結果が変わらない気がする。うーん、このあたり、実際に試してみるしかないかな。
Question Answeringを係り受け解析に応用するには More ログイン