パスワードを忘れた? アカウント作成
15698641 journal
人工知能

yasuokaの日記: Question Answeringを係り受け解析に応用するには

日記 by yasuoka

Leilei Gan, Yuxian Meng, Kun Kuang, Xiaofei Sun, Chun Fan, Fei Wu, Jiwei Li『Dependency Parsing as MRC-based Span-Span Prediction』(60th Annual Meeting of the ACM (May 2022), Vol.1: Long Papers, pp.2427-2437)を、私(安岡孝一)なりに検討してみた。単語間に区切りの無い言語においては、この論文のtokenやspanをそのまま当てはめるのは難しく、あえて単語(word)と構成鎖(catena)を使うべきではないか、というのが現時点での結論だ。ただ、全ての構成鎖を使うと大変なことになってしまうので、各単語を起点とする最大の構成鎖だけを、とりあえず見てみよう。たとえば「世界中が刮目している」の国語研長単位Universal Dependencies係り受け解析木

世界中 NOUN ═╗<╗ nsubj
が     ADP  <╝ ║ case
刮目し VERB ═╗═╝ root
ている AUX  <╝   aux

に対するQuestion Answeringは、尋ねる単語や構成鎖を[MASK]で表すことにすると、以下のように表現できる(気がする)。

{ "context":"世界中が刮目している",
  "qas":[{ "question":"[MASK]が刮目している",
           "answer":{ "start":4, "end":7, "text":"刮目し", "label":"nsubj" }},
         { "question":"[MASK]刮目している",
           "answer":{ "start":4, "end":7, "text":"刮目し", "label":"nsubj" }},
         { "question":"世界中[MASK]刮目している",
           "answer":{ "start":0, "end":3, "text":"世界中", "label":"case" }},
         { "question":"世界中が[MASK]ている",
           "answer":{ "start":4, "end":7, "text":"刮目し", "label":"root" }},
         { "question":"[MASK]",
           "answer":{ "start":4, "end":7, "text":"刮目し", "label":"root" }},
         { "question":"世界中が刮目し[MASK]",
           "answer":{ "start":4, "end":7, "text":"刮目し", "label":"aux" }}]}

ただ、こういう形でQuestion Answeringを作ったとしても、構成鎖を順に狭めていくのと、隣接確率行列を作ってChu-Liu-Edmondsを解くのでは、あまり結果が変わらない気がする。うーん、このあたり、実際に試してみるしかないかな。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ

読み込み中...