パスワードを忘れた? アカウント作成
15255054 journal
人工知能

yasuokaの日記: 古典中国語(漢文)解析ツールとしてのTrankitとSuPar-Kanbun

日記 by yasuoka

昨日の日記で紹介したTrankit言語モデル一覧を眺めていたところ、古典中国語モデル(Classical_Chinese-Kyoto)が含まれているのに気づいた。ただ、XLM-RoBERTaの100言語には、古典中国語は含まれていない(cf.『Unsupervised Cross-lingual Representation Learning at Scale』)はずなので、文切りの精度が上がるとも思えない。とりあえず、Google Colaboratoryで試してみることにした。

!pip install trankit transformers torch
import trankit
nlp=trankit.Pipeline("classical-chinese",embedding="xlm-roberta-large")
doc=nlp("吾有千里馬毛骨何蕭森疾馳如奔風白日無留陰徐駆当大道歩驟中五音馬雖有四足遅速在吾心六轡応吾手調和如瑟琴東西与南北高下山与林惟意所欲適九州可周尋至哉人与馬両楽不相侵伯楽識其外徒知価千金王良得其性此術固已深良馬須善馭吾言可為箴")
from trankit.utils.conll import CoNLL
for s in doc["sentences"]:
  print("# text = "+s["text"])
  print(CoNLL.conll_as_string(CoNLL.convert_dict([s["tokens"]])),end="")

1月16日の共通テスト『国語』第4問【問題文I】を、Trankitで文切り・形態素解析・係り受け解析してみたところ、私(安岡孝一)の手元では、以下の結果となった。

# text = 吾有千里馬
1    吾    吾    PRON    n,代名詞,人称,起格    Person=1|PronType=Prs    2    nsubj    _    _
2    有    有    VERB    v,動詞,存在,存在    _    0    root    _    _
3    千    千    NUM    n,数詞,数字,*    _    5    nummod    _    _
4    里    里    NOUN    n,名詞,度量衡,*    NounType=Class    3    clf    _    _
5    馬    馬    NOUN    n,名詞,主体,動物    _    2    obj    _    _

# text = 毛骨何蕭森
1    毛    毛    NOUN    n,名詞,不可譲,身体    _    4    nsubj    _    _
2    骨    骨    NOUN    n,名詞,不可譲,身体    _    1    conj    _    _
3    何    何    ADV    v,副詞,疑問,原因    AdvType=Cau    4    advmod    _    _
4    蕭    蕭    VERB    v,動詞,描写,態度    Degree=Pos    0    root    _    _
5    森    森    VERB    n,名詞,固定物,地形    Degree=Pos    4    flat:vv    _    _

# text = 疾馳如奔風
1    疾    疾    NOUN    n,名詞,不可譲,疾病    _    2    obl    _    _
2    馳    馳    VERB    v,動詞,行為,移動    _    3    csubj    _    _
3    如    如    VERB    v,動詞,行為,分類    Degree=Equ    0    root    _    _
4    奔    奔    VERB    v,動詞,行為,移動    _    3    ccomp    _    _
5    風    風    NOUN    n,名詞,天象,気象    _    4    obj    _    _

# text = 白日無留陰
1    白    白    NOUN    n,名詞,描写,形質    _    2    nmod    _    _
2    日    日    NOUN    n,名詞,時,*    Case=Tem    4    nsubj    _    _
3    無    無    ADV    v,動詞,存在,存在    Polarity=Neg|VerbForm=Conv    4    advmod    _    _
4    留    留    VERB    v,動詞,行為,移動    _    0    root    _    _
5    陰    陰    NOUN    n,名詞,固定物,関係    Degree=Pos    4    obj    _    _

# text = 徐駆
1    徐    徐    ADV    v,動詞,行為,態度    VerbForm=Conv    2    advmod    _    _
2    駆    駆    VERB    v,動詞,行為,動作    _    0    root    _    _

# text = 当大道歩驟
1    当    当    VERB    v,動詞,行為,動作    _    0    root    _    _
2    大    大    VERB    v,動詞,描写,量    Degree=Pos|VerbForm=Part    3    amod    _    _
3    道    道    NOUN    n,名詞,制度,儀礼    _    1    obj    _    _
4    歩    歩    VERB    v,動詞,行為,動作    _    1    nsubj    _    _
5    驟    驟    ADV    v,動詞,描写,態度    AdvType=Tim    4    parataxis    _    _

# text = 中五音
1    中    中    VERB    v,動詞,行為,動作    _    0    root    _    _
2    五    五    NUM    n,数詞,数字,*    _    3    nummod    _    _
3    音    音    NOUN    n,名詞,可搬,伝達    _    1    obj    _    _

# text = 馬雖有四足遅速在吾心六轡応
1    馬    馬    NOUN    n,名詞,主体,動物    _    3    nsubj    _    _
2    雖    雖    ADV    v,副詞,判断,逆接    _    3    advmod    _    _
3    有    有    VERB    v,動詞,存在,存在    _    0    root    _    _
4    四    四    NUM    n,数詞,数字,*    _    5    nummod    _    _
5    足    足    NOUN    n,名詞,不可譲,身体    _    3    obj    _    _
6    遅    遅    ADV    v,動詞,描写,量    VerbForm=Conv    5    advmod    _    _
7    速    速    VERB    v,動詞,描写,量    Degree=Pos    6    flat:vv    _    _
8    在    在    VERB    v,動詞,存在,存在    _    3    parataxis    _    _
9    吾    吾    PRON    n,代名詞,人称,起格    Person=1|PronType=Prs    10    det    _    _
10    心    心    NOUN    n,名詞,不可譲,身体    _    8    obl    _    _
11    六    六    NUM    n,数詞,数字,*    _    12    nummod    _    _
12    轡    轡    NOUN    n,名詞,可搬,道具    _    13    obj    _    _
13    応    応    VERB    v,動詞,行為,交流    _    8    parataxis    _    _

# text = 吾手調和如瑟琴
1    吾    吾    PRON    n,代名詞,人称,起格    Person=1|PronType=Prs    2    det    _    _
2    手    手    NOUN    n,名詞,不可譲,身体    _    3    nsubj    _    _
3    調    調    VERB    v,動詞,行為,動作    _    5    csubj    _    _
4    和    和    VERB    v,動詞,描写,形質    Degree=Pos    3    flat:vv    _    _
5    如    如    VERB    v,動詞,行為,分類    Degree=Equ    0    root    _    _
6    瑟    瑟    NOUN    n,名詞,可搬,道具    _    7    nmod    _    _
7    琴    琴    NOUN    n,名詞,可搬,道具    _    5    obj    _    _

# text = 東西与南北
1    東    東    NOUN    n,名詞,固定物,関係    Case=Loc    2    obl:lmod    _    _
2    西    西    VERB    v,動詞,行為,移動    _    0    root    _    _
3    与    与    ADP    v,前置詞,関係,*    _    5    cc    _    _
4    南    南    NOUN    n,名詞,固定物,関係    Case=Loc    5    obl:lmod    _    _
5    北    北    NOUN    n,名詞,固定物,関係    Case=Loc    2    conj    _    _

# text = 高下山与林
1    高    高    VERB    v,動詞,描写,量    Degree=Pos|VerbForm=Part    3    nsubj    _    _
2    下    下    NOUN    n,名詞,固定物,関係    Case=Loc    1    flat    _    _
3    山    山    NOUN    n,名詞,固定物,地形    Case=Loc    0    root    _    _
4    与    与    ADP    v,前置詞,関係,*    _    5    cc    _    _
5    林    林    NOUN    n,名詞,固定物,地形    Case=Loc    3    conj    _    _

# text = 惟意所欲適九州
1    惟    惟    ADV    v,副詞,範囲,限定    _    2    advmod    _    _
2    意    意    VERB    v,動詞,行為,動作    _    0    root    _    _
3    所    所    PART    p,助詞,接続,体言化    _    4    case    _    _
4    欲    欲    VERB    v,動詞,行為,動作    _    5    nsubj    _    _
5    適    適    VERB    v,動詞,行為,移動    _    2    ccomp    _    _
6    九    九    NUM    n,数詞,数字,*    _    7    nummod    _    _
7    州    州    NOUN    n,名詞,制度,場    Case=Loc    5    obj    _    _

# text = 可周尋至哉
1    可    可    AUX    v,助動詞,可能,*    Mood=Pot    3    aux    _    _
2    周    周    ADV    v,動詞,行為,動作    VerbForm=Conv    3    advmod    _    _
3    尋    尋    ADV    v,動詞,行為,移動    _    0    root    _    _
4    至    至    VERB    v,動詞,行為,移動    _    3    parataxis    _    _
5    哉    哉    PART    p,助詞,句末,*    _    4    discourse:sp    _    _

# text = 人与馬
1    人    人    NOUN    n,名詞,人,人    _    0    root    _    _
2    与    与    ADP    v,前置詞,関係,*    _    3    cc    _    _
3    馬    馬    NOUN    n,名詞,主体,動物    _    1    conj    _    _

# text = 両楽不相侵
1    両    両    ADV    v,副詞,頻度,重複    _    2    advmod    _    _
2    楽    楽    VERB    v,動詞,行為,態度    _    5    advcl    _    _
3    不    不    ADV    v,副詞,否定,無界    Polarity=Neg    5    advmod    _    _
4    相    相    ADV    v,副詞,範囲,共同    _    5    advmod    _    _
5    侵    侵    VERB    v,動詞,行為,交流    _    0    root    _    _

# text = 伯楽識其外
1    伯    伯    PROPN    n,名詞,人,姓氏    NameType=Sur    3    nsubj    _    _
2    楽    楽    PROPN    n,名詞,人,名    NameType=Giv    1    flat    _    _
3    識    識    VERB    v,動詞,行為,動作    _    0    root    _    _
4    其    其    PRON    n,代名詞,人称,起格    Person=3|PronType=Prs    5    det    _    _
5    外    外    NOUN    n,名詞,固定物,関係    Case=Loc    3    obj    _    _

# text = 徒知価千金
1    徒    徒    ADV    v,副詞,範囲,限定    _    2    advmod    _    _
2    知    知    VERB    v,動詞,行為,動作    _    0    root    _    _
3    価    価    VERB    v,動詞,行為,動作    _    2    ccomp    _    _
4    千    千    NUM    n,数詞,数字,*    _    3    nummod    _    _
5    金    金    NOUN    n,名詞,可搬,道具    _    4    clf    _    _

# text = 王良得其性
1    王    王    PROPN    n,名詞,人,姓氏    NameType=Sur    3    nsubj    _    _
2    良    良    PROPN    n,名詞,人,名    NameType=Giv    1    flat    _    _
3    得    得    VERB    v,動詞,行為,得失    _    0    root    _    _
4    其    其    PRON    n,代名詞,人称,起格    Person=3|PronType=Prs    5    det    _    _
5    性    性    NOUN    n,名詞,不可譲,属性    _    3    obj    _    _

# text = 此術固已深
1    此    此    PRON    n,代名詞,指示,*    PronType=Dem    2    det    _    _
2    術    術    NOUN    n,名詞,可搬,伝達    _    5    nsubj    _    _
3    固    固    ADV    v,副詞,判断,確定    _    5    advmod    _    _
4    已    已    ADV    v,副詞,時相,完了    AdvType=Tim|Aspect=Perf    5    advmod    _    _
5    深    深    VERB    v,動詞,描写,量    Degree=Pos    0    root    _    _

# text = 良馬須善馭
1    良    良    VERB    v,動詞,描写,形質    Degree=Pos|VerbForm=Part    2    amod    _    _
2    馬    馬    NOUN    n,名詞,主体,動物    _    5    nsubj    _    _
3    須    須    ADV    v,副詞,時相,緊接    Mood=Des    5    advmod    _    _
4    善    善    ADV    v,動詞,描写,態度    Degree=Pos|VerbForm=Conv    5    advmod    _    _
5    馭    馭    VERB    v,動詞,行為,動作    _    0    root    _    _

# text = 吾言可為箴
1    吾    吾    PRON    n,代名詞,人称,起格    Person=1|PronType=Prs    2    det    _    _
2    言    言    NOUN    n,名詞,可搬,伝達    _    5    nsubj    _    _
3    可    可    AUX    v,助動詞,可能,*    Mood=Pot    5    aux    _    _
4    為    爲    AUX    v,動詞,存在,存在    VerbType=Cop    5    cop    _    _
5    箴    箴    NOUN    n,名詞,可搬,伝達    _    0    root    _    _

ざっと見たところ、Trankitは「吾有千里馬」「毛骨何蕭森」「疾馳如奔風」「白日無留陰」「徐駆」「当大道歩驟」「中五音」「馬雖有四足遅速在吾心六轡応」「吾手調和如瑟琴」「東西与南北」「高下山与林」「惟意所欲適九州」「可周尋至哉」「人与馬」「両楽不相侵」「伯楽識其外」「徒知価千金」「王良得其性」「此術固已深」「良馬須善馭」「吾言可為箴」という風に文切りしていて、もう少し改善してほしいところだ。私の研究グループが開発中のSuPar-Kanbunと比較してみよう。

!pip install suparkanbun 'spacy>=3.0.5'
import suparkanbun
nlp=suparkanbun.load(BERT="roberta-classical-chinese-base-char",Danku=True)
doc=nlp("吾有千里馬毛骨何蕭森疾馳如奔風白日無留陰徐駆当大道歩驟中五音馬雖有四足遅速在吾心六轡応吾手調和如瑟琴東西与南北高下山与林惟意所欲適九州可周尋至哉人与馬両楽不相侵伯楽識其外徒知価千金王良得其性此術固已深良馬須善馭吾言可為箴")
print(suparkanbun.to_conllu(doc))

SuPar-Kanbunによる解析結果は、私の手元では以下のようになった。

# text = 吾有千里馬
1    吾    吾    PRON    n,代名詞,人称,起格    Person=1|PronType=Prs    2    nsubj    _    Gloss=[1PRON]|SpaceAfter=No
2    有    有    VERB    v,動詞,存在,存在    _    0    root    _    Gloss=have|SpaceAfter=No
3    千    千    NUM    n,数詞,数字,*    _    5    nummod    _    Gloss=thousand|SpaceAfter=No
4    里    里    NOUN    n,名詞,度量衡,*    NounType=Clf    3    clf    _    Gloss=[distance-unit]|SpaceAfter=No
5    馬    馬    NOUN    n,名詞,主体,動物    _    2    obj    _    Gloss=horse|SpaceAfter=No

# text = 毛骨何蕭森
1    毛    毛    NOUN    n,名詞,不可譲,身体    _    2    nmod    _    Gloss=hair|SpaceAfter=No
2    骨    骨    NOUN    n,名詞,不可譲,身体    _    4    nsubj    _    Gloss=bone|SpaceAfter=No
3    何    何    ADV    v,副詞,疑問,原因    AdvType=Cau    4    advmod    _    Gloss=what|SpaceAfter=No
4    蕭    蕭    VERB    v,動詞,描写,態度    Degree=Pos    0    root    _    Gloss=dreary|SpaceAfter=No
5    森    森    VERB    v,動詞,描写,態度    Degree=Pos    4    compound:redup    _    SpaceAfter=No

# text = 疾馳如奔風
1    疾    疾    VERB    v,動詞,行為,態度    _    2    advmod    _    Gloss=hurried|SpaceAfter=No
2    馳    馳    VERB    v,動詞,行為,移動    _    3    csubj    _    Gloss=gallop|SpaceAfter=No
3    如    如    VERB    v,動詞,行為,分類    Degree=Equ    0    root    _    Gloss=be-like|SpaceAfter=No
4    奔    奔    VERB    v,動詞,行為,移動    _    3    ccomp    _    Gloss=run|SpaceAfter=No
5    風    風    NOUN    n,名詞,天象,気象    _    4    obj    _    Gloss=wind|SpaceAfter=No

# text = 白日無留陰
1    白    白    NOUN    n,名詞,描写,形質    _    2    amod    _    Gloss=white|SpaceAfter=No
2    日    日    NOUN    n,名詞,天象,天文    _    3    obl:tmod    _    Gloss=sun|SpaceAfter=No
3    無    無    VERB    v,動詞,存在,存在    Polarity=Neg    0    root    _    Gloss=not-have|SpaceAfter=No
4    留    留    VERB    v,動詞,行為,移動    _    5    amod    _    Gloss=remain|SpaceAfter=No
5    陰    陰    VERB    v,動詞,描写,形質    Degree=Pos    3    obj    _    Gloss=shade|SpaceAfter=No

# text = 徐駆当大道
1    徐    徐    VERB    v,動詞,行為,態度    _    3    nsubj    _    Gloss=slow|SpaceAfter=No
2    駆    驅    VERB    v,動詞,行為,動作    _    1    flat    _    SpaceAfter=No
3    当    當    VERB    v,動詞,行為,動作    _    0    root    _    Gloss=correspond-to|SpaceAfter=No
4    大    大    VERB    v,動詞,描写,量    Degree=Pos    5    amod    _    Gloss=big|SpaceAfter=No
5    道    道    NOUN    n,名詞,固定物,建造物    Case=Loc    3    obj    _    Gloss=road|SpaceAfter=No

# text = 歩驟中五音
1    歩    步    VERB    v,動詞,行為,移動    _    3    nsubj    _    Gloss=walk|SpaceAfter=No
2    驟    驟    VERB    v,動詞,行為,移動    _    1    flat:vv    _    Gloss=gallop|SpaceAfter=No
3    中    中    VERB    v,動詞,行為,動作    _    0    root    _    Gloss=hit|SpaceAfter=No
4    五    五    NUM    n,数詞,数字,*    _    5    nummod    _    Gloss=five|SpaceAfter=No
5    音    音    NOUN    n,名詞,可搬,伝達    _    3    obj    _    Gloss=sound|SpaceAfter=No

# text = 馬雖有四足
1    馬    馬    NOUN    n,名詞,主体,動物    _    3    nsubj    _    Gloss=horse|SpaceAfter=No
2    雖    雖    ADV    v,副詞,判断,逆接    _    3    advmod    _    Gloss=although|SpaceAfter=No
3    有    有    VERB    v,動詞,存在,存在    _    0    root    _    Gloss=have|SpaceAfter=No
4    四    四    NUM    n,数詞,数字,*    _    5    nummod    _    Gloss=four|SpaceAfter=No
5    足    足    NOUN    n,名詞,不可譲,身体    _    3    obj    _    Gloss=foot|SpaceAfter=No

# text = 遅速在吾心
1    遅    遲    VERB    v,動詞,行為,態度    _    3    nsubj    _    Gloss=dilatory|SpaceAfter=No
2    速    速    VERB    v,動詞,描写,量    Degree=Pos    1    flat:vv    _    Gloss=speedy|SpaceAfter=No
3    在    在    VERB    v,動詞,存在,存在    _    0    root    _    Gloss=be-present|SpaceAfter=No
4    吾    吾    PRON    n,代名詞,人称,起格    Person=1|PronType=Prs    5    det    _    Gloss=[1PRON]|SpaceAfter=No
5    心    心    NOUN    n,名詞,不可譲,身体    _    3    obj    _    Gloss=heart|SpaceAfter=No

# text = 六轡応吾手
1    六    六    NUM    n,数詞,数字,*    _    2    nummod    _    Gloss=six|SpaceAfter=No
2    轡    轡    NOUN    n,名詞,可搬,道具    _    3    nsubj    _    Gloss=bridle|SpaceAfter=No
3    応    應    VERB    v,動詞,描写,態度    Degree=Pos    0    root    _    SpaceAfter=No
4    吾    吾    PRON    n,代名詞,人称,起格    Person=1|PronType=Prs    5    det    _    Gloss=[1PRON]|SpaceAfter=No
5    手    手    NOUN    n,名詞,不可譲,身体    _    3    obj    _    Gloss=hand|SpaceAfter=No

# text = 調和如瑟琴
1    調    調    VERB    v,動詞,行為,動作    _    3    nsubj    _    Gloss=tune|SpaceAfter=No
2    和    和    VERB    v,動詞,描写,形質    Degree=Pos    1    flat:vv    _    Gloss=harmonious|SpaceAfter=No
3    如    如    VERB    v,動詞,行為,分類    Degree=Equ    0    root    _    Gloss=be-like|SpaceAfter=No
4    瑟    瑟    NOUN    n,名詞,可搬,道具    _    3    obj    _    Gloss=zither|SpaceAfter=No
5    琴    琴    NOUN    n,名詞,可搬,道具    _    4    conj    _    Gloss=zither|SpaceAfter=No

# text = 東西与南北
1    東    東    NOUN    n,名詞,固定物,関係    Case=Loc    0    root    _    Gloss=east|SpaceAfter=No
2    西    西    NOUN    n,名詞,固定物,関係    Case=Loc    1    conj    _    Gloss=west|SpaceAfter=No
3    与    與    ADP    v,前置詞,関係,*    _    4    cc    _    Gloss=associate-with|SpaceAfter=No
4    南    南    NOUN    n,名詞,固定物,関係    Case=Loc    1    conj    _    Gloss=south|SpaceAfter=No
5    北    北    NOUN    n,名詞,固定物,関係    Case=Loc    4    conj    _    Gloss=north|SpaceAfter=No

# text = 高下山与林
1    高    高    VERB    v,動詞,描写,量    Degree=Pos    2    advmod    _    Gloss=high|SpaceAfter=No
2    下    下    VERB    v,動詞,行為,動作    _    0    root    _    Gloss=go-down|SpaceAfter=No
3    山    山    NOUN    n,名詞,固定物,地形    Case=Loc    2    obj    _    Gloss=mountain|SpaceAfter=No
4    与    與    ADP    v,前置詞,関係,*    _    5    cc    _    Gloss=associate-with|SpaceAfter=No
5    林    林    NOUN    n,名詞,固定物,地形    Case=Loc    3    conj    _    Gloss=woods|SpaceAfter=No

# text = 惟意所欲適
1    惟    惟    ADV    v,副詞,範囲,限定    _    5    advmod    _    Gloss=only|SpaceAfter=No
2    意    意    VERB    v,動詞,行為,動作    _    5    nsubj    _    Gloss=think|SpaceAfter=No
3    所    所    PART    p,助詞,接続,体言化    _    5    mark    _    Gloss=that-which|SpaceAfter=No
4    欲    欲    VERB    v,動詞,行為,動作    _    5    aux    _    Gloss=desire|SpaceAfter=No
5    適    適    VERB    v,動詞,行為,移動    _    0    root    _    Gloss=go-to|SpaceAfter=No

# text = 九州可周尋
1    九    九    NUM    n,数詞,数字,*    _    2    nummod    _    Gloss=nine|SpaceAfter=No
2    州    州    NOUN    n,名詞,制度,場    Case=Loc    4    nsubj    _    Gloss=region|SpaceAfter=No
3    可    可    AUX    v,助動詞,可能,*    Mood=Pot    4    aux    _    Gloss=possible|SpaceAfter=No
4    周    周    VERB    v,動詞,行為,動作    _    0    root    _    Gloss=circuit|SpaceAfter=No
5    尋    尋    NOUN    n,名詞,数量,*    _    4    flat:vv    _    SpaceAfter=No

# text = 至哉人与馬
1    至    至    VERB    v,動詞,行為,移動    _    0    root    _    Gloss=arrive|SpaceAfter=No
2    哉    哉    PART    p,助詞,句末,*    _    1    discourse:sp    _    Gloss=[exclamatory-particle]|SpaceAfter=No
3    人    人    NOUN    n,名詞,人,人    _    1    nsubj    _    Gloss=person|SpaceAfter=No
4    与    與    ADP    v,前置詞,関係,*    _    5    cc    _    Gloss=associate-with|SpaceAfter=No
5    馬    馬    NOUN    n,名詞,主体,動物    _    3    conj    _    Gloss=horse|SpaceAfter=No

# text = 両楽不相侵
1    両    兩    NOUN    n,名詞,数量,*    _    2    nmod    _    Gloss=pair|SpaceAfter=No
2    楽    樂    NOUN    n,名詞,固定物,関係    Case=Loc    5    nsubj    _    SpaceAfter=No
3    不    不    ADV    v,副詞,否定,無界    Polarity=Neg    5    advmod    _    Gloss=not|SpaceAfter=No
4    相    相    ADV    v,副詞,範囲,共同    _    5    advmod    _    Gloss=each-other|SpaceAfter=No
5    侵    侵    VERB    v,動詞,行為,交流    _    0    root    _    Gloss=invade|SpaceAfter=No

# text = 伯楽識其外
1    伯楽    伯樂    PROPN    n,名詞,人,名    NameType=Giv    2    nsubj    _    Gloss=[given-name]|SpaceAfter=No
2    識    識    VERB    v,動詞,行為,動作    _    0    root    _    Gloss=recognize|SpaceAfter=No
3    其    其    PRON    n,代名詞,人称,起格    Person=3|PronType=Prs    4    det    _    Gloss=[3PRON]|SpaceAfter=No
4    外    外    NOUN    n,名詞,固定物,関係    Case=Loc    2    obj    _    Gloss=outside|SpaceAfter=No

# text = 徒知価千金
1    徒    徒    ADV    v,副詞,範囲,限定    _    2    advmod    _    Gloss=only|SpaceAfter=No
2    知    知    VERB    v,動詞,行為,動作    _    0    root    _    Gloss=know|SpaceAfter=No
3    価    價    NOUN    n,名詞,時,*    Case=Tem    2    ccomp    _    SpaceAfter=No
4    千    千    NUM    n,数詞,数字,*    _    5    nummod    _    Gloss=thousand|SpaceAfter=No
5    金    金    NOUN    n,名詞,可搬,道具    _    3    obj    _    Gloss=metal|SpaceAfter=No

# text = 王良得其性
1    王    王    PROPN    n,名詞,人,姓氏    NameType=Sur    3    nsubj    _    Gloss=[surname]|SpaceAfter=No
2    良    良    PROPN    n,名詞,人,名    NameType=Giv    1    flat    _    Gloss=[given-name]|SpaceAfter=No
3    得    得    VERB    v,動詞,行為,得失    _    0    root    _    Gloss=get|SpaceAfter=No
4    其    其    PRON    n,代名詞,人称,起格    Person=3|PronType=Prs    5    det    _    Gloss=[3PRON]|SpaceAfter=No
5    性    性    NOUN    n,名詞,不可譲,属性    _    3    obj    _    Gloss=nature|SpaceAfter=No

# text = 此術固已深
1    此    此    PRON    n,代名詞,指示,*    PronType=Dem    2    det    _    Gloss=this|SpaceAfter=No
2    術    術    NOUN    n,名詞,可搬,伝達    _    5    nsubj    _    Gloss=skill|SpaceAfter=No
3    固    固    ADV    v,副詞,判断,確定    _    5    advmod    _    Gloss=certainly|SpaceAfter=No
4    已    已    ADV    v,副詞,時相,完了    AdvType=Tim|Aspect=Perf    5    advmod    _    Gloss=already|SpaceAfter=No
5    深    深    VERB    v,動詞,描写,量    Degree=Pos    0    root    _    Gloss=deep|SpaceAfter=No

# text = 良馬須善馭
1    良    良    VERB    v,動詞,描写,形質    Degree=Pos    2    amod    _    Gloss=good|SpaceAfter=No
2    馬    馬    NOUN    n,名詞,主体,動物    _    5    nsubj    _    Gloss=horse|SpaceAfter=No
3    須    須    AUX    v,助動詞,必要,*    Mood=Nec    5    aux    _    Gloss=need|SpaceAfter=No
4    善    善    VERB    v,動詞,描写,態度    Degree=Pos    5    advmod    _    Gloss=good|SpaceAfter=No
5    馭    馭    VERB    v,動詞,行為,動作    _    0    root    _    Gloss=drive-a-carriage|SpaceAfter=No

# text = 吾言可為箴
1    吾    吾    PRON    n,代名詞,人称,起格    Person=1|PronType=Prs    2    det    _    Gloss=[1PRON]|SpaceAfter=No
2    言    言    NOUN    n,名詞,可搬,伝達    _    4    nsubj    _    Gloss=speech|SpaceAfter=No
3    可    可    AUX    v,助動詞,可能,*    Mood=Pot    4    aux    _    Gloss=possible|SpaceAfter=No
4    為    爲    VERB    v,動詞,行為,生産    _    0    root    _    Gloss=make|SpaceAfter=No
5    箴    箴    NOUN    n,名詞,可搬,伝達    _    4    obj    _    Gloss=remonstrance|SpaceAfter=No

係り受けの解析ミスはあるものの、SuPar-Kanbunの文切りは完璧だ。文切りがうまくいかないと、係り受け解析にも悪影響が出るので、このあたりは非常に重要だったりする。まあ、roberta-classical-chinese-base-charの方が、XML-RoBERTaよりも、古典中国語については強力だということだろう。古典中国語の解析については、ぜひSuPar-Kanbunを使ってほしい。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

人生unstable -- あるハッカー

読み込み中...