yasuokaの日記: 古典中国語(漢文)解析ツールとしてのTrankitとSuPar-Kanbun
昨日の日記で紹介したTrankitの言語モデル一覧を眺めていたところ、古典中国語モデル(Classical_Chinese-Kyoto)が含まれているのに気づいた。ただ、XLM-RoBERTaの100言語には、古典中国語は含まれていない(cf.『Unsupervised Cross-lingual Representation Learning at Scale』)はずなので、文切りの精度が上がるとも思えない。とりあえず、Google Colaboratoryで試してみることにした。
!pip install trankit transformers torch
import trankit
nlp=trankit.Pipeline("classical-chinese",embedding="xlm-roberta-large")
doc=nlp("吾有千里馬毛骨何蕭森疾馳如奔風白日無留陰徐駆当大道歩驟中五音馬雖有四足遅速在吾心六轡応吾手調和如瑟琴東西与南北高下山与林惟意所欲適九州可周尋至哉人与馬両楽不相侵伯楽識其外徒知価千金王良得其性此術固已深良馬須善馭吾言可為箴")
from trankit.utils.conll import CoNLL
for s in doc["sentences"]:
print("# text = "+s["text"])
print(CoNLL.conll_as_string(CoNLL.convert_dict([s["tokens"]])),end="")
1月16日の共通テスト『国語』第4問【問題文I】を、Trankitで文切り・形態素解析・係り受け解析してみたところ、私(安岡孝一)の手元では、以下の結果となった。
# text = 吾有千里馬
1 吾 吾 PRON n,代名詞,人称,起格 Person=1|PronType=Prs 2 nsubj _ _
2 有 有 VERB v,動詞,存在,存在 _ 0 root _ _
3 千 千 NUM n,数詞,数字,* _ 5 nummod _ _
4 里 里 NOUN n,名詞,度量衡,* NounType=Class 3 clf _ _
5 馬 馬 NOUN n,名詞,主体,動物 _ 2 obj _ _
# text = 毛骨何蕭森
1 毛 毛 NOUN n,名詞,不可譲,身体 _ 4 nsubj _ _
2 骨 骨 NOUN n,名詞,不可譲,身体 _ 1 conj _ _
3 何 何 ADV v,副詞,疑問,原因 AdvType=Cau 4 advmod _ _
4 蕭 蕭 VERB v,動詞,描写,態度 Degree=Pos 0 root _ _
5 森 森 VERB n,名詞,固定物,地形 Degree=Pos 4 flat:vv _ _
# text = 疾馳如奔風
1 疾 疾 NOUN n,名詞,不可譲,疾病 _ 2 obl _ _
2 馳 馳 VERB v,動詞,行為,移動 _ 3 csubj _ _
3 如 如 VERB v,動詞,行為,分類 Degree=Equ 0 root _ _
4 奔 奔 VERB v,動詞,行為,移動 _ 3 ccomp _ _
5 風 風 NOUN n,名詞,天象,気象 _ 4 obj _ _
# text = 白日無留陰
1 白 白 NOUN n,名詞,描写,形質 _ 2 nmod _ _
2 日 日 NOUN n,名詞,時,* Case=Tem 4 nsubj _ _
3 無 無 ADV v,動詞,存在,存在 Polarity=Neg|VerbForm=Conv 4 advmod _ _
4 留 留 VERB v,動詞,行為,移動 _ 0 root _ _
5 陰 陰 NOUN n,名詞,固定物,関係 Degree=Pos 4 obj _ _
# text = 徐駆
1 徐 徐 ADV v,動詞,行為,態度 VerbForm=Conv 2 advmod _ _
2 駆 駆 VERB v,動詞,行為,動作 _ 0 root _ _
# text = 当大道歩驟
1 当 当 VERB v,動詞,行為,動作 _ 0 root _ _
2 大 大 VERB v,動詞,描写,量 Degree=Pos|VerbForm=Part 3 amod _ _
3 道 道 NOUN n,名詞,制度,儀礼 _ 1 obj _ _
4 歩 歩 VERB v,動詞,行為,動作 _ 1 nsubj _ _
5 驟 驟 ADV v,動詞,描写,態度 AdvType=Tim 4 parataxis _ _
# text = 中五音
1 中 中 VERB v,動詞,行為,動作 _ 0 root _ _
2 五 五 NUM n,数詞,数字,* _ 3 nummod _ _
3 音 音 NOUN n,名詞,可搬,伝達 _ 1 obj _ _
# text = 馬雖有四足遅速在吾心六轡応
1 馬 馬 NOUN n,名詞,主体,動物 _ 3 nsubj _ _
2 雖 雖 ADV v,副詞,判断,逆接 _ 3 advmod _ _
3 有 有 VERB v,動詞,存在,存在 _ 0 root _ _
4 四 四 NUM n,数詞,数字,* _ 5 nummod _ _
5 足 足 NOUN n,名詞,不可譲,身体 _ 3 obj _ _
6 遅 遅 ADV v,動詞,描写,量 VerbForm=Conv 5 advmod _ _
7 速 速 VERB v,動詞,描写,量 Degree=Pos 6 flat:vv _ _
8 在 在 VERB v,動詞,存在,存在 _ 3 parataxis _ _
9 吾 吾 PRON n,代名詞,人称,起格 Person=1|PronType=Prs 10 det _ _
10 心 心 NOUN n,名詞,不可譲,身体 _ 8 obl _ _
11 六 六 NUM n,数詞,数字,* _ 12 nummod _ _
12 轡 轡 NOUN n,名詞,可搬,道具 _ 13 obj _ _
13 応 応 VERB v,動詞,行為,交流 _ 8 parataxis _ _
# text = 吾手調和如瑟琴
1 吾 吾 PRON n,代名詞,人称,起格 Person=1|PronType=Prs 2 det _ _
2 手 手 NOUN n,名詞,不可譲,身体 _ 3 nsubj _ _
3 調 調 VERB v,動詞,行為,動作 _ 5 csubj _ _
4 和 和 VERB v,動詞,描写,形質 Degree=Pos 3 flat:vv _ _
5 如 如 VERB v,動詞,行為,分類 Degree=Equ 0 root _ _
6 瑟 瑟 NOUN n,名詞,可搬,道具 _ 7 nmod _ _
7 琴 琴 NOUN n,名詞,可搬,道具 _ 5 obj _ _
# text = 東西与南北
1 東 東 NOUN n,名詞,固定物,関係 Case=Loc 2 obl:lmod _ _
2 西 西 VERB v,動詞,行為,移動 _ 0 root _ _
3 与 与 ADP v,前置詞,関係,* _ 5 cc _ _
4 南 南 NOUN n,名詞,固定物,関係 Case=Loc 5 obl:lmod _ _
5 北 北 NOUN n,名詞,固定物,関係 Case=Loc 2 conj _ _
# text = 高下山与林
1 高 高 VERB v,動詞,描写,量 Degree=Pos|VerbForm=Part 3 nsubj _ _
2 下 下 NOUN n,名詞,固定物,関係 Case=Loc 1 flat _ _
3 山 山 NOUN n,名詞,固定物,地形 Case=Loc 0 root _ _
4 与 与 ADP v,前置詞,関係,* _ 5 cc _ _
5 林 林 NOUN n,名詞,固定物,地形 Case=Loc 3 conj _ _
# text = 惟意所欲適九州
1 惟 惟 ADV v,副詞,範囲,限定 _ 2 advmod _ _
2 意 意 VERB v,動詞,行為,動作 _ 0 root _ _
3 所 所 PART p,助詞,接続,体言化 _ 4 case _ _
4 欲 欲 VERB v,動詞,行為,動作 _ 5 nsubj _ _
5 適 適 VERB v,動詞,行為,移動 _ 2 ccomp _ _
6 九 九 NUM n,数詞,数字,* _ 7 nummod _ _
7 州 州 NOUN n,名詞,制度,場 Case=Loc 5 obj _ _
# text = 可周尋至哉
1 可 可 AUX v,助動詞,可能,* Mood=Pot 3 aux _ _
2 周 周 ADV v,動詞,行為,動作 VerbForm=Conv 3 advmod _ _
3 尋 尋 ADV v,動詞,行為,移動 _ 0 root _ _
4 至 至 VERB v,動詞,行為,移動 _ 3 parataxis _ _
5 哉 哉 PART p,助詞,句末,* _ 4 discourse:sp _ _
# text = 人与馬
1 人 人 NOUN n,名詞,人,人 _ 0 root _ _
2 与 与 ADP v,前置詞,関係,* _ 3 cc _ _
3 馬 馬 NOUN n,名詞,主体,動物 _ 1 conj _ _
# text = 両楽不相侵
1 両 両 ADV v,副詞,頻度,重複 _ 2 advmod _ _
2 楽 楽 VERB v,動詞,行為,態度 _ 5 advcl _ _
3 不 不 ADV v,副詞,否定,無界 Polarity=Neg 5 advmod _ _
4 相 相 ADV v,副詞,範囲,共同 _ 5 advmod _ _
5 侵 侵 VERB v,動詞,行為,交流 _ 0 root _ _
# text = 伯楽識其外
1 伯 伯 PROPN n,名詞,人,姓氏 NameType=Sur 3 nsubj _ _
2 楽 楽 PROPN n,名詞,人,名 NameType=Giv 1 flat _ _
3 識 識 VERB v,動詞,行為,動作 _ 0 root _ _
4 其 其 PRON n,代名詞,人称,起格 Person=3|PronType=Prs 5 det _ _
5 外 外 NOUN n,名詞,固定物,関係 Case=Loc 3 obj _ _
# text = 徒知価千金
1 徒 徒 ADV v,副詞,範囲,限定 _ 2 advmod _ _
2 知 知 VERB v,動詞,行為,動作 _ 0 root _ _
3 価 価 VERB v,動詞,行為,動作 _ 2 ccomp _ _
4 千 千 NUM n,数詞,数字,* _ 3 nummod _ _
5 金 金 NOUN n,名詞,可搬,道具 _ 4 clf _ _
# text = 王良得其性
1 王 王 PROPN n,名詞,人,姓氏 NameType=Sur 3 nsubj _ _
2 良 良 PROPN n,名詞,人,名 NameType=Giv 1 flat _ _
3 得 得 VERB v,動詞,行為,得失 _ 0 root _ _
4 其 其 PRON n,代名詞,人称,起格 Person=3|PronType=Prs 5 det _ _
5 性 性 NOUN n,名詞,不可譲,属性 _ 3 obj _ _
# text = 此術固已深
1 此 此 PRON n,代名詞,指示,* PronType=Dem 2 det _ _
2 術 術 NOUN n,名詞,可搬,伝達 _ 5 nsubj _ _
3 固 固 ADV v,副詞,判断,確定 _ 5 advmod _ _
4 已 已 ADV v,副詞,時相,完了 AdvType=Tim|Aspect=Perf 5 advmod _ _
5 深 深 VERB v,動詞,描写,量 Degree=Pos 0 root _ _
# text = 良馬須善馭
1 良 良 VERB v,動詞,描写,形質 Degree=Pos|VerbForm=Part 2 amod _ _
2 馬 馬 NOUN n,名詞,主体,動物 _ 5 nsubj _ _
3 須 須 ADV v,副詞,時相,緊接 Mood=Des 5 advmod _ _
4 善 善 ADV v,動詞,描写,態度 Degree=Pos|VerbForm=Conv 5 advmod _ _
5 馭 馭 VERB v,動詞,行為,動作 _ 0 root _ _
# text = 吾言可為箴
1 吾 吾 PRON n,代名詞,人称,起格 Person=1|PronType=Prs 2 det _ _
2 言 言 NOUN n,名詞,可搬,伝達 _ 5 nsubj _ _
3 可 可 AUX v,助動詞,可能,* Mood=Pot 5 aux _ _
4 為 爲 AUX v,動詞,存在,存在 VerbType=Cop 5 cop _ _
5 箴 箴 NOUN n,名詞,可搬,伝達 _ 0 root _ _
ざっと見たところ、Trankitは「吾有千里馬」「毛骨何蕭森」「疾馳如奔風」「白日無留陰」「徐駆」「当大道歩驟」「中五音」「馬雖有四足遅速在吾心六轡応」「吾手調和如瑟琴」「東西与南北」「高下山与林」「惟意所欲適九州」「可周尋至哉」「人与馬」「両楽不相侵」「伯楽識其外」「徒知価千金」「王良得其性」「此術固已深」「良馬須善馭」「吾言可為箴」という風に文切りしていて、もう少し改善してほしいところだ。私の研究グループが開発中のSuPar-Kanbunと比較してみよう。
!pip install suparkanbun 'spacy>=3.0.5'
import suparkanbun
nlp=suparkanbun.load(BERT="roberta-classical-chinese-base-char",Danku=True)
doc=nlp("吾有千里馬毛骨何蕭森疾馳如奔風白日無留陰徐駆当大道歩驟中五音馬雖有四足遅速在吾心六轡応吾手調和如瑟琴東西与南北高下山与林惟意所欲適九州可周尋至哉人与馬両楽不相侵伯楽識其外徒知価千金王良得其性此術固已深良馬須善馭吾言可為箴")
print(suparkanbun.to_conllu(doc))
SuPar-Kanbunによる解析結果は、私の手元では以下のようになった。
# text = 吾有千里馬
1 吾 吾 PRON n,代名詞,人称,起格 Person=1|PronType=Prs 2 nsubj _ Gloss=[1PRON]|SpaceAfter=No
2 有 有 VERB v,動詞,存在,存在 _ 0 root _ Gloss=have|SpaceAfter=No
3 千 千 NUM n,数詞,数字,* _ 5 nummod _ Gloss=thousand|SpaceAfter=No
4 里 里 NOUN n,名詞,度量衡,* NounType=Clf 3 clf _ Gloss=[distance-unit]|SpaceAfter=No
5 馬 馬 NOUN n,名詞,主体,動物 _ 2 obj _ Gloss=horse|SpaceAfter=No
# text = 毛骨何蕭森
1 毛 毛 NOUN n,名詞,不可譲,身体 _ 2 nmod _ Gloss=hair|SpaceAfter=No
2 骨 骨 NOUN n,名詞,不可譲,身体 _ 4 nsubj _ Gloss=bone|SpaceAfter=No
3 何 何 ADV v,副詞,疑問,原因 AdvType=Cau 4 advmod _ Gloss=what|SpaceAfter=No
4 蕭 蕭 VERB v,動詞,描写,態度 Degree=Pos 0 root _ Gloss=dreary|SpaceAfter=No
5 森 森 VERB v,動詞,描写,態度 Degree=Pos 4 compound:redup _ SpaceAfter=No
# text = 疾馳如奔風
1 疾 疾 VERB v,動詞,行為,態度 _ 2 advmod _ Gloss=hurried|SpaceAfter=No
2 馳 馳 VERB v,動詞,行為,移動 _ 3 csubj _ Gloss=gallop|SpaceAfter=No
3 如 如 VERB v,動詞,行為,分類 Degree=Equ 0 root _ Gloss=be-like|SpaceAfter=No
4 奔 奔 VERB v,動詞,行為,移動 _ 3 ccomp _ Gloss=run|SpaceAfter=No
5 風 風 NOUN n,名詞,天象,気象 _ 4 obj _ Gloss=wind|SpaceAfter=No
# text = 白日無留陰
1 白 白 NOUN n,名詞,描写,形質 _ 2 amod _ Gloss=white|SpaceAfter=No
2 日 日 NOUN n,名詞,天象,天文 _ 3 obl:tmod _ Gloss=sun|SpaceAfter=No
3 無 無 VERB v,動詞,存在,存在 Polarity=Neg 0 root _ Gloss=not-have|SpaceAfter=No
4 留 留 VERB v,動詞,行為,移動 _ 5 amod _ Gloss=remain|SpaceAfter=No
5 陰 陰 VERB v,動詞,描写,形質 Degree=Pos 3 obj _ Gloss=shade|SpaceAfter=No
# text = 徐駆当大道
1 徐 徐 VERB v,動詞,行為,態度 _ 3 nsubj _ Gloss=slow|SpaceAfter=No
2 駆 驅 VERB v,動詞,行為,動作 _ 1 flat _ SpaceAfter=No
3 当 當 VERB v,動詞,行為,動作 _ 0 root _ Gloss=correspond-to|SpaceAfter=No
4 大 大 VERB v,動詞,描写,量 Degree=Pos 5 amod _ Gloss=big|SpaceAfter=No
5 道 道 NOUN n,名詞,固定物,建造物 Case=Loc 3 obj _ Gloss=road|SpaceAfter=No
# text = 歩驟中五音
1 歩 步 VERB v,動詞,行為,移動 _ 3 nsubj _ Gloss=walk|SpaceAfter=No
2 驟 驟 VERB v,動詞,行為,移動 _ 1 flat:vv _ Gloss=gallop|SpaceAfter=No
3 中 中 VERB v,動詞,行為,動作 _ 0 root _ Gloss=hit|SpaceAfter=No
4 五 五 NUM n,数詞,数字,* _ 5 nummod _ Gloss=five|SpaceAfter=No
5 音 音 NOUN n,名詞,可搬,伝達 _ 3 obj _ Gloss=sound|SpaceAfter=No
# text = 馬雖有四足
1 馬 馬 NOUN n,名詞,主体,動物 _ 3 nsubj _ Gloss=horse|SpaceAfter=No
2 雖 雖 ADV v,副詞,判断,逆接 _ 3 advmod _ Gloss=although|SpaceAfter=No
3 有 有 VERB v,動詞,存在,存在 _ 0 root _ Gloss=have|SpaceAfter=No
4 四 四 NUM n,数詞,数字,* _ 5 nummod _ Gloss=four|SpaceAfter=No
5 足 足 NOUN n,名詞,不可譲,身体 _ 3 obj _ Gloss=foot|SpaceAfter=No
# text = 遅速在吾心
1 遅 遲 VERB v,動詞,行為,態度 _ 3 nsubj _ Gloss=dilatory|SpaceAfter=No
2 速 速 VERB v,動詞,描写,量 Degree=Pos 1 flat:vv _ Gloss=speedy|SpaceAfter=No
3 在 在 VERB v,動詞,存在,存在 _ 0 root _ Gloss=be-present|SpaceAfter=No
4 吾 吾 PRON n,代名詞,人称,起格 Person=1|PronType=Prs 5 det _ Gloss=[1PRON]|SpaceAfter=No
5 心 心 NOUN n,名詞,不可譲,身体 _ 3 obj _ Gloss=heart|SpaceAfter=No
# text = 六轡応吾手
1 六 六 NUM n,数詞,数字,* _ 2 nummod _ Gloss=six|SpaceAfter=No
2 轡 轡 NOUN n,名詞,可搬,道具 _ 3 nsubj _ Gloss=bridle|SpaceAfter=No
3 応 應 VERB v,動詞,描写,態度 Degree=Pos 0 root _ SpaceAfter=No
4 吾 吾 PRON n,代名詞,人称,起格 Person=1|PronType=Prs 5 det _ Gloss=[1PRON]|SpaceAfter=No
5 手 手 NOUN n,名詞,不可譲,身体 _ 3 obj _ Gloss=hand|SpaceAfter=No
# text = 調和如瑟琴
1 調 調 VERB v,動詞,行為,動作 _ 3 nsubj _ Gloss=tune|SpaceAfter=No
2 和 和 VERB v,動詞,描写,形質 Degree=Pos 1 flat:vv _ Gloss=harmonious|SpaceAfter=No
3 如 如 VERB v,動詞,行為,分類 Degree=Equ 0 root _ Gloss=be-like|SpaceAfter=No
4 瑟 瑟 NOUN n,名詞,可搬,道具 _ 3 obj _ Gloss=zither|SpaceAfter=No
5 琴 琴 NOUN n,名詞,可搬,道具 _ 4 conj _ Gloss=zither|SpaceAfter=No
# text = 東西与南北
1 東 東 NOUN n,名詞,固定物,関係 Case=Loc 0 root _ Gloss=east|SpaceAfter=No
2 西 西 NOUN n,名詞,固定物,関係 Case=Loc 1 conj _ Gloss=west|SpaceAfter=No
3 与 與 ADP v,前置詞,関係,* _ 4 cc _ Gloss=associate-with|SpaceAfter=No
4 南 南 NOUN n,名詞,固定物,関係 Case=Loc 1 conj _ Gloss=south|SpaceAfter=No
5 北 北 NOUN n,名詞,固定物,関係 Case=Loc 4 conj _ Gloss=north|SpaceAfter=No
# text = 高下山与林
1 高 高 VERB v,動詞,描写,量 Degree=Pos 2 advmod _ Gloss=high|SpaceAfter=No
2 下 下 VERB v,動詞,行為,動作 _ 0 root _ Gloss=go-down|SpaceAfter=No
3 山 山 NOUN n,名詞,固定物,地形 Case=Loc 2 obj _ Gloss=mountain|SpaceAfter=No
4 与 與 ADP v,前置詞,関係,* _ 5 cc _ Gloss=associate-with|SpaceAfter=No
5 林 林 NOUN n,名詞,固定物,地形 Case=Loc 3 conj _ Gloss=woods|SpaceAfter=No
# text = 惟意所欲適
1 惟 惟 ADV v,副詞,範囲,限定 _ 5 advmod _ Gloss=only|SpaceAfter=No
2 意 意 VERB v,動詞,行為,動作 _ 5 nsubj _ Gloss=think|SpaceAfter=No
3 所 所 PART p,助詞,接続,体言化 _ 5 mark _ Gloss=that-which|SpaceAfter=No
4 欲 欲 VERB v,動詞,行為,動作 _ 5 aux _ Gloss=desire|SpaceAfter=No
5 適 適 VERB v,動詞,行為,移動 _ 0 root _ Gloss=go-to|SpaceAfter=No
# text = 九州可周尋
1 九 九 NUM n,数詞,数字,* _ 2 nummod _ Gloss=nine|SpaceAfter=No
2 州 州 NOUN n,名詞,制度,場 Case=Loc 4 nsubj _ Gloss=region|SpaceAfter=No
3 可 可 AUX v,助動詞,可能,* Mood=Pot 4 aux _ Gloss=possible|SpaceAfter=No
4 周 周 VERB v,動詞,行為,動作 _ 0 root _ Gloss=circuit|SpaceAfter=No
5 尋 尋 NOUN n,名詞,数量,* _ 4 flat:vv _ SpaceAfter=No
# text = 至哉人与馬
1 至 至 VERB v,動詞,行為,移動 _ 0 root _ Gloss=arrive|SpaceAfter=No
2 哉 哉 PART p,助詞,句末,* _ 1 discourse:sp _ Gloss=[exclamatory-particle]|SpaceAfter=No
3 人 人 NOUN n,名詞,人,人 _ 1 nsubj _ Gloss=person|SpaceAfter=No
4 与 與 ADP v,前置詞,関係,* _ 5 cc _ Gloss=associate-with|SpaceAfter=No
5 馬 馬 NOUN n,名詞,主体,動物 _ 3 conj _ Gloss=horse|SpaceAfter=No
# text = 両楽不相侵
1 両 兩 NOUN n,名詞,数量,* _ 2 nmod _ Gloss=pair|SpaceAfter=No
2 楽 樂 NOUN n,名詞,固定物,関係 Case=Loc 5 nsubj _ SpaceAfter=No
3 不 不 ADV v,副詞,否定,無界 Polarity=Neg 5 advmod _ Gloss=not|SpaceAfter=No
4 相 相 ADV v,副詞,範囲,共同 _ 5 advmod _ Gloss=each-other|SpaceAfter=No
5 侵 侵 VERB v,動詞,行為,交流 _ 0 root _ Gloss=invade|SpaceAfter=No
# text = 伯楽識其外
1 伯楽 伯樂 PROPN n,名詞,人,名 NameType=Giv 2 nsubj _ Gloss=[given-name]|SpaceAfter=No
2 識 識 VERB v,動詞,行為,動作 _ 0 root _ Gloss=recognize|SpaceAfter=No
3 其 其 PRON n,代名詞,人称,起格 Person=3|PronType=Prs 4 det _ Gloss=[3PRON]|SpaceAfter=No
4 外 外 NOUN n,名詞,固定物,関係 Case=Loc 2 obj _ Gloss=outside|SpaceAfter=No
# text = 徒知価千金
1 徒 徒 ADV v,副詞,範囲,限定 _ 2 advmod _ Gloss=only|SpaceAfter=No
2 知 知 VERB v,動詞,行為,動作 _ 0 root _ Gloss=know|SpaceAfter=No
3 価 價 NOUN n,名詞,時,* Case=Tem 2 ccomp _ SpaceAfter=No
4 千 千 NUM n,数詞,数字,* _ 5 nummod _ Gloss=thousand|SpaceAfter=No
5 金 金 NOUN n,名詞,可搬,道具 _ 3 obj _ Gloss=metal|SpaceAfter=No
# text = 王良得其性
1 王 王 PROPN n,名詞,人,姓氏 NameType=Sur 3 nsubj _ Gloss=[surname]|SpaceAfter=No
2 良 良 PROPN n,名詞,人,名 NameType=Giv 1 flat _ Gloss=[given-name]|SpaceAfter=No
3 得 得 VERB v,動詞,行為,得失 _ 0 root _ Gloss=get|SpaceAfter=No
4 其 其 PRON n,代名詞,人称,起格 Person=3|PronType=Prs 5 det _ Gloss=[3PRON]|SpaceAfter=No
5 性 性 NOUN n,名詞,不可譲,属性 _ 3 obj _ Gloss=nature|SpaceAfter=No
# text = 此術固已深
1 此 此 PRON n,代名詞,指示,* PronType=Dem 2 det _ Gloss=this|SpaceAfter=No
2 術 術 NOUN n,名詞,可搬,伝達 _ 5 nsubj _ Gloss=skill|SpaceAfter=No
3 固 固 ADV v,副詞,判断,確定 _ 5 advmod _ Gloss=certainly|SpaceAfter=No
4 已 已 ADV v,副詞,時相,完了 AdvType=Tim|Aspect=Perf 5 advmod _ Gloss=already|SpaceAfter=No
5 深 深 VERB v,動詞,描写,量 Degree=Pos 0 root _ Gloss=deep|SpaceAfter=No
# text = 良馬須善馭
1 良 良 VERB v,動詞,描写,形質 Degree=Pos 2 amod _ Gloss=good|SpaceAfter=No
2 馬 馬 NOUN n,名詞,主体,動物 _ 5 nsubj _ Gloss=horse|SpaceAfter=No
3 須 須 AUX v,助動詞,必要,* Mood=Nec 5 aux _ Gloss=need|SpaceAfter=No
4 善 善 VERB v,動詞,描写,態度 Degree=Pos 5 advmod _ Gloss=good|SpaceAfter=No
5 馭 馭 VERB v,動詞,行為,動作 _ 0 root _ Gloss=drive-a-carriage|SpaceAfter=No
# text = 吾言可為箴
1 吾 吾 PRON n,代名詞,人称,起格 Person=1|PronType=Prs 2 det _ Gloss=[1PRON]|SpaceAfter=No
2 言 言 NOUN n,名詞,可搬,伝達 _ 4 nsubj _ Gloss=speech|SpaceAfter=No
3 可 可 AUX v,助動詞,可能,* Mood=Pot 4 aux _ Gloss=possible|SpaceAfter=No
4 為 爲 VERB v,動詞,行為,生産 _ 0 root _ Gloss=make|SpaceAfter=No
5 箴 箴 NOUN n,名詞,可搬,伝達 _ 4 obj _ Gloss=remonstrance|SpaceAfter=No
係り受けの解析ミスはあるものの、SuPar-Kanbunの文切りは完璧だ。文切りがうまくいかないと、係り受け解析にも悪影響が出るので、このあたりは非常に重要だったりする。まあ、roberta-classical-chinese-base-charの方が、XML-RoBERTaよりも、古典中国語については強力だということだろう。古典中国語の解析については、ぜひSuPar-Kanbunを使ってほしい。
古典中国語(漢文)解析ツールとしてのTrankitとSuPar-Kanbun More ログイン