パスワードを忘れた? アカウント作成
14007583 journal
中国

yasuokaの日記: 古典中国語(漢文)の文切りエンジン「古詩文斷句」

日記 by yasuoka

ネットサーフィンしていたところ、「讓AI一口氣讀完《四庫全書》會怎樣?」(章黃國學、2019年8月14日)という記事を見つけた。北京師範大学の胡韌奮・李紳・諸雨辰が制作した「古詩文斷句」という古典中国語(漢文)の文切りエンジンの紹介で、どうやらBERTを古典中国語に適用したもののようだ。とりあえず、令和の元ネタ「天平二年正月十三日萃于帥老之宅申宴會也于時初春令月氣淑風和梅披鏡前之粉蘭薰珮後之香加以曙嶺移雲松掛羅而傾盖夕岫結霧鳥封縠而迷林庭舞新蝶空歸故鴈於是盖天坐地促膝飛觴忘言一室之裏開衿煙霞之外淡然自放快然自足若非翰苑何以攄情詩紀落梅之篇古今夫何異矣宜賦園梅聊成短詠」を文切りさせてみた。

天平二年正月十三日 〇 萃于帥老之宅 〇 申宴會也 〇 于時初春令月 〇 氣淑風和 〇 梅披鏡前之粉 〇 蘭薰珮後之香 〇 加以曙嶺移雲 〇 松掛羅而傾盖 〇 夕岫結霧 〇 鳥封縠而迷林 〇 庭舞新蝶 〇 空歸故鴈 〇 於是盖天坐地 〇 促膝飛觴 〇 忘言一室之裏 〇 開衿煙霞之外 〇 淡然自放 〇 快然自足 〇 若非翰苑 〇 何以攄情 〇 詩紀落梅之篇 〇 古今夫何異矣 〇 宜賦園梅 〇 聊成短詠 〇

完璧だ。ものすごい。どうして一ヶ所も間違ってないんだ。ならば、2019年センター試験「嗚呼哀哉有兄子曰甫制服於斯紀徳於斯刻石於斯或曰豈孝童之猶子与奚孝義之勤若此甫泣而対曰非敢当是也亦為報也甫昔臥病於我諸姑姑之子又病問女巫巫曰処楹之東南隅者吉姑遂易子之地以安我我用是存而姑之子卒後乃知之於走使甫嘗有説於人客将出涕感者久之相与定諡曰義君子以為魯義姑者遇暴客於郊抱其所携棄其所抱以割私愛県君有焉是以挙茲一隅昭彼百行銘而不韻蓋情至無文其詞曰嗚呼有唐義姑京兆杜氏之墓」を文切りさせてみよう。

嗚呼哀哉 〇 有兄子曰甫 〇 制服於斯 〇 紀徳於斯 〇 刻石於斯 〇 或曰 〇 豈孝童之猶子与 〇 奚孝義之勤若此 〇 甫泣而対曰 〇 非敢当是也 〇 亦為報也 〇 甫昔臥病於我諸姑 〇 姑之子又病 〇 問女巫 〇 巫曰 〇 処楹之東南隅者吉 〇 姑遂易子之地以安我 〇 我用是存 〇 而姑之子卒後 〇 乃知之於走使 〇 甫嘗有説於人 〇 客将出涕 〇 感者久之 〇 相与定諡曰義 〇 君子以為魯義姑者 〇 遇暴客於郊 〇 抱其所携 〇 棄其所抱 〇 以割私愛 〇 県君有焉 〇 是以挙茲一隅 〇 昭彼百行 〇 銘而不韻 〇 蓋情至無文 〇 其詞曰 〇 嗚呼 〇 有唐義姑京兆杜氏之墓 〇

「而姑之子卒」「後乃知之於走使」のところが間違っているが、それ以外は、私(安岡孝一)個人としては納得のいく出来だ。かなりすごい。ただ、上の記事では、仕掛けがイマイチわからない。10月20日のCCL2019で、この3人のポスター発表「基于深层语言模型的古汉语知识表示及自动断句研究」があるみたいなのだけど、うーむ、さすがに昆明理工大学へ聞きにいくのは難しいかなぁ…。

この議論は、yasuoka (21275)によって「 ログインユーザだけ」として作成されている。 ログインしてから来てね。
typodupeerror

アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家

読み込み中...