パスワードを忘れた? アカウント作成

minetさんのトモダチの日記。 あなたのタレコミがスラドを支えます。さぁ、タレこめ!

14233892 journal
人工知能

yasuokaの日記: 「此兩の説僕斷然其與すべからざるを知る」の係り受けは交差しているのか

日記 by yasuoka

Universal Dependencies 2.6のUD_Japanese-Modernをチェックしていたところ、「此兩の説僕斷然其與すべからざるを知る」という文に出くわした。

# sent_id = 1-o_yo-61
# text = 此兩の説僕斷然其與すべからざるを知る
1    此    此    PRON    連体詞    _    4    nmod    _    BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|LUWBILabel=B|LUWPOS=連体詞|SpaceAfter=No
2    兩    兩    NUM    名詞-数詞    _    4    nmod    _    BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|LUWBILabel=B|LUWPOS=名詞-数詞|SpaceAfter=No
3    の    の    ADP    助詞-格助詞    _    2    case    _    BunsetuBILabel=I|BunsetuPositionType=SYN_HEAD|LUWBILabel=B|LUWPOS=助詞-格助詞|SpaceAfter=No
4    説    説    NOUN    名詞-普通名詞-一般    _    8    iobj    _    BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|LUWBILabel=B|LUWPOS=名詞-普通名詞-一般|SpaceAfter=No
5    僕    僕    PRON    代名詞    _    12    iobj    _    BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|LUWBILabel=B|LUWPOS=代名詞|SpaceAfter=No
6    斷然    斷然    ADV    副詞    _    8    advmod    _    BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|LUWBILabel=B|LUWPOS=副詞|SpaceAfter=No
7    其    其    PRON    連体詞    _    8    nmod    _    BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|LUWBILabel=B|LUWPOS=連体詞|SpaceAfter=No
8    與す    與す    VERB    動詞-一般    _    12    obj    _    BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|LUWBILabel=B|LUWPOS=動詞-一般|SpaceAfter=No
9    べから    べし    AUX    助動詞    _    8    aux    _    BunsetuBILabel=I|BunsetuPositionType=FUNC|LUWBILabel=B|LUWPOS=助動詞|SpaceAfter=No
10    ざる    ず    AUX    助動詞    Polarity=Neg    8    aux    _    BunsetuBILabel=I|BunsetuPositionType=FUNC|LUWBILabel=B|LUWPOS=助動詞|SpaceAfter=No
11    を    を    ADP    助詞-格助詞    _    8    case    _    BunsetuBILabel=I|BunsetuPositionType=SYN_HEAD|LUWBILabel=B|LUWPOS=助詞-格助詞|SpaceAfter=No
12    知る    知る    VERB    動詞-一般    _    0    root    _    BunsetuBILabel=B|BunsetuPositionType=ROOT|LUWBILabel=B|LUWPOS=動詞-一般|SpaceAfter=No

見たところ、係り受けが交差している。deplacyで構文木にしてみよう。

此     PRON <════╗           nmod(体言による連体修飾語)
兩     NUM  ═╗<╗ ║           nmod(体言による連体修飾語)
の     ADP  <╝ ║ ║           case(格表示)
説     NOUN ═══╝═╝<════╗     iobj(間接目的語)
僕     PRON <══════════║═══╗ iobj(間接目的語)
斷然   ADV  <════════╗ ║   ║ advmod(連用修飾語)
其     PRON <══════╗ ║ ║   ║ nmod(体言による連体修飾語)
與す   VERB ═╗═╗═╗═╝═╝═╝<╗ ║ obj(目的語)
べから AUX  <╝ ║ ║       ║ ║ aux(動詞補助成分)
ざる   AUX  <══╝ ║       ║ ║ aux(動詞補助成分)
を     ADP  <════╝       ║ ║ case(格表示)
知る   VERB ═════════════╝═╝ root(親)

「説⇐iobj=與す」と「僕⇐iobj=知る」が、見事に交差しているのがわかる。ただ、係り受けの種類はiobj(間接目的語)ではなく、nsubj(主語)かobl(斜格補語)かdislocated(外置語)の方が、私(安岡孝一)には適切に思える。ちょっとだけ書き換えてみよう。

此     PRON <════╗           nmod(体言による連体修飾語)
兩     NUM  ═╗<╗ ║           nmod(体言による連体修飾語)
の     ADP  <╝ ║ ║           case(格表示)
説     NOUN ═══╝═╝<════╗     dislocated(外置語)
僕     PRON <══════════║═══╗ nsubj(主語)
斷然   ADV  <════════╗ ║   ║ advmod(連用修飾語)
其     PRON <══════╗ ║ ║   ║ obl(斜格補語)
與す   VERB ═╗═╗═╗═╝═╝═╝<╗ ║ ccomp(節目的語)
べから AUX  <╝ ║ ║       ║ ║ aux(動詞補助成分)
ざる   AUX  <══╝ ║       ║ ║ aux(動詞補助成分)
を     ADP  <════╝       ║ ║ case(格表示)
知る   VERB ═════════════╝═╝ root(親)

こうやって見ると、以前に議論した「うなぎを浜松に食べに行く」とは、また微妙に異なる形のようだ。近代日本語における係り受け解析を、もう少し細かいところまで見ておかないとダメかなぁ。

14232641 journal
人工知能

yasuokaの日記: UniDic2UDと近代文語UniDicで読むアマビエ

日記 by yasuoka

ウチの大学のアマビエが話題になっていたらしいので、近代文語UniDicUniDic2UDの助けを借りつつ、ざっと私(安岡孝一)なりに係り受け解析してみた。

1    肥後    ヒゴ    PROPN    名詞-固有名詞-地名-一般    _    2    compound    _    SpaceAfter=No|Translit=ヒゴ
2    國    国    NOUN    接尾辞-名詞的-一般    _    3    nmod    _    SpaceAfter=No|Translit=コク
3    海中    海中    NOUN    名詞-普通名詞-一般    _    7    obl    _    SpaceAfter=No|Translit=カイチュウ
4    江    へ    ADP    助詞-格助詞    _    3    case    _    SpaceAfter=No|Translit=ヘ
5    毎夜    毎夜    NOUN    名詞-普通名詞-副詞可能    _    7    obl    _    SpaceAfter=No|Translit=マイヨ
6    光物    光り物    NOUN    名詞-普通名詞-一般    _    7    nsubj    _    SpaceAfter=No|Translit=ヒカリモノ
7    出ル    出る    VERB    動詞-一般    _    0    root    _    SpaceAfter=No|Translit=デル

1    所    所    NOUN    名詞-普通名詞-副詞可能    _    3    nmod    _    SpaceAfter=No|Translit=トコロ
2    之    の    ADP    助詞-格助詞    _    1    case    _    SpaceAfter=No|Translit=ノ
3    役人    役人    NOUN    名詞-普通名詞-一般    _    5    nsubj    _    SpaceAfter=No|Translit=ヤクニン
4    行    行く    VERB    動詞-非自立可能    _    5    advcl    _    Translit=ユキ
5    見る    見る    VERB    動詞-非自立可能    _    11    advcl    _    SpaceAfter=No|Translit=ミル
6    ニ    に    CCONJ    助詞-接続助詞    _    5    mark    _    SpaceAfter=No|Translit=ニ
7    づ    図    NOUN    名詞-普通名詞-一般    _    10    nmod    _    SpaceAfter=No|Translit=ズ
8    の    の    ADP    助詞-格助詞    _    7    case    _    SpaceAfter=No|Translit=ノ
9    如く    ごとし    AUX    助動詞    _    7    aux    _    SpaceAfter=No|Translit=ゴトク
10    者    者    NOUN    名詞-普通名詞-一般    _    11    nsubj    _    SpaceAfter=No|Translit=モノ
11    現ス    現わす    VERB    動詞-一般    _    0    root    _    SpaceAfter=No|Translit=アラワス

1    私    私    PRON    代名詞    _    8    nsubj    _    SpaceAfter=No|Translit=ワタクシ
2    ハ    は    ADP    助詞-係助詞    _    1    case    _    SpaceAfter=No|Translit=ハ
3    海中    海中    NOUN    名詞-普通名詞-一般    _    5    obl    _    SpaceAfter=No|Translit=カイチュウ
4    ニ    に    ADP    助詞-格助詞    _    3    case    _    SpaceAfter=No|Translit=ニ
5    住    住む    VERB    動詞-一般    _    6    acl    _    SpaceAfter=No|Translit=スム
6    アマビヱ    アマビエ    NOUN    名詞-普通名詞-一般    _    8    obl    _    SpaceAfter=No|Translit=アマビエ
7    ト    と    ADP    助詞-格助詞    _    6    case    _    SpaceAfter=No|Translit=ト
8    申    申す    VERB    動詞-非自立可能    _    9    acl    _    Translit=モウス
9    者    者    NOUN    名詞-普通名詞-一般    _    0    root    _    SpaceAfter=No|Translit=モノ
10    也    なり    AUX    助動詞    _    9    cop    _    SpaceAfter=No|Translit=ナリ

1    當年    当年    NOUN    名詞-普通名詞-一般    _    4    nmod    _    SpaceAfter=No|Translit=トウネン
2    より    より    ADP    助詞-格助詞    _    1    case    _    SpaceAfter=No|Translit=ヨリ
3    六    六    NUM    名詞-数詞    _    4    nummod    _    SpaceAfter=No|Translit=ロク
4    ヶ年    箇年    NOUN    名詞-普通名詞-助数詞可能    _    6    nmod    _    SpaceAfter=No|Translit=カネン
5    之    の    ADP    助詞-格助詞    _    4    case    _    SpaceAfter=No|Translit=ノ
6    間    間    NOUN    名詞-普通名詞-副詞可能    _    8    advmod    _    SpaceAfter=No|Translit=アイダ
7    諸國    諸国    NOUN    名詞-普通名詞-一般    _    8    nsubj    _    SpaceAfter=No|Translit=ショコク
8    豊作    豊作    NOUN    名詞-普通名詞-一般    _    0    root    _    SpaceAfter=No|Translit=ホウサク
9    也    なり    AUX    助動詞    _    8    cop    _    SpaceAfter=No|Translit=ナリ

1    併    然し    CCONJ    接続詞    _    3    advmod    _    Translit=シカシ
2    病    病    NOUN    名詞-普通名詞-一般    _    3    nsubj    _    SpaceAfter=No|Translit=ヤマイ
3    流行    流行    VERB    名詞-普通名詞-サ変可能    _    0    root    _    SpaceAfter=No|Translit=リュウコウ

1    早々    早々    NOUN    名詞-普通名詞-副詞可能    _    4    advmod    _    SpaceAfter=No|Translit=ソウソウ
2    私    私    PRON    代名詞    _    4    obj    _    SpaceAfter=No|Translit=ワタクシ
3    ヲ    を    ADP    助詞-格助詞    _    2    case    _    SpaceAfter=No|Translit=ヲ
4    写シ    写す    VERB    動詞-一般    _    8    advcl    _    SpaceAfter=No|Translit=ウツシ
5    人々    人々    NOUN    名詞-普通名詞-一般    _    7    obl    _    SpaceAfter=No|Translit=ヒトビト
6    ニ    に    ADP    助詞-格助詞    _    5    case    _    SpaceAfter=No|Translit=ニ
7    見セ    見せる    VERB    動詞-非自立可能    _    8    advcl    _    SpaceAfter=No|Translit=ミセ
8    候得    候う    VERB    動詞-非自立可能    _    10    ccomp    _    SpaceAfter=No|Translit=ソウラヘ
9    と    と    ADP    助詞-格助詞    _    8    mark    _    Translit=ト
10    申    申す    VERB    動詞-非自立可能    _    14    advcl    _    SpaceAfter=No|Translit=モウシ
11    て    て    SCONJ    助詞-接続助詞    _    10    mark    _    SpaceAfter=No|Translit=テ
12    海中    海中    NOUN    名詞-普通名詞-一般    _    14    obl    _    SpaceAfter=No|Translit=カイチュウ
13    ヘ    へ    ADP    助詞-格助詞    _    12    case    _    SpaceAfter=No|Translit=ヘ
14    入    入る    VERB    動詞-一般    _    0    root    _    SpaceAfter=No|Translit=イリ
15    けり    けり    AUX    助動詞    _    14    aux    _    SpaceAfter=No|Translit=ケリ

1    右    右    NOUN    名詞-普通名詞-一般    _    10    nsubj    _    SpaceAfter=No|Translit=ミギ
2    ハ    は    ADP    助詞-係助詞    _    1    case    _    SpaceAfter=No|Translit=ハ
3    写シ    写す    VERB    動詞-一般    _    4    acl    _    SpaceAfter=No|Translit=ウツシ
4    役人    役人    NOUN    名詞-普通名詞-一般    _    9    obl    _    SpaceAfter=No|Translit=ヤクニン
5    より    より    ADP    助詞-格助詞    _    4    case    _    SpaceAfter=No|Translit=ヨリ
6    江戸    エド    PROPN    名詞-固有名詞-地名-一般    _    9    obl    _    SpaceAfter=No|Translit=エド
7    江    へ    ADP    助詞-格助詞    _    6    case    _    Translit=ヘ
8    申    申す    VERB    動詞-非自立可能    _    9    advcl    _    SpaceAfter=No|Translit=モウシ
9    來ル    来たる    VERB    動詞-非自立可能    _    10    acl    _    SpaceAfter=No|Translit=キタル
10    写    写し    NOUN    名詞-普通名詞-一般    _    0    root    _    SpaceAfter=No|Translit=ウツシ
11    也    なり    AUX    助動詞    _    10    cop    _    Translit=ナリ

1    弘化    弘化    PROPN    名詞-固有名詞-一般    _    3    compound    _    SpaceAfter=No|Translit=コウカ
2    三    三    NUM    名詞-数詞    _    3    nummod    _    SpaceAfter=No|Translit=サン
3    年    年    NOUN    名詞-普通名詞-助数詞可能    _    5    nmod    _    SpaceAfter=No|Translit=ネン
4    四    四    NUM    名詞-数詞    _    5    nummod    _    SpaceAfter=No|Translit=シ
5    月    月    NOUN    名詞-普通名詞-助数詞可能    _    6    nmod    _    SpaceAfter=No|Translit=ガツ
6    中旬    中旬    NOUN    名詞-普通名詞-副詞可能    _    0    root    _    Translit=チュウジュン

さらに直接構成鎖解析をおこなって、deplacyで構文木にしてみた。

肥後     PROPN <╗               compound(複合)
國       NOUN  ═╝<╗             nmod(体言による連体修飾語)
海中     NOUN  ═╗═╝<╗           obl(斜格補語)
江       ADP   <╝   ║           case(格表示)
毎夜     NOUN  <══╗ ║           obl(斜格補語)
光物     NOUN  <╗ ║ ║           nsubj(主語)
出ル     VERB  ═╝═╝═╝           root(親)

所       NOUN  ═╗<╗             nmod(体言による連体修飾語)
之       ADP   <╝ ║             case(格表示)
役人     NOUN  ═══╝<╗           nsubj(主語)
行       VERB  <╗   ║           advcl(連用修飾節)
見る     VERB  ═╝═══╝═╗<╗       advcl(連用修飾節)
ニ       CCONJ <══════╝ ║       mark(標識)
づ       NOUN  ═╗═╗<╗   ║       nmod(体言による連体修飾語)
の       ADP   <╝ ║ ║   ║       case(格表示)
如く     AUX   <══╝ ║   ║       aux(動詞補助成分)
者       NOUN  ═════╝<╗ ║       nsubj(主語)
現ス     VERB  ═══════╝═╝       root(親)

私       PRON  ═╗<══════╗       nsubj(主語)
ハ       ADP   <╝       ║       case(格表示)
海中     NOUN  ═╗<╗     ║       obl(斜格補語)
ニ       ADP   <╝ ║     ║       case(格表示)
住       VERB  ═══╝<╗   ║       acl(連体修飾節)
アマビヱ NOUN  ═╗═══╝<╗ ║       obl(斜格補語)
ト       ADP   <╝     ║ ║       case(格表示)
申       VERB  ═══════╝═╝<╗     acl(連体修飾節)
者       NOUN  ═╗═════════╝     root(親)
也       AUX   <╝               cop(繫辞)

當年     NOUN  ═╗<══╗           nmod(体言による連体修飾語)
より     ADP   <╝   ║           case(格表示)
六       NUM   <══╗ ║           nummod(数量による修飾語)
ヶ年     NOUN  ═╗═╝═╝<╗         nmod(体言による連体修飾語)
之       ADP   <╝     ║         case(格表示)
間       NOUN  ═══════╝<╗       advmod(連用修飾語)
諸國     NOUN  <══╗     ║       nsubj(主語)
豊作     NOUN  ═╗═╝═════╝       root(親)
也       AUX   <╝               cop(繫辞)

併       CCONJ <══╗             advmod(連用修飾語)
病       NOUN  <╗ ║             nsubj(主語)
流行     VERB  ═╝═╝             root(親)

早々     NOUN  <════╗           advmod(連用修飾語)
私       PRON  ═╗<╗ ║           obj(目的語)
ヲ       ADP   <╝ ║ ║           case(格表示)
写シ     VERB  ═══╝═╝<╗         advcl(連用修飾節)
人々     NOUN  ═╗<╗   ║         obl(斜格補語)
ニ       ADP   <╝ ║   ║         case(格表示)
見セ     VERB  ═══╝<╗ ║         advcl(連用修飾節)
候得     VERB  ═════╝═╝═╗<╗     ccomp(節目的語)
と       ADP   <════════╝ ║     mark(標識)
申       VERB  ═══════════╝═╗<╗ advcl(連用修飾節)
て       SCONJ <════════════╝ ║ mark(標識)
海中     NOUN  ═╗<╗           ║ obl(斜格補語)
ヘ       ADP   <╝ ║           ║ case(格表示)
入       VERB  ═╗═╝═══════════╝ root(親)
けり     AUX   <╝               aux(動詞補助成分)

右       NOUN  ═╗<══════╗       nsubj(主語)
ハ       ADP   <╝       ║       case(格表示)
写シ     VERB  <══╗     ║       acl(連体修飾節)
役人     NOUN  ═╗═╝<╗   ║       obl(斜格補語)
より     ADP   <╝   ║   ║       case(格表示)
江戸     PROPN ═╗<╗ ║   ║       obl(斜格補語)
江       ADP   <╝ ║ ║   ║       case(格表示)
申       VERB  <╗ ║ ║   ║       advcl(連用修飾節)
來ル     VERB  ═╝═╝═╝<╗ ║       acl(連体修飾節)
写       NOUN  ═╗═════╝═╝       root(親)
也       AUX   <╝               cop(繫辞)

弘化     PROPN <══╗             compound(複合)
三       NUM   <╗ ║             nummod(数量による修飾語)
年       NOUN  ═╝═╝<╗           nmod(体言による連体修飾語)
四       NUM   <╗   ║           nummod(数量による修飾語)
月       NOUN  ═╝═══╝<╗         nmod(体言による連体修飾語)
中旬     NOUN  ═══════╝         root(親)

ただ、現状のUniDic2UDは、句読点なしに文の切れ目を探すことができないので、そこは手作業でおこなった。さて、近代日本語における文の切れ目って、どうやって探せばいいんだろ。

14230047 journal
中国

yasuokaの日記: オガネソンの中文名称とその字形

日記 by yasuoka

私(安岡孝一)の2017年12月8日の日記の読者から、「元素の漢字周期表」というサイトをお教えいただいた。ざっと見てみたのだが、どうもOg(オガネソン)の「台湾正体」字形と「香港繁体」字形が、いずれも一画たりない気がする。Ogの中文名称「鿫」は、中国では「⿹气奥」だが、台湾では「⿹气奧」となるらしく、JTC1/SC2/WG2 N4922のU+9FEB追加でも、中国字形と台湾字形が併記される結果となったのだ。で、Ogの「香港繁体」は「台湾正体」に従ったはずなのだが、さて、今後の香港は、どうなっていくのだろう。

14223316 journal
日本

yasuokaの日記: 馬島太郎の『芙蓉会報』原稿

日記 by yasuoka

愛媛県立松山中学校芙蓉会『芙蓉会報』第17号(昭和37年10月)のpp.81-121に、馬島太郎の追悼特集が掲載されているとの情報をいただいたので、愛媛県立図書館えひめ資料室に、山本冨次郎文庫[ヤマK37-26-10]を閲覧に来た。追悼特集冒頭の「馬島太郎翁略歴」(p.81)を、ざっと引用しておくことにする。

明治二十三年六月二十七日 熊本市ニ生ル
本籍地 松山市北歩行町九番地
幼稚園 熊本市山崎幼稚園
小学校 新潟県新発田猿橋小学校
高等小学校 福岡県小倉市 及 松山市
中学校 松山中学校(明治四十三年)
慶応義塾 理財科予科病気中途退学
大正四年 財団法人電機学校ニ就職助教授(英語)
   副幹事(会計)幹事(経理部長)
   法人監事トナリ病気引退嘱託トナル

昭和三十七年
静窓院心誉学念正道居士
六月二十七日

なお、昭和37年6月27日は告別式の日であり、訃報については、山本冨次郎「無名の老篤学者 馬島太郎さんの死を悼む」(pp.102-104)が、こう書いている。

畏友、馬島太郎氏(横須賀市在住、松山市出身)の突然の訃報が、けさもたらされて、私は一瞬、暗然とならざるを得なかった。七十三歳、宿痾加療中、一たん回復退院後わずか三日目の去る六月二十四日午前一時半に急逝せられたそうである。
愛媛タイムスの古き愛読者であり、また寄稿家であった。本紙に、さき頃から「週間ニュース」欄が設けられたのも、実は同氏の発案によるのである。
年齢は私より長じてはいたが、松山中学在学当時の学生グループ「芙蓉会」時代この方、先輩後輩の親しい間柄であった。この芙蓉会の会員は、今全国に散在しているが現存者約三十数名、松中卒業後四、五十年に近い今日でも友愛に結ばれた交遊はずっと変ることなく、毎年春秋二回、豪華なる会誌を発刊交流しつつ随時随所に旧情を温めているという。近頃珍しい老人クラブ的存在だ。京浜、京阪神その他各地の政財界、法曹界、学会で活躍中の有名なる一流メンバーも多く含まれている。悲しくも今、その一人が失われたのである。
馬島氏は、一昨年の末頃“X'masは誤りでXmasが正しい”と喝破して、あの“アポストロフ(')”の有無の正否について論断を下し、全国の新聞に発表、学界や業界に時ならぬ旋風をまき起したその人である。

なお、山本冨次郎文庫[ヤマK37-26-1]~[ヤマK37-26-10]を読む限り、『芙蓉会報』は第2号以降毎号、馬島太郎の原稿を掲載しているようだ。私(安岡孝一)が把握できた原稿を一覧にしておくので、他に情報をお持ちの方は、ぜひ知らせてほしい。

  • 想ひ出とおわび, 芙蓉の花咲く頃, 昭和30年再会記念号[第2号](昭和31年11月3日).
  • 井蛙妄言(1), 芙蓉会報, 新年号[第3号](昭和32年1月).
  • 井蛙妄言(2), 芙蓉会報, 春分号[第4号](昭和32年3月).
  • 飽痴眠申す, 芙蓉会報, 七夕号[第5号](昭和32年7月).
  • 横須賀の長町, 芙蓉会報, 秋分号[第6号](昭和32年9月).
  • 寺小屋の和尚, 芙蓉会報, 新年号[第7号](昭和33年1月1日), pp.8-11.
  • 名物の味, 芙蓉会報, 春分号[第8号](昭和33年3月).
  • 残暑御見舞申上候, 芙蓉会報, 秋分号[第9号](昭和33年11月3日), pp.30-32.
  • 近来稀なりし正月, 芙蓉会報, 春分号[第10号](昭和34年4月1日), pp.1-4.
  • 幸運な松山行, 芙蓉会報, 秋分号[第11号](昭和34年10月31日), pp.14-16.
  • 足許から鳥が立つ, 芙蓉会報, 春分号[第12号](昭和35年6月).
  • 紙に就いての無駄話, 芙蓉会報, 秋分号[第13号](昭和35年9月), pp.34-37.
  • 幼時の思い出(1), 芙蓉会報, 秋分号[第15号](昭和36年9月), pp.43-46.
  • 幼時の思い出(2), 芙蓉会報, 第16号(昭和37年6月5日), pp.14-19.
  • 私の近況特報, 芙蓉会報, 第16号(昭和37年6月5日), p.20-22.
  • 電機学校回顧, 芙蓉会報, 第17号(昭和37年10月), pp.82-83.
14221433 journal
日本

yasuokaの日記: 「頭が赤い魚を試す猫」における6通りの解釈 2

日記 by yasuoka

昨日の日記の「頭が赤い魚を食べる猫」に対して、「頭が赤い魚」をコピュラ節とみなすのは無理なのではないか、という趣旨の御意見を複数いただいた。私(安岡孝一)自身「日本語としてはヤリ過ぎ」と書いた通り、確かに無理があると思う。どこに無理があるかを検討すべく、動詞の「食べる」を「試す」に変えて、「頭が赤い魚を試す猫」をUniDic2UD 2.1.5でやってみよう。

>>> import unidic2ud
>>> ja=unidic2ud.load()
>>> doc=ja("頭が赤い魚を試す猫")
>>> print(doc.to_tree())
  頭 ═╗<╗       nsubj(主語)
  が <╝ ║       case(格表示)
赤い ═══╝<╗     acl(連体修飾節)
  魚 ═╦═══╝<╗   obj(目的語)
  を <╝     ║   case(格表示)
試す ═══════╝<╗ acl(連体修飾節)
  猫 ═════════╝ root(親)

「頭が」⇐nsubj=「赤い」⇐acl=「魚」と解析されていて、元の図の2番目と同じ構造だ。「赤い」の修飾先を付け替えてみよう。

>>> doc[3].head=7
>>> print(doc.to_tree())
  頭 ═╗<╗   nsubj(主語)
  が <╝ ║   case(格表示)
赤い ═══╝<╗ acl(連体修飾節)
  魚 ═╗<╗ ║ obj(目的語)
  を <╝ ║ ║ case(格表示)
試す ═══╝<╣ acl(連体修飾節)
  猫 ═════╝ root(親)

「頭が」⇐nsubj=「赤い」⇐acl=「猫」で、元の図の1番目と同じ構造だ。「頭が」を付け替えてみよう。

>>> doc[1].head=7
>>> print(doc.to_tree())
  頭 ═╗<══╗ nsubj(主語)
  が <╝   ║ case(格表示)
赤い <════╣ acl(連体修飾節)
  魚 ═╗<╗ ║ obj(目的語)
  を <╝ ║ ║ case(格表示)
試す ═══╝<╣ acl(連体修飾節)
  猫 ═════╝ root(親)

「頭が」⇐nsubj=「猫」というコピュラ文で、元の図の5番目と同じ構造だ。「赤い」を戻してみよう。

>>> doc[3].head=4
>>> print(doc.to_tree())
  頭 ═╗<══╗ nsubj(主語)
  が <╝   ║ case(格表示)
赤い <╗   ║ acl(連体修飾節)
  魚 ═╣<╗ ║ obj(目的語)
  を <╝ ║ ║ case(格表示)
試す ═══╝<╣ acl(連体修飾節)
  猫 ═════╝ root(親)

このコピュラ文は、元の図の4番目と同じ構造だ。「頭が」を「試す」の主語にしてみよう。

>>> doc[1].head=6
>>> print(doc.to_tree())
  頭 ═╗<╗   nsubj(主語)
  が <╝ ║   case(格表示)
赤い <╗ ║   acl(連体修飾節)
  魚 ═╣<╣   obj(目的語)
  を <╝ ║   case(格表示)
試す ═══╝<╗ acl(連体修飾節)
  猫 ═════╝ root(親)

これは元の図の3番目と同じ構造だ。それでは「頭が」を「魚」の主語にしてみよう。

>>> doc[1].head=4
>>> print(doc.to_tree())
  頭 ═╗<╗     nsubj(主語)
  が <╝ ║     case(格表示)
赤い <╗ ║     acl(連体修飾節)
  魚 ═╬═╝<╗   obj(目的語)
  を <╝   ║   case(格表示)
試す ═════╝<╗ acl(連体修飾節)
  猫 ═══════╝ root(親)

これは元の図には無い。「頭が」⇐nsubj=「魚」というコピュラ節は、「試す」という動詞の目的語としては、そこまでグロテスクにはならない気がする。というか、「食べる」という動詞が、動作主体と目的語の間で排他的傾向を持ちやすい、という点で、そもそもドギツ過ぎるのだろうと思う。

14220410 journal
日本

yasuokaの日記: 「頭が赤い魚を食べる猫」における6通りの解釈 1

日記 by yasuoka

「頭が赤い魚を食べる猫」を係り受け解析していて、どうも私(安岡孝一)には6通りの解釈が可能な気がしてきた。まあ、日本語としてはヤリ過ぎなのだが、少し悪ノリしてUniDic2UD 2.1.5でやってみよう。

>>> import unidic2ud
>>> ja=unidic2ud.load()
>>> doc=ja("頭が赤い魚を食べる猫")
>>> print(doc.to_tree())
    頭 ═╗<╗       nsubj(主語)
    が <╝ ║       case(格表示)
  赤い ═══╝<╗     acl(連体修飾節)
    魚 ═╦═══╝<╗   obj(目的語)
    を <╝     ║   case(格表示)
食べる ═══════╝<╗ acl(連体修飾節)
    猫 ═════════╝ root(親)

「頭が」⇐nsubj=「赤い」⇐acl=「魚」と解析されていて、元の図では2番目にあたる。「赤い」の修飾先を付け替えてみよう。

>>> doc[3].head=7
>>> print(doc.to_tree())
    頭 ═╗<╗   nsubj(主語)
    が <╝ ║   case(格表示)
  赤い ═══╝<╗ acl(連体修飾節)
    魚 ═╗<╗ ║ obj(目的語)
    を <╝ ║ ║ case(格表示)
食べる ═══╝<╣ acl(連体修飾節)
    猫 ═════╝ root(親)

「頭が」⇐nsubj=「赤い」⇐acl=「猫」で、元の図では1番目にあたる。「頭が」を付け替えてみよう。

>>> doc[1].head=7
>>> print(doc.to_tree())
    頭 ═╗<══╗ nsubj(主語)
    が <╝   ║ case(格表示)
  赤い <════╣ acl(連体修飾節)
    魚 ═╗<╗ ║ obj(目的語)
    を <╝ ║ ║ case(格表示)
食べる ═══╝<╣ acl(連体修飾節)
    猫 ═════╝ root(親)

「頭が」⇐nsubj=「猫」というコピュラ文で、元の図では5番目にあたる。「赤い」を戻してみよう。

>>> doc[3].head=4
>>> print(doc.to_tree())
    頭 ═╗<══╗ nsubj(主語)
    が <╝   ║ case(格表示)
  赤い <╗   ║ acl(連体修飾節)
    魚 ═╣<╗ ║ obj(目的語)
    を <╝ ║ ║ case(格表示)
食べる ═══╝<╣ acl(連体修飾節)
    猫 ═════╝ root(親)

このコピュラ文は、元の図では4番目にあたる。「頭が」を「食べる」の主語にしてみよう。

>>> doc[1].head=6
>>> print(doc.to_tree())
    頭 ═╗<╗   nsubj(主語)
    が <╝ ║   case(格表示)
  赤い <╗ ║   acl(連体修飾節)
    魚 ═╣<╣   obj(目的語)
    を <╝ ║   case(格表示)
食べる ═══╝<╗ acl(連体修飾節)
    猫 ═════╝ root(親)

これは元の図では3番目にあたる。それでは「頭が」を「魚」の主語にしてみよう。

>>> doc[1].head=4
>>> print(doc.to_tree())
    頭 ═╗<╗     nsubj(主語)
    が <╝ ║     case(格表示)
  赤い <╗ ║     acl(連体修飾節)
    魚 ═╬═╝<╗   obj(目的語)
    を <╝   ║   case(格表示)
食べる ═════╝<╗ acl(連体修飾節)
    猫 ═══════╝ root(親)

これは元の図には無い。「頭が」⇐nsubj=「魚」というコピュラ節は、確かに図示するにはグロテスクだが、図の4・5番目で「頭が」⇐nsubj=「猫」を扱っている以上、「頭が」⇐nsubj=「魚」を扱わない手は無いように思う。

14218310 journal
人工知能

yasuokaの日記: spaCyの日本語モデルで旧字旧仮名の係り受け解析

日記 by yasuoka

昨日の日記の続きだが、spaCyの日本語モデルで「國境の長いトンネルを拔けると、そこは雪國であつた。」を係り受け解析してみることにした。大中小の日本語モデルのうち、さすがに小のモデルでは苦しそうなので、中のモデル(ja_core_news_md)を使ってみた。

>>> import spacy
>>> ja=spacy.load("ja_core_news_md")
>>> doc=ja("國境の長いトンネルを拔けると、そこは雪國であつた。")
>>> import deplacy
>>> deplacy.render(doc)
國       NOUN  <╗                 compound
境       NOUN  ═╝═╗<╗             nmod
の       ADP   <══╝ ║             case
長い     ADJ   <══╗ ║             acl
トンネル NOUN  ═╗═╝═╝<╗           obj
を       ADP   <╝     ║           case
拔け     VERB  ═══════╝═╗═╗═╗<╗   advcl
る       AUX   <════════╝ ║ ║ ║   mark
と       CCONJ <══════════╝ ║ ║   mark
、       PUNCT <════════════╝ ║   punct
そこ     PRON  ═╗<════╗       ║   nsubj
は       ADP   <╝     ║       ║   case
雪       NOUN  <╗     ║       ║   compound
國       NOUN  ═╝═╗<╗ ║       ║   advcl
で       ADP   <══╝ ║ ║       ║   cop
あつ     VERB  ═╗═══╝═╝═══════╝═╗ ROOT
た       AUX   <╝               ║ aux
。       PUNCT <════════════════╝ punct

「國境」と「雪國」が、それぞれ2語に分かれてしまっているものの、そこはcompoundで繋がれているし、それ以外の係り受けは大丈夫なようだ。Universal Dependenciesで、解析結果をもう少し詳細に見てみよう。

>>> print("".join("\t".join([str(t.i+1),t.orth_,t.lemma_,t.pos_,t.tag_,"_",str(0 if t.head==t else t.head.i+1),t.dep_,"_","_" if t.whitespace_ else "SpaceAfter=No"])+"\n" for t in doc))
1    國    国    NOUN    名詞-普通名詞-一般    _    2    compound    _    SpaceAfter=No
2    境    境    NOUN    名詞-普通名詞-一般    _    5    nmod    _    SpaceAfter=No
3    の    の    ADP    助詞-格助詞    _    2    case    _    SpaceAfter=No
4    長い    長い    ADJ    形容詞-一般    _    5    acl    _    SpaceAfter=No
5    トンネル    トンネル    NOUN    名詞-普通名詞-サ変可能    _    7    obj    _    SpaceAfter=No
6    を    を    ADP    助詞-格助詞    _    5    case    _    SpaceAfter=No
7    拔け    抜く    VERB    動詞-非自立可能    _    16    advcl    _    SpaceAfter=No
8    る    り    AUX    助動詞    _    7    mark    _    SpaceAfter=No
9    と    と    CCONJ    助詞-接続助詞    _    7    mark    _    SpaceAfter=No
10    、    、    PUNCT    補助記号-読点    _    7    punct    _    SpaceAfter=No
11    そこ    其処    PRON    代名詞    _    16    nsubj    _    SpaceAfter=No
12    は    は    ADP    助詞-係助詞    _    11    case    _    SpaceAfter=No
13    雪    雪    NOUN    名詞-普通名詞-一般    _    14    compound    _    SpaceAfter=No
14    國    国    NOUN    接尾辞-名詞的-一般    _    16    advcl    _    SpaceAfter=No
15    で    で    ADP    助詞-格助詞    _    14    cop    _    SpaceAfter=No
16    あつ    有る    VERB    動詞-非自立可能    _    0    ROOT    _    SpaceAfter=No
17    た    た    AUX    助動詞    _    16    aux    _    SpaceAfter=No
18    。    。    PUNCT    補助記号-句点    _    16    punct    _    SpaceAfter=No

「拔ける」が2語に分かれている部分は、どうもlemma_がうまく取れていないようだ。うーむ、このあたりは、spaCyより、むしろSudachiPyに頑張ってもらうべき部分なのかしら。

14217625 journal
人工知能

yasuokaの日記: spaCyの日本語モデルがリリース

日記 by yasuoka

spaCyに公式の日本語モデルが追加されたので、係り受け可視化ツールdeplacyと繋いでみることにした。spaCyの日本語モデルには、大(ja_core_news_lg)・中(ja_core_news_md)・小(ja_core_news_sm)の3種類があるので、とりあえず小のモデルをダウンロードしてインストール。

$ pip3 install -U spacy sudachipy deplacy
$ python3 -m spacy download ja_core_news_sm

LinuxやMac OS Xなら、インストールは非常に簡単。Cygwin (64bit)でも、python37-devel python37-pip python37-cython python37-numpy gcc-g++の最新版を入れておけば

$ pip3.7 install -U spacy sudachipy deplacy --no-build-isolation
$ python3.7 -m spacy download ja_core_news_sm

でインストールできる。インストールがうまくいったら、「難儀な難儀は難儀する」を係り受け解析してみよう。

$ python3
>>> import spacy
>>> ja=spacy.load("ja_core_news_sm")
>>> doc=ja("難儀な難儀は難儀する")
>>> import deplacy
>>> deplacy.render(doc)
難儀 ADJ  ═╗<╗   acl
な   AUX  <╝ ║   aux
難儀 NOUN ═╗═╝<╗ nsubj
は   ADP  <╝   ║ case
難儀 VERB ═╗═══╝ ROOT
する AUX  <╝     aux

3つの「難儀」が、それぞれADJ(形容詞/形容動詞)・NOUN(名詞)・VERB(動詞)になっていて、単語間の係り受けも完璧だ。素晴らしい。他にもspaCyには様々な機能があるので、ぜひ色々と試してほしい。

14216995 journal
人工知能

yasuokaの日記: Re:「ความท้าทาย」は1語なのか2語なのか

日記 by yasuoka

6月16日の日記で書いた「แผนกนี้กำลังเผชิญกับความท้าทายใหม่」だが、pythainlpの形態素解析に従って「ความท้าทาย」を2語に分けた上で、手作業でUniversal Dependenciesを書いてみた。

1       แผนก    แผนก    NOUN    NCMN    _       4       nsubj   _       SpaceAfter=No
2       นี้       นี้       DET     DDAC    _       1       det     _       SpaceAfter=No
3       กำลัง    กำลัง    AUX     XVBM    _       4       aux     _       SpaceAfter=No
4       เผชิญ    เผชิญ    VERB    VSTA    _       0       root    _       SpaceAfter=No
5       กับ      กับ      ADP     RPRE    _       6       case    _       SpaceAfter=No
6       ความ    ความ    PART    FIXN    _       4       obl     _       SpaceAfter=No
7       ท้าทาย   ท้าทาย   VERB    VACT    _       6       acl     _       SpaceAfter=No
8       ใหม่     ใหม่     ADV     ADVN    _       7       advmod  _       _

SVGで可視化すると、こんな感じ。「ความ」と「ท้าทาย」の間の係り受けをどうするか悩んだのだが、とりあえず「ความ」=acl⇒「ท้าทาย」という形で後置修飾だとみなすことにした。ただ、これがタイ語の感覚に合っているのか、イマイチわからない。うーむ、他の例も見てみないとダメかな。

14215216 journal
日本

yasuokaの日記: 変体漢文における尊敬の助動詞

日記 by yasuoka

5月19日の日記で話題にした『吾妻鏡』の「二品以銀作猫被宛贈物」だが、この変体漢文における助動詞「被」は、受動ではなく尊敬とみなさざるを得ないようだ。とりあえず、Universal Dependenciesでムリヤリ書いてみよう。

1 二品 二品 PROPN n,名詞,人,複合的人名 _ 7 nsubj _ SpaceAfter=No
2 以 以 VERB v,動詞,行為,動作 _ 7 advcl _ SpaceAfter=No
3 銀 銀 NOUN n,名詞,可搬,道具 _ 4 obl _ SpaceAfter=No
4 作 作 VERB v,動詞,行為,生産 _ 5 acl _ SpaceAfter=No
5 猫 貓 NOUN n,名詞,主体,動物 _ 2 obj _ SpaceAfter=No
6 被 被 AUX v,助動詞,尊敬,* _ 7 aux _ SpaceAfter=No
7 宛 宛 VERB v,動詞,行為,動作 _ 0 root _ SpaceAfter=No
8 贈 贈 VERB v,動詞,行為,交流 _ 9 amod _ SpaceAfter=No
9 物 物 NOUN n,名詞,可搬,道具 _ 7 obj _ SpaceAfter=No

SVGで可視化すると、こんな感じ。その一方、古典中国語の助動詞は可能・必要・願望・受動の4種類に区分(cf.『古典中国語(漢文)の形態素解析とその応用』)すべきなので、たとえ尊敬の助動詞を追加するとしても、それは変体漢文に限る必要があるだろう。うーん、だとすると、形容詞の問題もあるし、変体漢文専用の品詞体系をむしろ練り直した方がいいのかしら。

typodupeerror

アレゲは一日にしてならず -- アレゲ見習い

読み込み中...