パスワードを忘れた? アカウント作成
14267787 journal
人工知能

yasuokaの日記: 旧字旧仮名における意味役割付与システムとしてのasapy+UniDic2UD

日記 by yasuoka

昨日の日記の続きだが、asapyUniDic2UDを繫いでみた。UniDic2UDにもCaboChaエミュレーションの機能はあるし、加えて旧仮名口語UniDicで旧字旧仮名が扱えるからだ。

$ pip3 install -U unidic2ud git+https://github.com/KoichiYasuoka/python_asa

の一行でインストールできるので、ぜひ試してみてほしい。旧仮名口語UniDicを高速に(ローカルで)動作させたい場合は、上に加えて

$ python3 -m unidic2ud download qkana

で、辞書をダウンロードしておくのがオススメだが、低速(Web茶まめ経由)でいいなら無理にダウンロードする必要はない。インストールがうまくいったら、旧仮名口語UniDicをasapyに繫いで「其國を治めんと欲する者は先づ其家を齊ふ」を解析してみよう。

$ python3
>>> from asapy.ASA import ASA
>>> asa=ASA("qkana")
>>> asa.parse("其國を治めんと欲する者は先づ其家を齊ふ")
>>> asa.selectOutput()
sentence: 其國を治めんと欲する者は先づ其家を齊ふ
ID: 0 其
    link: 1
    type: elem
    frame: 1-対象-Arg1
    tense: PRESENT
    sentelem: ADNOMINAL
        0    其    ソノ    其の    連体詞            O
ID: 1 國を
    link: 2
    type: elem
    main: 国
    part: を
    category: 組織
    semrole: 対象
    arg: Arg1
    score: 7.169925
    frame: 0-elem,2-verb
    tense: PRESENT
        0    國    クニ    国    名詞,普通名詞,一般            O
        1    を    ヲ    を    助詞,格助詞            O
ID: 2 治めんと
    link: 3
    type: verb
    main: 収める
    part: と
    score: 7.169925
    semantic: 状態変化あり-開始・終了-停止・終了-終了-
    frame: 1-対象-Arg1,3-verb
    voice: ACTIVE
    tense: PRESENT
    polarity: AFFIRMATIVE
    mood: INDICATIVE
        0    治め    オサメ    収める    動詞,自立            O
        1    ん    ン    む    助動詞            O
        2    と    ト    と    助詞,格助詞            O
ID: 3 欲する
    link: 4
    type: verb
    main: 欲する
    score: 2.0
    semantic: 状態変化なし(活動)-他者の行為に対する希望・待機-希望--
    frame: 2-verb,4-経験者|動作主-Arg1|Arg0
    voice: ACTIVE
    tense: PRESENT
    polarity: AFFIRMATIVE
    mood: INDICATIVE
        0    欲する    ホッスル    欲する    動詞,自立            O
ID: 4 者は
    link: 8
    type: elem
    main: 者
    part: は
    category: 人
    semrole: 経験者|動作主
    arg: Arg1|Arg0
    score: 4.0
    frame: 3-verb,8-verb
    tense: PRESENT
        0    者    モノ    者    名詞,普通名詞,一般            O
        1    は    ハ    は    助詞,係助詞            O
ID: 5 先づ
    link: 8
    type: elem
    main: 先ず
    frame: 8-verb
    tense: PRESENT
    sentelem: ADVERBIAL
        0    先づ    マヅ    先ず    副詞            O
ID: 6 其
    link: 7
    type: elem
    frame: 7-対象-Arg1
    tense: PRESENT
    sentelem: ADNOMINAL
        0    其    ソノ    其の    連体詞            O
ID: 7 家を
    link: 8
    type: elem
    main: 家
    part: を
    category: 場所
    semrole: 対象
    arg: Arg1
    score: 4.0
    frame: 6-elem,8-verb
    tense: PRESENT
        0    家    ウチ    家    名詞,普通名詞,一般            O
        1    を    ヲ    を    助詞,格助詞            O
ID: 8 齊ふ
    link: -1
    type: verb
    main: 整える
    score: 8.0
    semantic: 状態変化あり-生成・消滅-生成(物理)-完成・成立-成立
    frame: 4-経験者|動作主-Arg1|Arg0,5-elem,7-対象-Arg1
    voice: ACTIVE
    tense: PRESENT
    sentelem: PREDICATE
    polarity: AFFIRMATIVE
    mood: INDICATIVE
        0    齊ふ    トトノフ    整える    動詞,自立            O

「齊ふ」のmain(見出し語)が「整える」なのはいいとしても、「治めんと」のmainが「収める」なのは、多少、議論の余地があると思う。まあ、旧仮名口語UniDicが語彙素を「収める」にしているので、私(安岡孝一)個人としては、とりあえずこのままで行くことにしよう。

frameをざっと見ていくと、「整える」はArg0(動作主)が「者」でArg1(対象)が「家」、「欲する」はArg0が「者」となっているのは、まあ納得がいく。一方、「収める」は、Arg1が「国」なのはいいが、Arg0がない。ここは、Arg0に「者」を入れたい気がするのだが、なかなか難しいのだろうか。ふーむ、Deep Universal Dependenciesに変換するとしても、やっぱり手作業が必要かな。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

UNIXはただ死んだだけでなく、本当にひどい臭いを放ち始めている -- あるソフトウェアエンジニア

読み込み中...