Google ColaboratoryでStanzaの結果を可視化するには | yasuokaの日記

yasuokaの日記： Google ColaboratoryでStanzaの結果を可視化するには 0

日記 by yasuoka 2020年03月22日 9時23分

昨日の日記で紹介した多言語文法解析ツールStanzaは、Google Colaboratory上でも難なく動作する。ただ、displaCyとの連携は、どうも私(安岡孝一)にはうまくいかなかったので、「SVGによるUniversal Dependencies可視化ツール」を繋いでみることにした。Stanzaのインストールから、「笑顔で彼は座った」「He sat down with smiling face」「Ele se sentou com um sorriso no rosto」の3つの文の解析・可視化まで、Google Colaboratory上で一気にやってみよう。

!pip install stanza import stanza stanza.download("ja") stanza.download("en") stanza.download("pt") ja=stanza.Pipeline("ja") en=stanza.Pipeline("en") pt=stanza.Pipeline("pt") from stanza.utils.conll import CoNLL import urllib.parse from IPython.display import IFrame,display for s in [ja("笑顔で彼は座った"),en("He sat down with smiling face"),pt("Ele se sentou com um sorriso no rosto")]: c=CoNLL.conll_as_string(CoNLL.convert_dict(s.to_dict())) print(c) display(IFrame(src="https://corpus.kanji.zinbun.kyoto-u.ac.jp/db-machine/~yasuoka/kyodokenkyu/ud-kanbun/conllusvg/viewer.svg#"+urllib.parse.quote(c),width="100%",height=250))

解析結果を見る限り、日本語と英語はほぼ完璧だが、ポルトガル語はイマイチだ。「no」を「em o」に分解するところまではいいものの、「sentou」─obl→「rosto」となってしまっていて、ワケがわからなくなっている。そこは「sorriso」─nmod→「rosto」とすべきところなのだが、昨日の結果からして、どうもnmodまわりが弱いのかしら。

yasuokaの日記： Google ColaboratoryでStanzaの結果を可視化するには 0

Google ColaboratoryでStanzaの結果を可視化するには More ログイン

スラド