パスワードを忘れた? アカウント作成
14141148 journal
Google

yasuokaの日記: Google ColaboratoryでStanzaの結果を可視化するには

日記 by yasuoka

昨日の日記で紹介した多言語文法解析ツールStanzaは、Google Colaboratory上でも難なく動作する。ただ、displaCyとの連携は、どうも私(安岡孝一)にはうまくいかなかったので、「SVGによるUniversal Dependencies可視化ツール」を繋いでみることにした。Stanzaのインストールから、「笑顔で彼は座った」「He sat down with smiling face」「Ele se sentou com um sorriso no rosto」の3つの文の解析・可視化まで、Google Colaboratory上で一気にやってみよう。

!pip install stanza
import stanza
stanza.download("ja")
stanza.download("en")
stanza.download("pt")
ja=stanza.Pipeline("ja")
en=stanza.Pipeline("en")
pt=stanza.Pipeline("pt")
from stanza.utils.conll import CoNLL
import urllib.parse
from IPython.display import IFrame,display
for s in [ja("笑顔で彼は座った"),en("He sat down with smiling face"),pt("Ele se sentou com um sorriso no rosto")]:
  c=CoNLL.conll_as_string(CoNLL.convert_dict(s.to_dict()))
  print(c)
  display(IFrame(src="https://corpus.kanji.zinbun.kyoto-u.ac.jp/db-machine/~yasuoka/kyodokenkyu/ud-kanbun/conllusvg/viewer.svg#"+urllib.parse.quote(c),width="100%",height=250))

解析結果を見る限り、日本語英語はほぼ完璧だが、ポルトガル語はイマイチだ。「no」を「em o」に分解するところまではいいものの、「sentou」─obl→「rosto」となってしまっていて、ワケがわからなくなっている。そこは「sorriso」─nmod→「rosto」とすべきところなのだが、昨日の結果からして、どうもnmodまわりが弱いのかしら。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

日本発のオープンソースソフトウェアは42件 -- ある官僚

読み込み中...