パスワードを忘れた? アカウント作成

14156069 journal
人工知能

yasuokaの日記: フランス語のUniversal Dependenciesにおける縮約冠詞と構成鎖

日記 by yasuoka

deplacyに直接構成鎖解析(immediate catena analysis)を実装したのだが、フランス語のような縮約冠詞を有する言語では、Universal Dependencies上の構成鎖がヤヤコシイことになってしまうのに気づいた。とりあえず、「Attention aux articles contractés!」という例文を、Google Colaboratory上のStanzaで係り受け解析してみよう。

14154139 comment

yasuokaのコメント: けふ、ママンが死んだ。 (スコア 1) 2

さすがに全部ひらがなだと苦しいのですけど、『新潮』1951年6月号の「けふ、ママンが死んだ。」なら、UniDic2UD+旧仮名口語UniDic+deplacyで、以下の結果になりました。

>>> import unidic2ud
>>> qkana=unidic2ud.load("qkana")
>>> doc=qkana("けふ、ママンが死んだ。")
>>> import deplacy
>>> deplacy.render(str(doc))
けふ   NOUN  ═╗<══╗   obl
、     PUNCT <╝   ║   punct
ママン NOUN  ═╗<╗ ║   nsubj
が     ADP   <╝ ║ ║   case
死ん   VERB  ═╗═╝═╝═╗ root
だ     AUX   <╝     ║ aux
。     PUNCT <══════╝ punct

14154130 journal
人工知能

yasuokaの日記: 旧字旧仮名日本語解析ツールとしてのCamphr-Udify

日記 by yasuoka

昨日の日記で「國境のトンネルを拔けると、窓の外の夜の底が白くなつた。」を係り受け解析したのだが、Camphr-Udifyのja_mecab_udify 0.5を紹介しなかった。というのも、Camphr-Udifyはトークナイザ(単語切りモジュール)を「外部委託」しており、トークナイザを付け替えることによって、かなり性能が変わるのだ。まずは、トークナイザとしてmecab-python3のデフォルト辞書(ipadic)を、Google Colaboratory上で使ってみよう。

14153766 journal
人工知能

yasuokaの日記: 旧字旧仮名日本語解析ツールとしてのUniDic2UD・GiNZA・Stanza・spacy-udpipe・NLP-Cube 2

日記 by yasuoka

「國境のトンネルを拔けると、窓の外の夜の底が白くなつた。」という文に対し、UniDic2UDGiNZAStanzaspacy-udpipeNLP-Cubeで、単語間の係り受け解析をおこなってみた。deplacyで可視化した結果を、以下にしめす。

  • UniDic2UD+旧仮名口語UniDic
14151785 journal
人工知能

yasuokaの日記: UD-Kanbun・spacy-stanza・spacy-udpipeをmacOS Catalinaで使うには

日記 by yasuoka

私(安岡孝一)の昨日の日記の読者から、macOSはダメなのか、という趣旨の御質問をいただいた。macOS Catalinaなら大丈夫だが、ネットワークに繋がった環境下で、ターミナル(「Finder」→「アプリケーション」→「ユーティリティ」の中にある)を立ち上げる必要がある。ターミナルを立ち上げたら、以下のコマンドを順に実行する。

14150852 journal
マイクロソフト

yasuokaの日記: UD-Kanbun・spacy-stanza・spacy-udpipeをCygwin64で使うには

日記 by yasuoka

一昨昨日一昨日の日記で紹介したUD-Kanbunspacy-stanzaspacy-udpipeを、Cygwin(64bit版)で使ってみたいとの御依頼をいただいた。もちろん使えるのだが、Stanzaに必要な

14150361 comment

yasuokaのコメント: SlackとGoogle Colaboratoryの併用 (スコア 2) 2

by yasuoka (#3789515) ネタ元: 京都大学が授業開始を5/7に先送り

まあ、プログラミング関係の演習とかだと、あえて動画や音声など使わずに、SlackでチャットしながらGoogle Colaboratoryで頑張らせる、という手も考えるんですけど、これもなかなか手間なんですよね。うーん。

14150164 journal
エイプリルフール

yasuokaの日記: 京都大学が授業開始を5/7に先送り 2

日記 by yasuoka

私(安岡孝一)のいる京都大学では、本年度(2020年度)の授業開始を5月7日(木)に先送りすることを発表した。この間にオンライン授業の準備を進めたい、というのが大学側の意向らしいが、やはり難しい。というのも、教員側はネットワークの確保をおこなえるかもしれないが、学生側は場合によっては「1GBプラン」の端末しか手元にないわけだ。そうすると、

14148941 journal
Google

yasuokaの日記: UD-Kanbun・spacy-stanza・spacy-udpipeの自動文切り機能をOFFにするには

日記 by yasuoka

昨日の日記で書いたUD-Kanbunspacy-stanzaspacy-udpipeだが、自動文切り機能をOFFにして、Google Colaboratory上でdeplacyで再比較してみた。ただ、自動文切り機能をOFFにす

14148542 journal
Google

yasuokaの日記: spaCy上の古典中国語(漢文)解析ツールUD-Kanbun・spacy-stanza・spacy-udpipe比較

日記 by yasuoka

spaCy上での古典中国語(漢文)解析ツールが、UD-Kanbunspacy-stanzaspacy-udpipeの3つになったので、Google Colaboratory上でdeplacyを使って、ざっと比較してみることにした。まずはUD-Kanbunを、インストールから「不入虎穴不得虎子」の解析までおこなってみよう。

14147761 journal
人工知能

yasuokaの日記: spaCy上の係り受け可視化ツールdeplacy

日記 by yasuoka

UniDic2UDの縦書きツリーを独立させて、deplacyという名前のpython3モジュールにした。「pip3 install -U deplacy」一発でインストールできる上に、spaCyStanzaNLP-Cubeとも繫げられるようにしたので、かなり便利だと思う。試しに、

14147183 journal
人工知能

yasuokaの日記: 多言語文法解析ツールとしてのspacy-udpipe

日記 by yasuoka

spacy-udpipeが0.2.0にバージョンアップ、との連絡をいただいた。spacy-udpipeは、UDPipeの言語モデルをspaCy上で使うためのツールで、今回のバージョンアップにより、Universal Dependencies 2.5の言語モデルのうち、91モデルを使えるようになった。とりあえず、インストール。

$ pip3 install -U spacy-udpipe

14146546 journal
Windows

yasuokaの日記: CygwinからWSLの中のpython3を使うには

日記 by yasuoka

一昨日の日記の読者から、逆はできないのか、という質問をいただいた。できる。CygwinからWSL (Windows Subsystem for Linux)の中のpython3を使うには

wsl python3

でOKだ。ただし、32bit版のCygwinから使う場合は、PATHが通ってない場合が多いので

/cygdrive/c/Windows/Sysnative/wsl python3

としなければならないようだ。また、複数のLinuxをWSLに載せている場合は、どれが立ち上がるかを

wslconfig /l

14144607 journal
Windows

yasuokaの日記: WSLの中からCygwin64のpython3.7を使うには

日記 by yasuoka

WSL (Windows Subsystem for Linux)の中からCygwin64のpython3.7を使う方法が、思いのほか簡単だったので、うれしくなって日記に書いておこうと思う。

/mnt/c/cygwin64/bin/env.exe PATH="`echo $PATH | sed s+:/mnt/+:/cygdrive/+g`:/usr/lib/lapack" python3.7

14142884 journal
Google

yasuokaの日記: Re: Google ColaboratoryでStanzaの結果を可視化するには

日記 by yasuoka

一昨日の日記でうまくいかなかったStanzadisplaCyの連携だが、spacy-stanzaを使えば簡単にできることがわかった。ちょっとクヤシイのだが、とりあえずspacy-stanzaのインストールから、「笑顔で彼は座った」「He sat down with smiling face」「Ele se sentou com um sorriso no rosto」の3つの文の解析・可視化まで、Google Colaboratory上で一気にやってみよう。

typodupeerror

吾輩はリファレンスである。名前はまだ無い -- perlの中の人

読み込み中...