パスワードを忘れた? アカウント作成

スラドのストーリを選ぶための補助をお願いします。

14151785 journal
人工知能

yasuokaの日記: UD-Kanbun・spacy-stanza・spacy-udpipeをmacOS Catalinaで使うには

日記 by yasuoka

私(安岡孝一)の昨日の日記の読者から、macOSはダメなのか、という趣旨の御質問をいただいた。macOS Catalinaなら大丈夫だが、ネットワークに繋がった環境下で、ターミナル(「Finder」→「アプリケーション」→「ユーティリティ」の中にある)を立ち上げる必要がある。ターミナルを立ち上げたら、以下のコマンドを順に実行する。

14150852 journal
マイクロソフト

yasuokaの日記: UD-Kanbun・spacy-stanza・spacy-udpipeをCygwin64で使うには

日記 by yasuoka

一昨昨日一昨日の日記で紹介したUD-Kanbunspacy-stanzaspacy-udpipeを、Cygwin(64bit版)で使ってみたいとの御依頼をいただいた。もちろん使えるのだが、Stanzaに必要な

14150361 comment

yasuokaのコメント: SlackとGoogle Colaboratoryの併用 (スコア 2) 2

by yasuoka (#3789515) ネタ元: 京都大学が授業開始を5/7に先送り

まあ、プログラミング関係の演習とかだと、あえて動画や音声など使わずに、SlackでチャットしながらGoogle Colaboratoryで頑張らせる、という手も考えるんですけど、これもなかなか手間なんですよね。うーん。

14150164 journal
エイプリルフール

yasuokaの日記: 京都大学が授業開始を5/7に先送り 2

日記 by yasuoka

私(安岡孝一)のいる京都大学では、本年度(2020年度)の授業開始を5月7日(木)に先送りすることを発表した。この間にオンライン授業の準備を進めたい、というのが大学側の意向らしいが、やはり難しい。というのも、教員側はネットワークの確保をおこなえるかもしれないが、学生側は場合によっては「1GBプラン」の端末しか手元にないわけだ。そうすると、

14148941 journal
Google

yasuokaの日記: UD-Kanbun・spacy-stanza・spacy-udpipeの自動文切り機能をOFFにするには

日記 by yasuoka

昨日の日記で書いたUD-Kanbunspacy-stanzaspacy-udpipeだが、自動文切り機能をOFFにして、Google Colaboratory上でdeplacyで再比較してみた。ただ、自動文切り機能をOFFにす

14148542 journal
Google

yasuokaの日記: spaCy上の古典中国語(漢文)解析ツールUD-Kanbun・spacy-stanza・spacy-udpipe比較

日記 by yasuoka

spaCy上での古典中国語(漢文)解析ツールが、UD-Kanbunspacy-stanzaspacy-udpipeの3つになったので、Google Colaboratory上でdeplacyを使って、ざっと比較してみることにした。まずはUD-Kanbunを、インストールから「不入虎穴不得虎子」の解析までおこなってみよう。

14147761 journal
人工知能

yasuokaの日記: spaCy上の係り受け可視化ツールdeplacy

日記 by yasuoka

UniDic2UDの縦書きツリーを独立させて、deplacyという名前のpython3モジュールにした。「pip3 install -U deplacy」一発でインストールできる上に、spaCyStanzaNLP-Cubeとも繫げられるようにしたので、かなり便利だと思う。試しに、

14147183 journal
人工知能

yasuokaの日記: 多言語文法解析ツールとしてのspacy-udpipe

日記 by yasuoka

spacy-udpipeが0.2.0にバージョンアップ、との連絡をいただいた。spacy-udpipeは、UDPipeの言語モデルをspaCy上で使うためのツールで、今回のバージョンアップにより、Universal Dependencies 2.5の言語モデルのうち、91モデルを使えるようになった。とりあえず、インストール。

$ pip3 install -U spacy-udpipe

14146546 journal
Windows

yasuokaの日記: CygwinからWSLの中のpython3を使うには

日記 by yasuoka

一昨日の日記の読者から、逆はできないのか、という質問をいただいた。できる。CygwinからWSL (Windows Subsystem for Linux)の中のpython3を使うには

wsl python3

でOKだ。ただし、32bit版のCygwinから使う場合は、PATHが通ってない場合が多いので

/cygdrive/c/Windows/Sysnative/wsl python3

としなければならないようだ。また、複数のLinuxをWSLに載せている場合は、どれが立ち上がるかを

wslconfig /l

14144607 journal
Windows

yasuokaの日記: WSLの中からCygwin64のpython3.7を使うには

日記 by yasuoka

WSL (Windows Subsystem for Linux)の中からCygwin64のpython3.7を使う方法が、思いのほか簡単だったので、うれしくなって日記に書いておこうと思う。

/mnt/c/cygwin64/bin/env.exe PATH="`echo $PATH | sed s+:/mnt/+:/cygdrive/+g`:/usr/lib/lapack" python3.7

14142884 journal
Google

yasuokaの日記: Re: Google ColaboratoryでStanzaの結果を可視化するには

日記 by yasuoka

一昨日の日記でうまくいかなかったStanzadisplaCyの連携だが、spacy-stanzaを使えば簡単にできることがわかった。ちょっとクヤシイのだが、とりあえずspacy-stanzaのインストールから、「笑顔で彼は座った」「He sat down with smiling face」「Ele se sentou com um sorriso no rosto」の3つの文の解析・可視化まで、Google Colaboratory上で一気にやってみよう。

14141805 journal
中国

yasuokaの日記: 現代中国語係り受け解析ツールとしてのStanza

日記 by yasuoka

Stanzaには、現代中国語モデルが2つ(簡化字用zh-hansと繁體字用zh-hant)準備されている。ただ、この2つのモデルは、解析動作が微妙に異なっているようだ。とりあえず、Stanzaのインストールと、モデルのダウンロード。

$ pip3 install stanza
$ python3
>>> import stanza
>>> stanza.download("zh-hans")
>>> stanza.download("zh-hant")

ダウンロードに続いて、「我把这本书看完了」「我把這本書看完了」の2文を、係り受け解析してみよう。

14141148 journal
Google

yasuokaの日記: Google ColaboratoryでStanzaの結果を可視化するには

日記 by yasuoka

昨日の日記で紹介した多言語文法解析ツールStanzaは、Google Colaboratory上でも難なく動作する。ただ、displaCyとの連携は、どうも私(安岡孝一)にはうまくいかなかったので、「SVG

14140730 journal
アメリカ合衆国

yasuokaの日記: 多言語文法解析ツールStanzaリリース

日記 by yasuoka

StanfordNLPの後継にあたる多言語文法解析ツールStanzaがリリースされたので、とりあえず使ってみた。68言語をサポートしていて、ちゃんと古典中国語(漢文)も解析可能なのが、私(安岡孝一)個人としても非常にうれしい。さっそく、インストールしてみよう。

$ pip3 install stanza

LinuxやMac OS Xなら、インストールはpip一発で、非常に簡単。Cygwin (64bit)でも、python37-devel python37-pip python37-cython python37-numpy gcc-g++の最新版を入れておけば

14140426 journal
人工知能

yasuokaの日記: 日本語の言語処理における「単語」長の問題

日記 by yasuoka

松田寛・若狭絢・山下華代・大村舞・浅原正幸の『UD Japanese GSDの再整備と固有表現情報付与』(言語処理学会第26回年次大会, P1-34)を横目に、UniDic2UDからUD_Japanese-GSDを外した時の判断を、私(安岡孝一)なりに書き留めておこうと思う。

typodupeerror

「毎々お世話になっております。仕様書を頂きたく。」「拝承」 -- ある会社の日常

読み込み中...