パスワードを忘れた? アカウント作成

スラドのTwitterでストーリをフォローしよう。

14970299 journal
Google

yasuokaの日記: AllenNLPの係り受け解析モデルをdeplacyに繫ぐには

日記 by yasuoka

AllenNLPの係り受け解析モデルを、Google Colaboratoryで動かしてみた。

!pip install -U allennlp allennlp-models urllib3
from allennlp.predictors.predictor import Predictor
predictor=Predictor.from_path("https://storage.googleapis.com/allennlp-public-models/biaffine-dependency-parser-ptb-2020.04.06.tar.gz")
doc=predictor.predict("I saw a horse yesterday which had no name.")
print(doc)

14967555 journal
人工知能

yasuokaの日記: Turku-neural-parser-pipelineのフェロー語係り受け解析をGoogle Colaboratoryで動かす

日記 by yasuoka

Turku-neural-parser-pipeline言語モデルを眺めていたところ、フェロー語の言語モデルが含まれているのに気づいた。とりあえず、Google Colaboratory上でdeplacyに繋いでみよう。

14967191 journal
アメリカ合衆国

yasuokaの日記: O. Henry『Springtime à la Carte』のタイプライターのモデルは何なのか

日記 by yasuoka

O. Henryの『Springtime à la Carte』(1906年)を読んでいて、このタイプライターのモデルとなったのは何だろう、という疑問が頭をよぎった。

"I'd know that cranky capital W 'way above the line that your typewriter makes anywhere in the world," said Franklin.
"Why, there's no W in dandelions," said Sarah, in surprise.

14956436 journal
人工知能

yasuokaの日記: GLA (Gaelic Linguistic Analyser)でスコットランド・ゲール語の係り受け解析

日記 by yasuoka

ネットサーフィンしていたところ、GLA (Gaelic Linguistic Analyser)というツールを見つけた。ざっと読んでみたところ、curl一発でスコットランド・ゲール語の品詞付与や係り受け解析がおこなえるらしい。とりあえず、「Innsidh na geòidh as t-fhoghar e.」という文を、係り受け解析してみよう。

14951606 journal
Google

yasuokaの日記: LINGUAKITのガリシア=ポルトガル語係り受け解析をGoogle Colaboratoryで動かす

日記 by yasuoka

ネットサーフィンしていたところ、サンティアゴ・デ・コンポステーラ大学のGrupo de Gramática do Españolが製作したLINGUAKITという文法解析ツールを見つけた。ガリシア語・ポルトガル語・スペイン語・英語に加え、ガリシア=ポルトガル語(ガリシア語とポルトガル語の共通祖語)まで解析できるらしい。とりあえず、Google Colaboratory上で、LINGUAKITのガリシア=ポルトガル語係り受け解析を試してみよう。

14947373 journal
人工知能

yasuokaの日記: 古典中国語(漢文)係り受け解析エンジンとしてのUDPipe 2

日記 by yasuoka

UDPipe 2がやっとリリース(仮)された、との連絡をいただいた。ただし、現時点でのリリースはLINDATのREST APIだけで、UDPipe 2のプログラム本体や各言語モデルは、まだ公開されていない。それでも、とりあえず「不入虎穴不得虎子」を係り受け解析してみよう。

14642027 journal
人工知能

yasuokaの日記: Re: 変体漢文をUniDic品詞で表すことができるか

日記 by yasuoka

昨日の日記の続きだが、「汝者我見欺」をUniDic品詞のUniversal Dependenciesで表すことはできるだろうか。

14616130 journal
人工知能

yasuokaの日記: 変体漢文をUniDic品詞で表すことができるか

日記 by yasuoka

昨日の日記の続きだが、変体漢文が中古日本語の一種だとして、UniDic品詞によるUniversal Dependenciesで表すことはできるだろうか。『吾妻鏡』の「二品以銀作猫被宛贈物」で、少し考えてみよう。

14543558 journal
日本

yasuokaの日記: 変体漢文の言語コードはojpなのか

日記 by yasuoka

ISO 639-3の言語コードojp「Old Japanese」が、いったいどういう言語を対象としているのか、微妙に気になった。Multitreeのojpのページは、7~10世紀の日本語を想定しているらしいが、書写言語としてのojpがどういうものなのか、記述がない。

ojpの「Old Japanese」が、いわゆる「古文」だとして、さて、そこに変体漢文は含まれているのだろうか。こういうの、いったい誰に聞いたらいいんだろ?

14483513 journal
日本

yasuokaの日記: 全国1896市区町村のデジタル戸籍化が完了 115

日記 by yasuoka

御蔵島村の電算戸籍が本日(9月28日)無事に稼働した、との御連絡をいただいた。これで、全国1896市区町村のデジタル戸籍化が完了したことになる。私(安岡孝一)個人としても非常にうれしく、関係各位には感謝の意を申し上げる。

ただ、戸籍のデジタル化を完全に完了させるためには、各市区町村に1~2%ほど残っている改製不適合簿(いわゆる紙戸籍の事故簿)を、何とかデジタル化しないといけない。デジタル化できない理由の一つだった氏名の漢字については、まあまあ文字コード化の見通しがついてきたが、変体仮名については恐ろしく手ごわい。戸籍デジタルシステムの稼働に向け、もう少し私自身も頑張ってみようと思う。

14483515 submission
日本

全国1896市区町村のデジタル戸籍化が完了 1

タレコミ by yasuoka
yasuoka 曰く、
御蔵島村の電算戸籍が本日(9月28日)無事に稼働した、との御連絡をいただいた。これで、全国1896市区町村のデジタル戸籍化が完了したことになる。私(安岡孝一)個人としても非常にうれしく、関係各位には感謝の意を申し上げる。

ただ、戸籍のデジタル化を完全に完了させるためには、各市区町村に1~2%ほど残っている改正不適合簿(いわゆる紙戸籍の事故簿)を、何とかデジタル化しないといけない。デジタル化できない理由の一つだった氏名の漢字については、まあまあ文字コード化の見通しがついてきたが、変体仮名については恐ろしく手ごわい。戸籍デジタルシステムの稼働に向け、もう少し私自身も頑張ってみようと思う。

14457303 journal
人工知能

yasuokaの日記: タイ語係り受け解析モジュールspaCy-Thai仮リリース

日記 by yasuoka

pythainlpUDPipespaCyを組み合わせて、タイ語の係り受け解析モジュールspaCy-Thaiを作ってみた。インストールは

$ pip3 install spacy_thai --user

一発でOKのはずだが、インストールにはg++が必要だ。また、Cygwinの場合は

$ pip3.7 install spacy_thai --no-build-isolation

14432669 journal
人工知能

yasuokaの日記: 「ความท้าทาย」は1語なのか2語なのか3語なのか

日記 by yasuoka

私(安岡孝一)の6月20日の日記の読者から、thai-segmenterというタイ語の形態素解析器をお教えいただいた。

$ pip3 install thai-segmenter --user

で簡単にインストールできるので、試しに「แผนกนี้กำลังเผชิญกับความท้าทายใหม่」を解析してみることにした。

14413812 journal
人工知能

yasuokaの日記: コプト語係り受け解析モジュールspaCy-Coptic仮リリース

日記 by yasuoka

昨日の日記で紹介したcoptic-nlpだが、spaCy-Copticというpython3モジュールとして仮リリースした。ただ、coptic-nlpは、JavaFomaが必要な上に、scikit-learnを旧版(0.23以前)に戻さねばならない、というヤヤコシサがあったので、とりあえずはWebAPIを使う仕掛けにしてみた。この結果、spaCy-Copticのインストールは簡単で

typodupeerror

私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson

読み込み中...