パスワードを忘れた? アカウント作成

14117761 journal
Google

yasuokaの日記: Google ColaboratoryでCamphr-Udifyの結果を可視化するには

日記 by yasuoka

一昨日の日記で、Camphr-UdifyGoogle Colaboratory上で試してみたのだが、displaCyの表示スタイルが個人的には気に入らなかった。そこで、以前、私(安岡孝一)が作った「

14116363 journal
Google

yasuokaの日記: Google ColaboratoryでCamphr-Udifyを使うには

日記 by yasuoka

Google Colaboratory上でCamphr-Udifyを試してみたのだが、インストール時にちょっとだけクセがあったので、忘れないうちに私(安岡孝一)の日記に書いておく。

14111406 journal
中国

yasuokaの日記: 現代中国語係り受け解析ツールとしてのCamphr-Udify 3

日記 by yasuoka

私(安岡孝一)の昨日の日記に対し、Camphr-Udifyはjiebaをトークナイザとして現代中国語に対応している、という御連絡をいただいた。ただ、ja_mecab_udifyではなく、en_udifyの方を使う必要があるようだ。とりあえず、インストール。

$ pip3 install https://github.com/PKSHATechnology-Research/camphr_models/releases/download/0.5/en_udify-0.5.tar.gz
$ pip3 install jieba

14111026 journal
人工知能

yasuokaの日記: 多言語係り受け解析ツールとしてのCamphr-Udify 2

日記 by yasuoka

PKSHA Technologyが自然言語処理ライブラリCamphrをリリースしたので、試しに使ってみることにした。CamphrはspaCy上の多言語ライブラリで、pip3とpython3があれば

$ pip3 install https://github.com/PKSHATechnology-Research/camphr_models/releases/download/0.5/ja_mecab_udify-0.5.tar.gz
$ pip3 install mecab-python3 --only-binary :all:

14110314 journal
アメリカ合衆国

yasuokaの日記: Universal DependenciesとStanford Typed Dependenciesと矢印の向き

日記 by yasuoka

今日発売の『数学セミナー』(Vol.59, No.3)を読んでいて、能地宏「文構造に内在する普遍」(pp.20-24)の図1が気になった。「He drunk expensive wine in Paris」という英文(drankではなくdrunk)の依存構造を扱っているのだが、矢印の向きがdrunk→in→Parisとなっているのだ。最新のUniversal Dependencies 2.5であれば、ここはdrun

14109114 journal
日記

yasuokaの日記: 人文科学における「科学の手順」とQWERTY配列

日記 by yasuoka

『キーボード配列 QWERTYの謎』(NTT出版、2008年3月)の読者から、山田俊弘の『論文を書くための科学の手順』(文一総合出版、2018年10月)を読んでみてほしい、との御連絡をいただいた。ざっと読んでみたのだが、7ページの

科学で採用されている論理の型は仮説演繹と呼ばれており、

  1. 研究対象とする現象を提案し、
  2. その現象を説明する仮説をつくり、
  3. 仮説をもとに実証可能な予言を導き、
  4. 実験や観察で予言の正しさを評価し、
  5. この評価をもとに仮説の真偽を検証する

というものである。

14107428 journal
人工知能

yasuokaの日記: UniDic2UDとGiNZAで読む「難儀な難儀は難儀する」

日記 by yasuoka

昨日の日記で示したUniDic品詞とUniversal Dependencies品詞の対応だが、かなり難儀なのが「名詞-普通名詞-サ変形状詞可能」だったりする。何せ「名詞」のくせにNOUNとは限らず、VERBだったりADJ(adjective)だったりするのだ。最新のUniDic2UD 1.9.1+現代話し言葉UniDicで、「難儀な難儀は難儀する」を解析してみよう。

14107080 journal
人工知能

yasuokaの日記: UniDic2UDにおける品詞間の対応

日記 by yasuoka

UniDic2UDの係り受け解析モデルを、これまでのjapanese-gsdに代えて、japanese-modernを元に作り直した。この作業に伴って、UniDic品詞とUniversal Dependencies品詞(UPOS)の対応を見直したので、忘れないうちに私(安岡孝一)の日記で公開しておくことにする。ただし、UniDic品詞とUPOSは1対1に対応しているわけではなく、た

14102828 journal
日本

yasuokaの日記: ginzameで読む「公立はこだて未来大学」 1

日記 by yasuoka

このツイートが気になったので、手元のginzame (GiNZA 3.1.1版)で「公立はこだて未来大学」を読んでみた。

$ echo 公立はこだて未来大学 | ginzame
公立    名詞,普通名詞,一般,*,*,*,公立,コウリツ,*
はこだて    名詞,固有名詞,地名,一般,*,*,はこだて,ハコダテ,*
未来    名詞,普通名詞,一般,*,*,*,未来,ミライ,*
大学    名詞,普通名詞,一般,*,*,*,大学,ダイガク,*
EOS

14101649 comment

yasuokaのコメント: 『The Curse of QWERTY』 (スコア 1) 4

by yasuoka (#3754653) ネタ元: 「銃・病原菌・鉄」でQWERTY

あ、どうも、リンクありがとうございます。実はジャレド・ダイアモンドは、この『Guns, Germs, and Steel』と同時期に、Discover誌1997年4月号で『The Curse of QWERTY』という小文を書いてまして、まあ、こっちもガセネタだらけなのです。13年ほど前に英語でツッコんでおいたので、よければごらん下さい。

14099903 journal
Google

yasuokaの日記: Google ColaboratoryでUD-KundokuのSVGを表示するには

日記 by yasuoka

昨日の日記の続きだが、UD-KundokuをGoogle Colaboratoryで使う際も、SVGを表示するにはGoogle Drive経由が良さそうである。

14099161 journal
Google

yasuokaの日記: Google ColaboratoryでUniDic2UDのSVGを表示するには

日記 by yasuoka

UniDic2UDをGoogle Colaboratoryで使っていたところ、係り受け解析結果をSVG表示できないという問題に出くわした。ざっと調べてみたところ、Google Colaboratoryが使っているIPython.displayのSVGモジュールが非力で、SVG内部のJavaScriptを処理しきれていないことがわかった。でも、SVGを表示したい場面はあるだろうと思い、私(安岡孝一)なりにアレコレ考えてみた結果、Google Drive経由でならブラウザ(Chromium系列)のSVGをキックできることに気づいたので、ざっとコーディングしてみた。

14094037 journal
日本

yasuokaの日記: 「野」を字母とする変体仮名

日記 by yasuoka

とあるイキサツで、「野」を字母とする変体仮名を調べるハメになった。国立国会図書館で明治・大正期の図書をざっと探してみたところ、川崎斯文『變体假名手本』(若林春和堂、明治44年3月)と、木村剛石『新書道之研究』(二松堂書店、大正6年1月)に、「野」を字母とする変体仮名が掲載されているのを見つけた。この時点で、「野」を字母とする変体仮名を認める流派が、少なくとも仮名書道には存在していた、ということだろう。ただし、「野」を字母とする変体仮名は、文字情報基盤には収録されていない。さて、これからどうしようかな。

14093717 journal
人工知能

yasuokaの日記: 2020年センター漢文の返り点・読み下し文平行コーパス

日記 by yasuoka

2020年大学入試センター試験『国語』第4問の漢文本文に対し、返り点つき漢文と読み下し文の平行コーパスを作ってみた。読み下し文の方は、RIBES等で使いやすいよう、単語ごとに空白で区切ってある。私(安岡孝一)の日記を読んで下さっている皆さんの役に立つかどうかは不明だが、とりあえず公開しておくことにする。

typodupeerror

最初のバージョンは常に打ち捨てられる。

読み込み中...