パスワードを忘れた? アカウント作成

みんなの日記はここから一覧を見ることができます。

13935542 journal
人工知能

yasuokaの日記: Re: 「望遠鏡で泳ぐ彼女を見た」の直接構成鎖解析木をGraphvizで可視化する

日記 by yasuoka

昨日の日記で書いたGraphvizによる直接構成鎖解析木だが、いくつか試した結果、最下段の単語列にあたる層はrank=sinkではなく、全体を一つのshape=recordで書いた方がいい、という結論に至った。とりあえず、「望遠鏡で泳ぐ彼女を見た」の構成鎖不可分性付きUniversal Dependenciesを見直してみよう。

13935268 journal
人工知能

yasuokaの日記: 「望遠鏡で泳ぐ彼女を見た」の直接構成鎖解析木をGraphvizで可視化する

日記 by yasuoka

6月3日の日記に続いて、「望遠鏡で泳ぐ彼女を見た」の直接構成鎖解析木を、Graphvizで書いてみることにした。まずは「望遠鏡で泳ぐ彼女を見た」のUniversal Dependenciesに、構成鎖不可分性(catena inseparability)を付与してみよう。

13930433 journal
人工知能

yasuokaの日記: UDPipe APIのpython3ラッパー

日記 by yasuoka

昨日の日記を読みながら、LINDAT/CLARINのUDPipe API向けpython3ラッパー「UDPipe2UD.py」を書いてみた。Universal Dependenciesのid、form、lemma、upos、xpos、feats、head、deprel、deps、miscを全部格納するようにしたため、ちょっと長くなってしまった。

#! /usr/bin/python3 -i

13929635 journal
人工知能

yasuokaの日記: COTOHA APIのUniversal Dependencies向けpython3ラッパー

日記 by yasuoka

一昨昨日の日記で、私(安岡孝一)は書いた。

せめてCOTOHA APIも、ちゃんとUniversal Dependencies v2対応してくれないかなぁ。

『自然言語処理のためにMeCabを入れるのに疲れたのでCOTOHA APIを使った』を横目に見つつ、私なりにあれこれ考えてみて、COTOHA API構文解析v1のUniversal Dependencies v2向けpython3ラッパー「Cotoha2UD.py」を書いてみた。UPOSへの変換を、ある程度ちゃんとしようとしたら、思ったより長くなってしまった。

13928858 journal
人工知能

yasuokaの日記: UDPipeの古典中国語モデルがリリース

日記 by yasuoka

UDPipe 1.2が古典中国語(漢文)をサポートした、との御連絡をいただいた。Universal Dependencies 2.4の「四書」を学習させたモデルなのだが、「文切り」の性能が38.9%までしか上がらなかったので、あくまで「単語切り」「品詞付与」「係り受け」に限定した方がいいだろう、とのことである。LINDAT/CLARINのサーバAPIにも実装されたので、ちょっと使ってみよう。

13927963 journal
人工知能

yasuokaの日記: NLP-Cubeで読む『吾輩は猫である』

日記 by yasuoka

AdobeのNLP-Cube 0.1.0.7がリリースされた、との御連絡をいただいた。とりあえず、pip3とpython3で、日本語モデル1.1も含め、インストール。

% pip3 install nlpcube==0.1.0.7
% python3
>>> from cube.api import Cube
>>> Cube().load("ja",1.1)
>>> quit()

13926917 journal
人工知能

yasuokaの日記: 「望遠鏡で泳ぐ彼女を見た」の係り受けをCOTOHA APIで解析する

日記 by yasuoka

COTOHA APIの係り受け解析がUniversal Dependencies準拠だと聞いたので、試しに使ってみることにした。「アクセストークン」の取得がかなり面倒くさいのだが、そこまで行けば、あとはcurl一発で「望遠鏡で泳ぐ彼女を見た」を文法解析できる。

13925829 journal
バグ

yasuokaの日記: 「望遠鏡で泳ぐ彼女を見た」の係り受け構造をGraphviz 2.38で可視化する

日記 by yasuoka

昨日の日記で書いたDOT言語だが、私(安岡孝一)の手元のGraphviz 2.38にはバグがあるらしく、shape=recordの中の日本語がうまく表示されない。ちなみに、このバグには「回避策」があって、日本語の前後に空白(U+0020)を入れれば大丈夫らしい。

13924829 journal
日記

yasuokaの日記: 「望遠鏡で泳ぐ彼女を見た」の係り受け構造をGraphvizで可視化する 1

日記 by yasuoka

『GraphvizでStanfordNLPの係り受け構造を描画』に触発されて、私(安岡孝一)もGraphvizを触ってみた。例として「望遠鏡で泳ぐ彼女を見た」

13922591 journal
政府

yasuokaの日記: 戸籍法改正がデジタルファースト法とともに官報告示 92

日記 by yasuoka

本日(5月31日)付の官報号外第23号で、戸籍法の一部を改正する法律が告示された。デジタルファースト法による住民基本台帳法改正とマイナンバー法改正が、一体となっておこなわれたものなので、改正が非常に多岐に渡るのだが、私(安岡孝一)なりに勘所をまとめておこうと思う。

戸籍法改正の目玉は、これまでは紙の「帳簿」が戸籍の正本だった(第七条)ものが、今後はデジタルデータが戸籍の正本となる、という点である。第百十八条の改正と附則第三条の経過措置によって、もう、紙の戸籍には戻れなくなる。また、第百二十条の二を新設することで、これまで本籍地でしか取得できなかった「戸籍謄本」(戸籍全部事項証明書)が、全国どこの市区町村においても「戸籍電子証明書」の形で取得できるようになる。

13922592 submission
政府

戸籍法改正がデジタルファースト法とともに官報告示

タレコミ by yasuoka
yasuoka 曰く、
本日(5月31日)付の官報号外第23号で、戸籍法の一部を改正する法律が告示された。デジタルファースト法による住民基本台帳法改正とマイナンバー法改正が、一体となっておこなわれたものなので、改正が非常に多岐に渡るのだが、私(安岡孝一)なりに勘所をまとめておこうと思う。

戸籍法改正の目玉は、これまでは紙の「帳簿」が戸籍の正本だった(第七条)ものが、今後はデジタルデータが戸籍の正本となる、という点である。第百十八条の改正と附則第三条の経過措置によって、もう、紙の戸籍には戻れなくなる。また、第百二十条の二を新設することで、これまで本籍地でしか取得できなかった「戸籍謄本」(戸籍全部事項証明書)が、全国どこの市区町村においても「戸籍電子証明書」の形で取得できるようになる。

住民基本台帳法改正の目玉は「戸籍の附票」のデジタルネットワーク化である。第三十条の四十一~第三十条の四十四の十二を新設することで、住民基本台帳ネットワークと同様の、戸籍の附票ネットワークを全市区町村と全都道府県とJ-LIS(地方公共団体情報システム機構)の間で構築する。戸籍の附票ネットワーク上を流れるのは、第十七条(改正後)の以下の7つの項目である。

第十七条 戸籍の附票には、次に掲げる事項について記載(前条第二項の規定により磁気ディスクをもつて調製する戸籍の附票にあつては、記録。以下同じ。)をする。
 戸籍の表示
 氏名
 住所(国外に転出をする旨の第二十四条の規定による届出(次号及び第七号において「国外転出届」という。)をしたことによりいずれの市町村においても住民基本台帳に記録されていない者(以下「国外転出者」という。)にあつては、国外転出者である旨)
 住所を定めた年月日(国外転出者にあつては、その国外転出届に記載された転出の予定年月日)
 出生の年月日
 男女の別
 住民票に記載された住民票コード(国外転出者にあつては、その国外転出届をしたことにより消除された住民票に記載されていた住民票コード。第三十条の三十七及び第三十条の三十八において同じ。)

マイナンバー法改正の目玉は、国外転出者にもマイナンバー(個人番号)を付与する、という点である。住民票コードとマイナンバーの間の紐付は、現状は住民票(および住民基本台帳ネットワーク)によっておこなわれているが、今後はこれに、戸籍の附票ネットワークが加わる。この際、通知カードは廃止され、本人へのマイナンバーの通知は、別の方法(場合によっては紙以外の方法)でおこなわれることになる。一方、第二十一条の二および第四十五条の二を新設(ただし一部はその後に第九条第三項へ移動)することで、戸籍の「副本」と情報提供用個人識別符号(いわゆる機関別符号)が紐付けられる。つまり、戸籍(つまりは日本国民全部)とマイナンバーが直接に結び付けられないよう法律上は書かれているものの、実際には、戸籍の附票や住民基本台帳ネットワークを経由して、戸籍とマイナンバーが紐付けられることになる。

なお、戸籍法改正の施行日は6月19日だが、他の法律改正の施行日は年末以降になりそうである。また、全システムが稼働するには、実際には2年程度かかりそうである。

13915337 journal
日本

yasuokaの日記: Re: 住基文字b077「𭖬」を含む地名

日記 by yasuoka

昨日の私(安岡孝一)の日記に対して、下田市は現在この地名を「祢宜𭖬」ではなく「祢宜崥」として扱っている、との情報を複数の方々からいただいた。うーむ、だとするとb077「𭖬」(山へんに昇)を、単純に、大漢和8207「崥」の別体、としてしまっていいのかしら? さて、どうしよう…

13914125 journal
日本

yasuokaの日記: 住基文字b077「𭖬」を含む地名

日記 by yasuoka

住基文字b077「𭖬」(山へんに昇)を含む地名が下田市にある、という情報をいただいたので、静岡県立中央図書館に『静岡県(稲梓地区)下田市土地宝典その三』(昭和49年1月、帝国地図)を閲覧に来た。第十四図「大字相玉」のやや北西側に、確かに「祢宜𭖬」という地名が書かれている。稲梓駅から県道15号線を西へ4kmほど、波夜多麻和氣命神社(法人番号1080105004441)の南東側が、この「祢宜𭖬」にあたるようだ。

13912967 comment

yasuokaのコメント: 日本語係り受け解析エンジンとしてのGiNZA (スコア 1) 29

by yasuoka (#3617594) ネタ元: Universal Dependencies 2.4がリリース

今日の私(安岡孝一)の日記で、GiNZAを紹介しておきました。ただ、GiNZAは日本語専用なので、Universal Dependenciesを係り受け解析に使うなら、できれば他の言語にも挑戦してほしいな、というのが正直なところです。よければどうぞ。

typodupeerror

人生の大半の問題はスルー力で解決する -- スルー力研究専門家

読み込み中...