パスワードを忘れた? アカウント作成

こちらは、yasuokaさんのユーザページですよ。 スラドのTwitterでストーリをフォローしよう。

13887396 journal
人工知能

yasuokaの日記: 望遠鏡は「望遠」「鏡」なのか「望」「遠鏡」なのか

日記 by yasuoka

AdobeのNLP-Cube1.0.5に、新たなモデル1.1がリリースされたとの御連絡をいただいたので、とりあえず日本語モデル1.1をインストールしてみた。

% pip3 install nlpcube
% python3
>>> from cube.api import Cube
>>> Cube(verbose=True).load("ja",1.1)
>>> quit()

wiki.ja.vecをダウンロードしなくなっているので、インストールがそこそこ早い。試しに「望遠鏡で泳ぐ彼女を見た」を解析してみよう。

13882699 journal
人工知能

yasuokaの日記: 日本語係り受け解析エンジンとしてのNLP-Cube

日記 by yasuoka

AdobeのNLP-Cube1.0.5のベクトル・ダウンロード回りが治った、との連絡をいただいた。昨日の日記に続いて、NLP-Cubeの日本語モデルもインストールしてみよう。

% pip3 install nlpcube
% python3
>>> from cube.api import Cube
>>> Cube(verbose=True).load("ja")
>>> quit()

巨大なwiki.ja.vecを筆頭に、あちこちから色んなモノを取ってくるので、とにかくダウンロードに時間がかかるが、一回だけ我慢することになる。次に、インターフェースの準備。

13881856 journal
人工知能

yasuokaの日記: 日本語係り受け解析エンジンとしてのGiNZA・StanfordNLP・UDPipe

日記 by yasuoka

GiNZA1.0.2が一昨日リリースされたので、StanfordNLP0.1.2およびUDPipe1.2.0と比較してみることにした。とりあえずは、python3.7とpip3で、日本語モデルのインストール。

13880198 journal
日本

yasuokaの日記: 「駆け抜ける」と「走り切る」は複合動詞なのか動詞連続なのか

日記 by yasuoka

一昨日以来GiNZA (Ver.1.0.1令和版)と戯れていたのだが、どうも妙なUniversal Dependenciesが出力されるのに気づいた。たとえば「都大路を駆け抜けてゴールまで走り切った」という文に対し

13878689 journal
人工知能

yasuokaの日記: GiNZAが出力したUniversal DependenciesをSVGで可視化する

日記 by yasuoka

リクルートMegagon LabsがGiNZA日本語UDモデル(Ver.1.0.1令和版)をリリースしたので、私(安岡孝一)の「SVGによるUniversal Dependencies可視化ツール」に繋いでみることにした。GiNZA日本語UDモデルは、spaCy上での日本語自然言語オープンソースライブラリで、pip3とpython3があれば

% pip3 install 'https://github.com/megagonlabs/ginza/releases/download/v1.0.1/ja_ginza_nopn-1.0.1.tgz'

13876449 journal
日本

yasuokaの日記: 「令和」の典拠は日本古典なのか漢籍なのか

日記 by yasuoka

私(安岡孝一)の昨日の日記の複数の読者から、「令和」の典拠は日本古典なのか漢籍なのか、という趣旨の御質問を複数いただいた。いや、その、漢文(古典中国語)って本質的にコピペ文化なので、どれが典拠とか普通はわからないと思う。

13875326 journal
エイプリルフール

yasuokaの日記: 新元号は「令和」に、施行は5月1日 199

日記 by yasuoka

次の元号が「令和」に決まった。施行は5月1日を予定している。合字の文字コードとしては、U+337E「㍾」U+337D「㍽」U+337C「㍼」U+337B「㍻」と来て、次はU+32FF「㋿」を予定しているが、5月1日に間に合うかどうかは微妙なセンである。お急ぎの方は、多少、形は違うもののU+29841「𩡁」を使われたい。

13875327 submission
エイプリルフール

新元号は「令和」に、施行は5月1日

タレコミ by yasuoka
yasuoka 曰く、
次の元号が「令和」に決まった。施行は5月1日を予定している。合字の文字コードとしては、U+337E「㍾」U+337D「㍽」U+337C「㍼」U+337B「㍻」と来て、次はU+32FF「㋿」を予定しているが、5月1日に間に合うかどうかは微妙なセンである。お急ぎの方は、多少、形は違うもののU+29841「𩡁」を使われたい。
13873519 journal
NTT

yasuokaの日記: Re: NTT西日本が考えるQWERTY配列の歴史

日記 by yasuoka

「パソコンのキーボードは,なぜABC順・五十音順ではないのですか」の読者から、NTT西日本のチエネッタの記事「キーボードの配置のルーツとキーの役割を知ろう」(ネットのいろは、vol.21、2019年3月28日)を読んでほしい、との御連絡をいただいた。読んでみたのだが、QWERTY配列に関するガセネタが並べ立てられていて、かなり閉口した。

不規則なQWERTY配列になった理由って何?
ではなぜこのような不規則な配置になったのでしょうか。確実な根拠のある理由はわかっていないようですが、諸説あるうちのいくつかを下記にまとめました。

13869401 journal
政府

yasuokaの日記: 改正戸籍法、全ての戸籍を法務大臣が一元管理 75

日記 by yasuoka

国会で審議中の改正戸籍法により、全ての戸籍の副本(コピー)を法務大臣が一元管理することが明らかになった。これまで戸籍およびその副本は、各市区町村と全国の法務局で分散管理してきたが、今回の改正は、これをデジタル化して法務大臣に一元化するもの。同時にマイナンバー法も改正され、全ての戸籍が「情報提供用個人識別符号」と紐づけられると同時に、法務大臣が「個人番号利用事務実施者」の適用除外となる。したがって改正後、法務大臣は、個人情報保護委員会の監督・保護評価を受けずに、自由に全国民のデジタル戸籍を利用可能となる。「特定個人情報保護評価」も適用除外となるため、国民への「パブリックコメント」も実施されない。施行は改元後を予定。

typodupeerror

※ただしPHPを除く -- あるAdmin

読み込み中...