パスワードを忘れた? アカウント作成

raycyさんのトモダチの日記。 アカウントを作成して、スラドのモデレーションと日記の輪に参加しよう。

13912960 journal
人工知能

yasuokaの日記: GiNZAで読む『吾輩は猫である』

日記 by yasuoka

私(安岡孝一)の一昨昨日の日記の読者から、GiNZAも紹介してほしい旨の御意見をいただいた。実は4月29日の日記で、さりげなく紹介してるのだけど、とりあえずpip3でGiNZA 1.0.2をインストール。

% pip3 install https://github.com/megagonlabs/ginza/releases/download/v1.0.2/ja_ginza_nopn-1.0.2.tgz

インストールがうまくいったら、昨日と同様、言語処理100本ノック2015の『吾輩は猫である』から、「ヴァイオリンを始める」文をGiNZAで探してみよう。

% python3
>>> import spacy,urllib.request
>>> ja=spacy.load("ja_ginza_nopn")
>>> with urllib.request.urlopen("http://www.cl.ecei.tohoku.ac.jp/nlp100/data/neko.txt") as r:
...   q=r.read()
...
>>> u=ja(q.decode("utf-8"))
>>> from spacy.lang.ja_ginza.cli import token_line
>>> for s in u.sents:
...   f=False
...   for w in s:
...     if w.lemma_=="バイオリン" and w.dep_=="obj":
...       if w.head.lemma_=="始める":
...         f=True
...   if f:
...     print("".join(token_line(w,{})+"\n" for w in s))
...
180822    「    「    PUNCT    補助記号-括弧開    _    180823    punct    _    SpaceAfter=No
180823    君    君    PRON    代名詞    _    180829    nsubj    _    SpaceAfter=No|NE=PRODUCT_B
180824    は    は    ADP    助詞-係助詞    _    180823    case    _    SpaceAfter=No|NE=PRODUCT_I
180825    ヴァイオリン    バイオリン    NOUN    名詞-普通名詞-一般    _    180829    obj    _    SpaceAfter=No|NE=PRODUCT_I
180826    を    を    ADP    助詞-格助詞    _    180825    case    _    SpaceAfter=No|NE=PRODUCT_I
180827    いつ頃    何時頃    NOUN    名詞-普通名詞-副詞可能    _    180829    nmod    _    SpaceAfter=No|NE=PRODUCT_I
180828    から    から    ADP    助詞-格助詞    _    180827    case    _    SpaceAfter=No|NE=PRODUCT_I
180829    始め    始める    VERB    動詞-非自立可能    _    180833    advcl    _    SpaceAfter=No|NE=PRODUCT_I
180830    た    た    AUX    助動詞    _    180829    aux    _    SpaceAfter=No|NE=PRODUCT_I
180831    の    の    SCONJ    助詞-準体助詞    _    180829    mark    _    SpaceAfter=No|NE=PRODUCT_I
180832    か    か    PART    助詞-終助詞    _    180829    case    _    SpaceAfter=No|NE=PRODUCT_I
180833    い    い    PART    助詞-終助詞    _    0    root    _    SpaceAfter=No|NE=PRODUCT_I
180834    。    。    PUNCT    補助記号-句点    _    180833    punct    _    NE=PRODUCT_I

SVGで可視化すると、こんな感じ。文末の「い」をrootにするのは議論の余地があるものの、「ヴァイオリンを始める」がうまく検索できている。ただ、UDPipeやStanfordNLPやNLP-Cubeと違って、GiNZAは日本語専用なのがちょっとつらい。せめて、古典中国語(漢文)に対応してくれないかなぁ…。

13912952 journal
日記

akiraaniの日記: ゲームレジェンド行ってきた&ラーメン屋の話

日記 by akiraani

関連

 久しぶりに日曜の朝にちゃんと起きて、お出かけ。
 まあ、とはいっても、フレンディア川口の規模は30分あれば全サークル回れてしまうので、会場に着いたのは13時ごろ。
 さっくり回るが、同人誌ではピンとくるものなし。……うちは子供のころからパソコンがあったかわりい、ファミコンの類がなくて、大学で下宿始めるまでコンシューマのゲームはほとんどやったことがなく、みんなの思う懐かしのレトロゲーの思い出が共有できないのだよな。

 というわけで、D4エンタープライズのところでサイレントメビウスと魔導物語のメモリアルパック的なのを購入。通販でも買えるし、遊ぶ時間取れなくて積みそうだけどなっ。

 その後、近くに住む知人の案内でおすすめのラーメン屋に。煮干し系が売りのお店。
 あの辺、ひそかにラーメン激戦区らしく、狭いエリアにラーメン屋が乱立しているそうな。

 そういえば、府中本町の駅近くのラーメン屋が最近リニューアルしてサンマ節スープなる魚介系のラーメン屋になってたな。そのうち行ってみよう。
 あの界隈も20mほどのエリアにラーメン屋だけで4軒、さらに餃子の王将に東秀と局地的ラーメン激戦区になってるなぁ。

 なお、チャリダーな友人はそのうち府中あたりまで自転車で遠征したいみたいなことを言っていたので、煮干し系で営業時間中はほぼ行列になってるいつみ屋をお勧めしておいた。営業時間が昼のみだということも添えて……。

 余談。自分の行動圏内だと、頻繁に行列の出来てるラーメン屋は上のいつみ屋、ラーメン二郎府中店麺創研 紅ルシーニュ店の三つ。
 一応どれも、1回は行ったことはある。並ぶほどかと言われると、所詮ラーメン屋だからなぁ、というのが個人的感想。
 一番よくいくラーメン屋は横浜家系 大和家 府中店。家系にしてはどぎつくなく、ラーメン頼むとセルフでご飯食べ放題だったり、50円のトッピングでやけくそみたいなボリュームのもやキャベがあったりと味とコスパがバランスよくてそこまで混んでないのが良い。

 それはさておき、行動圏内にスガキヤできないかな。最近、実家近くでもスガキヤが減ってて本当に行く機会がない。安くてうまいのに。

13912925 journal
日記

akiraaniの日記: プチコン4、発売日決定

日記 by akiraani

情報元:公式のTweet
4Gamerの記事

 春予定、春予定、北海道の春はまだかとファンをじらしていたプチコン4の発売日がついに発表された模様。5/23発売でサーバー利用券1個付きで価格は3000円(税込)。

 社長のTweetでもいろいろ情報リークされていて

プチコン3号で動いていた8001エミュを4でつくれば4~5倍の速度で動く
解像度の影響で速度差があまり出ない。スロットは4つに増える
ソフトウェアキーボードはタッチペン使えない(静電パネルだから当たり前だけど)からしんどいかも
音色番号PSG部分が後ろにズレます。描画関係も含めて微妙に仕様が変化する
3号の公開キーから(プログラムを)持ってこれます
サンプルゲームの動画
公式で公開予定のシューティングゲーム
Scratch的なUIを実装したツール
プロジェクトメタデータにアイコンつけられるよ
ピアノToy-Conに対応したFM音源キーボード(開発中)

なんて情報がある。

ベンチマークの画面も出ているので、new3DS、WiiU版と比較すると(参考情報)


        new3DS  WiiU   switch
----------------------
足し算     0622752 1825731 2495385
PRINT文    0161131 0507264 0831113
スプライト移動 0298973 0987110 1183161
ライン描画   0068345 0259912 0324649

正直、ハード性能考えるともうちょっと早くなってもいいんじゃないのという気がしないでもない。
画面解像度や色数が増えたりサウンド機能が強化されたりで単純にベンチマークでは測りきれないところもありそうなので、その影響かも。

13912434 journal
交通

higの日記: リカンベントの前輪ハブをメンテした

日記 by hig

ほぼ一年ぶりにリカンベントの前輪ハブをメンテしました。
前回玉押しとボールを交換してグリスをAZ ウレアグリスにしましたが、少し回転が重めに感じる。
分解してみたら、グリスは乾いていないけど少し茶色くなっていました。
洗浄したらボールはキレイだけど少し茶色い?
玉押しは一筋摩耗跡があるが、一ヶ所小さな虫食い状損傷がありました!レースにも小さな引っ掛かりを発見。
パーツクリーナーで洗い流すと判らなくなるくらいなので、部品交換までは必要ないですかね?今回はそのまま組み立てます。
グリスは多めにレースに盛り、ボールを並べていくと若干隙間が多い?数えてみたら10個しかない。もう1つ入れてみたらキチキチだけど入りました。前回余りが出たので気になってましたが、元のボールも10個だったような気がするなぁ。
まぁ部品もあるし、せっかくなので11個入れておきます。
組み立てて、与圧は強すぎずガタツキ無いよう少しクリッと感じるぐらいにしました。極圧剤MiriTechがあったので隙間から浸透させてみました。

追記 やはり10個が正解のようです。シマノのサイトでは出てこなかったのでワールドサイクルさんのサイトより
http://www.worldcycle.co.jp/category/2748.html
面倒くさいけど、10個に戻さないと。ちゃんと調べればよかった。ロードは11個なのね。だから22個セットで売ってるのか。
今日は日没なのでまた今度。このまま走行させても良いのだろうか?

13912388 journal
人工知能

yasuokaの日記: StanfordNLPで読む『吾輩は猫である』

日記 by yasuoka

StanfordNLPの新しいバージョン0.2.0がリリースされたので、少しばかり動かしてみた。まずは、python3のpip3でインストール。

% pip3 install stanfordnlp==0.2.0
% python3
>>> import stanfordnlp
>>> stanfordnlp.download("ja")

確かに、言語モデルが以前より小さくなっており、私(安岡孝一)の手元では、ダウンロードも処理も早くなっている気がする。試しに、言語処理100本ノック2015の『吾輩は猫である』から、「ヴァイオリンを始める」文を探してみよう。

% python3
>>> import stanfordnlp,urllib.request
>>> ja=stanfordnlp.Pipeline(lang="ja")
>>> with urllib.request.urlopen("http://www.cl.ecei.tohoku.ac.jp/nlp100/data/neko.txt") as r:
...   q=r.read()
...
>>> u=ja(q.decode("utf-8"))
>>> for s in u.sentences:
...   f=False
...   for w in s.words:
...     if w.lemma=="ヴァイオリン" and w.dependency_relation=="obj":
...       if s.words[w.governor-1].lemma=="始める":
...         f=True
...   if f:
...     print("".join("\t".join([str(w.index),w.text,w.lemma,w.upos,w.xpos,w.feats,str(w.governor),w.dependency_relation,"_","_"])+"\n" for w in s.words))
...
1    「    「    PUNCT    _    _    2    punct    _    _
2    君    君    PRON    _    _    11    nmod    _    _
3    は    は    ADP    _    _    2    case    _    _
4    ヴァイオリン    ヴァイオリン    NOUN    _    _    9    obj    _    _
5    を    を    ADP    _    _    4    case    _    _
6    いつ    いつ    NOUN    _    _    7    compound    _    _
7    頃    頃    NOUN    _    _    9    obl    _    _
8    から    から    ADP    _    _    7    case    _    _
9    始め    始める    VERB    _    _    11    acl    _    _
10    た    た    AUX    _    _    9    aux    _    _
11    のかい    のかいる    NOUN    _    _    0    root    _    _
12    。    。    PUNCT    _    _    11    punct    _    _

SVGで可視化すると、こんな感じ。「のかいる」にイラっとくるものの、「ヴァイオリンを始める」がうまく検索できている。ただ、残念ながら、StanfordNLP 0.2.0が学習元にしているのは、旧版のUniversal Dependencies 2.2のようである。Universal Dependencies 2.4への対応は、もうしばらくかかるのかなぁ…。

typodupeerror

吾輩はリファレンスである。名前はまだ無い -- perlの中の人

読み込み中...