パスワードを忘れた? アカウント作成

スラドのRSSを取り込んでみよう。

13985904 journal
人工知能

yasuokaの日記: 古典中国語(漢文)の形態素解析・係り受け解析のためのudkanbun

日記 by yasuoka

思うところあって、古典中国語(漢文)の形態素解析・係り受け解析をUniversal Dependenciesでおこなうpython3モジュールudkanbunを、PyPIからリリースした。UDPipe・MeCab用の言語モデルを、モジュールに含めておいたので

% pip3 install udkanbun

一発でインストールできるはずである。使い方も簡単で、たとえば「不入虎穴不得虎子」を形態素解析・係り受け解析するには

13981776 journal
人工知能

yasuokaの日記: 英語係り受け解析エンジンとしてのspacy_udpipe

日記 by yasuoka

ネットサーフィンしていたところ、spacy_udpipeというpython3ライブラリを見つけたので、試してみることにした。UDPipeの各言語モデルをpythonでラップして、spaCyから使えるようにしたライブラリのようだ。まずはpip3とpython3でインストール。

% pip3 install spacy_udpipe
% python3
>>> import spacy_udpipe
>>> spacy_udpipe.download("en")
>>> quit()

13980267 comment

yasuokaのコメント: JIS X 0221改正作業中 (スコア 2) 2

by yasuoka (#3668322) ネタ元: 大漢和番号14404は本当にU+2339Fなのか

実は今、JIS X 0221の改正作業中なのですけど、そこで使う予定のコードテーブルにも、U+2339FにJMJ-037911は載せてないんですよね。なので、忘れないうちに私(安岡孝一)の日記に書いておこう、と思ったりしたわけです。

13979957 journal
日本

yasuokaの日記: 大漢和番号14404は本当にU+2339Fなのか 2

日記 by yasuoka

大漢和番号14404「⿰月𡬶」を眺めていたのだが、何とも得体の知れない漢字だ。姓に使う漢字らしいのだが、私(安岡孝一)自身は実際の用例を見たことがない。この漢字が、戸籍統一文字

13978088 comment

yasuokaのコメント: Re:26/256 の戦略に戻っちゃいますが (スコア 1) 18

yo4さんの昨日の日記、見せていただきました。21バイト82ステート、素晴らしい。

78      LD A,B
E6 FE  AND FEH
4F      LD C,A
1F     RRA
1F     RRA
81     ADD C
1F     RRA
81     ADD C
E6 F0  AND F0H
1F     RRA
1F     RRA
4F      LD C,A
1F     RRA
1F     RRA
67      LD H,A
81     ADD C
2F     CPL
07    RLCA
88     ADC B

商を5倍する際に、4倍の中間値をCレジスタにしまっておいて、それを足しこむあたり絶妙です。素晴らしい。

13976489 journal
人工知能

yasuokaの日記: 韓国語の係り受け解析エンジンとしてのStanfordNLP

日記 by yasuoka

一昨日の日記の続きだが、StanfordNLPでも、ko_gsdモデルを使った韓国語の係り受け解析がおこなえる。とりあえずpip3とpython3で、StanfordNLPとko_gsdモデルをインストールしよう。

% pip3 install stanfordnlp
% python3
>>> import stanfordnlp
>>> stanfordnlp.download("ko_gsd")
>>> quit()

13976353 comment

yasuokaのコメント: Re:26/256 の戦略に戻っちゃいますが (スコア 1) 18

最下位ビットをクリアして13/128倍で先に商を求める。というのを、ざっと書いてみたのですが、24バイト90ステートになっちゃいました。もう少し縮まるかなぁ。

78      LD A,B
E6 FE  AND FEH
87     ADD A
4F      LD C,A
80     ADD B
1F     RRA
0F    RRCA
0F    RRCA
0F    RRCA
0F    RRCA
81     ADD C
3F     CCF
99     SBC C
3C     INC A
E6 0F  AND 0FH
67      LD H,A
87     ADD A
87     ADD A
84     ADD H
2F     CPL
07    RLCA
88     ADC B

13974819 journal
人工知能

yasuokaの日記: 韓国語の係り受け解析エンジンとしてのUDPipe

日記 by yasuoka

思うところあって、韓国語の係り受け解析をUDPipeで試してみた。現時点のUDPipeには、韓国語向けにKorean-KaistとKorean-GSDの2つのモデルがあるのだが、私(安岡孝一)個人の感触としてはKorean-GSDの方が肌に合っている気がする。7月3日の日記で書いた「Chamame2UD.py」を使いまわして、試しに「그래서 그들은 바다로 갔다.」を係り受け解析してみよう。

13973460 comment

yasuokaのコメント: さらに改良 (スコア 1) 18

よくよく考えたら、最初のB×1.5の部分を改良して

78      LD A,B
C6 20  ADD 20H
1F     RRA
80     ADD B
4F      LD C,A
0F    RRCA
0F    RRCA
0F    RRCA
0F    RRCA
81     ADD C
3F     CCF
99     SBC C
E6 0F  AND 0FH
67      LD H,A
87     ADD A
87     ADD A
84     ADD H
2F     CPL
07    RLCA
88     ADC B

とすれば、22バイト86ステートにできるようです。

13973452 journal
日記

yasuokaの日記: Z80における定数10の除算は、いったいどこまで速くなるのか 18

日記 by yasuoka

昨日の日記で書いた「Z80で、Bレジスタに0~99の整数が入っている時に、10で除算した商をHレジスタに、余りをAレジスタに返す」という問題だが、51/512≒1/10で商を先に求める方法において、上位4ビットと下位4ビットを逆転する、という途方もないアイデアをいただいた。ちょっと書いてみよう。

13973095 journal
日記

yasuokaの日記: Re:Z80における定数10の除算は、商と余りのどちらを先に求めるべきか 2

日記 by yasuoka

一昨日の日記で書いた「Z80で、Bレジスタに0~99の整数が入っている時に、10で除算した商をHレジスタに、余りをAレジスタに返す」という問題だが、余りをDAAで先に求めて、その後に商を求める方法を、改良できてしまった。

typodupeerror

計算機科学者とは、壊れていないものを修理する人々のことである

読み込み中...