アカウント名:
パスワード:
字型が明らかに似ていない日本語と中国語の文字 (例: '直') はUnicodeの制定段階で同一視されるのに、
そりゃ、字形が基準じゃないからです。
アルファベットの 'a' の代わりにキリル文字の 'а' は別物なの?
ひらがなの「へ」とカタカナの「ヘ」が違うのと同じです。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
人生unstable -- あるハッカー
類似字型の文字は正規化されてないの? (スコア:0)
字型が明らかに似ていない日本語と中国語の文字 (例: '直') はUnicodeの制定段階で同一視されるのに、アルファベットの 'a' の代わりにキリル文字の 'а' は別物なの?
というか、こんなことIDNの実施前に容易に気づくことだと思うんだが…。
てっきり、NAMEPREPで正規化されてるんだと思ってた。
# NAMEPREPとは何か把握できていなかったのでAC
Re:類似字型の文字は正規化されてないの? (スコア:2, 参考になる)
そりゃ、字形が基準じゃないからです。
ひらがなの「へ」とカタカナの「ヘ」が違うのと同じです。
# For man might be free./人は自由になれるかもしれないから。
Re:類似字型の文字は正規化されてないの? (スコア:1)
それはフォントの差だけだと思いますが。
Re:類似字型の文字は正規化されてないの? (スコア:0)
字形がある程度似ている場合は全て同一の文字コードを割り当てるような、新しい文字コード体系を作ってしまうんだ!
… 1 と l とか 0 と O とかが同一の文字コードとなってしまった…使えん orz
Re:類似字型の文字は正規化されてないの? (スコア:0)
このような問題のために、Unicodeには、Unicode Standard Annex #15 Unicode Normalization Forms [unicode.org]というのがあります。まぁ、平たく言うと、正規化すれば、'a'も'а'も同一の文字になるよということです。その
Re:類似字型の文字は正規化されてないの? (スコア:1, 参考になる)
>正規化すれば、'a'も'а'も同一の文字になるよということです。
そんな馬鹿な。
BASIC LATINのaとFULLWIDTH AND HALFWIDTH FORMSのaは同一になるが、
BASIC LATINのaとCYRILLICのаは同一にはならない。