アカウント名:
パスワード:
> 簡体字混じりの日本語表記は、日本語母語話者にこの開発者は言語について気にかけていないと感じさせてしまう
感じさせるというか、正しく気にかけてないんだと思うけれど、非漢字圏の人がアウトプットを見て「文字セットが合ってない」と認識することは可能なんだろうか。
今時みんなUTF-8使ってるんだから、表面上の文字セットはUnicode文字セットだよ。ストーリーが「文字セット」って言ってるけどグリフセットの間違いでしょ。
記事より
そもそも日本語の漢字と簡体字と繁体字が混同されてしまいがちなのは、Unicodeが設計された時に、文字セットのサイズを小さくするために中国語・日本語・韓国語で使われる同等の漢字には同等のコードポイントが与えるUnihanが定められたためです。「刃」は日本語の漢字と簡体字と繁体字と韓国語の漢字でそれぞれ見た目が異なりますが、Unicode上では同じコードポイントを与えられており、レンダリングの時に選択した文字セットに応じてふさわしい漢字を表示する仕組みです。
つまり、日本語に翻訳しているのに簡体字や繁体字が表示されてしまう現象の多くは、文字セッ
unicodeの「文字」は「グリフ」ではありません。CJKVの違いは「グリフ」のバリエーションでしかなく、あくまで1コードポイントに割当たっているのは同一「文字」という考えです。
unicodeには、言語の指定はありません。自分で好きなフォントを使えば? という態度ですね。東アジア人は、外国語の表記に外国語のグリフを使う文化がありません、だそうです。言語の指定みたいなものがあるとしたら、それはunicodeの範囲外の話です。
#この件に関してはこれ以上突っ込む気にはなれません。
言語タグって今も有効なんですか?# 現実には使えないと思いますが、それはともかく。
あと、Unicode FAQ Chinese and Japanese [unicode.org]ってのは真面目に受けとってはいけないんでしょうか?
言語タグ以外のタグ文字がemojiで再利用するためにdeprecate解除されていて草
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲは一日にしてならず -- アレゲ見習い
違いの認識 (スコア:3)
> 簡体字混じりの日本語表記は、日本語母語話者にこの開発者は言語について気にかけていないと感じさせてしまう
感じさせるというか、正しく気にかけてないんだと思うけれど、
非漢字圏の人がアウトプットを見て「文字セットが合ってない」と認識することは可能なんだろうか。
Re: (スコア:3)
今時みんなUTF-8使ってるんだから、表面上の文字セットはUnicode文字セットだよ。
ストーリーが「文字セット」って言ってるけどグリフセットの間違いでしょ。
Re: (スコア:1)
記事より
そもそも日本語の漢字と簡体字と繁体字が混同されてしまいがちなのは、Unicodeが設計された時に、文字セットのサイズを小さくするために中国語・日本語・韓国語で使われる同等の漢字には同等のコードポイントが与えるUnihanが定められたためです。「刃」は日本語の漢字と簡体字と繁体字と韓国語の漢字でそれぞれ見た目が異なりますが、Unicode上では同じコードポイントを与えられており、レンダリングの時に選択した文字セットに応じてふさわしい漢字を表示する仕組みです。
つまり、日本語に翻訳しているのに簡体字や繁体字が表示されてしまう現象の多くは、文字セッ
Re: (スコア:0)
unicodeの「文字」は「グリフ」ではありません。CJKVの違いは「グリフ」の
バリエーションでしかなく、あくまで1コードポイントに割当たっているのは
同一「文字」という考えです。
unicodeには、言語の指定はありません。自分で好きなフォントを
使えば? という態度ですね。
東アジア人は、外国語の表記に外国語のグリフを使う文化がありません、
だそうです。
言語の指定みたいなものがあるとしたら、それはunicodeの範囲外の話です。
Re:違いの認識 (スコア:4, 興味深い)
#この件に関してはこれ以上突っ込む気にはなれません。
Re: (スコア:0)
言語タグって今も有効なんですか?
# 現実には使えないと思いますが、それはともかく。
あと、Unicode FAQ Chinese and Japanese [unicode.org]ってのは真面目に受けとってはいけないんでしょうか?
Re: (スコア:0)
言語タグ以外のタグ文字がemojiで再利用するためにdeprecate解除されていて草