アカウント名:
パスワード:
年末にも内閣告示になる予定の改定常用漢字表 [bunka.go.jp]には、JIS X 0208では表現できない字体が含まれていますので、今後のことを考えればUTF-8(+Extension B)への対応は必須ではないでしょうかね。
参考: 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 [nikkeibp.co.jp]
また頓珍漢な事を。 UTF8は日本語と中国語の判別もできない欠陥コードです。
それを書くならUTF−8って書かなくちゃ。
中国語と日本語の区別がつかないことがあるなんて、ほとんどの人には どうでもいい気がする。
と、言語を区別する方法にもいろいろあるわけで、どの方式を採用するかは確かにほとんどの人にはどうでも良いですが、何らかの方法では区別できるようにしておかないと困るように思います。
言語と文字セットは別の概念ですから、別に定義するのが妥当な考え方ですよね。XHTML だと、xml:lang は、様々な要素にセットできますから、
Content-type: text/xml; charset=UTF-8
で XHTML を返して、要素ごとに日本語か中国語かを入れていけば一番よいのでは?
# ところで、漢文はどっちとして扱うのでしょうか?
簡体字か繁体字か日本の漢字かで判断するしかないですね。
「骨」とか一見似ていて、日中でちょっと違うとかいう漢字があると、混乱します。
その前に、ラテン語の文字と英語の文字を区別できる画期的なコードセットを……
> UTF8は日本語と中国語の判別もできない欠陥コードです。じゃあ中国語を判別とか以前に書くことすらできないガラパゴスコードなんて欠陥とか論評する以前の論外コードですね。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
最初のバージョンは常に打ち捨てられる。
改定常用漢字表 (スコア:3, 興味深い)
年末にも内閣告示になる予定の改定常用漢字表 [bunka.go.jp]には、JIS X 0208では表現できない字体が含まれていますので、今後のことを考えればUTF-8(+Extension B)への対応は必須ではないでしょうかね。
参考:
新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 [nikkeibp.co.jp]
Nullius addictus iurare in verba magistri
Re:改定常用漢字表 (スコア:4, おもしろおかしい)
UTF8は日本語と中国語の判別もできない欠陥コードです。
なんて言って周囲を興ざめさせるやつが出てこないか心配です。
ま、UTF8対応は常識になってくるんでしょうね。
中国語と日本語の区別がつかないことがあるなんて、ほとんどの人には
どうでもいい気がする。
Re:改定常用漢字表 (スコア:2, おもしろおかしい)
それを書くならUTF−8って書かなくちゃ。
Re:改定常用漢字表 (スコア:2)
と、言語を区別する方法にもいろいろあるわけで、どの方式を採用するかは確かにほとんどの人にはどうでも良いですが、何らかの方法では区別できるようにしておかないと困るように思います。
Re:改定常用漢字表 (スコア:1)
言語と文字セットは別の概念ですから、別に定義するのが妥当な考え方ですよね。
XHTML だと、xml:lang は、様々な要素にセットできますから、
Content-type: text/xml; charset=UTF-8
で XHTML を返して、要素ごとに日本語か中国語かを入れていけば一番よいのでは?
# ところで、漢文はどっちとして扱うのでしょうか?
Re: (スコア:0)
簡体字か繁体字か日本の漢字かで判断するしかないですね。
「骨」とか一見似ていて、日中でちょっと違うとかいう漢字があると、
混乱します。
Re: (スコア:0)
一瞬、夜は同じなのかと思った。
Re: (スコア:0)
その前に、ラテン語の文字と英語の文字を区別できる画期的なコードセットを……
Re: (スコア:0)
> UTF8は日本語と中国語の判別もできない欠陥コードです。
じゃあ中国語を判別とか以前に書くことすらできないガラパゴスコードなんて欠陥とか論評する以前の論外コードですね。
Re: (スコア:0)