パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

不適切な文字コード」記事へのコメント

  • by zenkakueisuuji (20374) on 2007年02月07日 16時40分 (#1105729) 日記
    ウ UnicodeはISO規格化された文字コードであり,2バイト(ucs-2),4バイト(ucs-4)で定義されている。

    UnicodeはUnicode Inc.が定めたものであり、ISOがISO 10646で規格化したのはUCS (Universal Multiple-Octet Coded Character Set)なので不適切。
    という答えではどうでしょうか。
    ISO 10646は、UCS-2やUCS-4も定義しているみたいだけど、UCS-2やUCS-4定義されているわけではないし、Unicodeに関しては
    NOTE – The Unicode Standard, Version 4.0 includes a set
    of characters, names, and coded representations that are
    identical with those in this International Standard. It additionally
    provides details of character properties, processing
    algorithms, and definitions that are useful to implementers.

    ということなので、The Unicode Standardが定義しているものであるという認識ですよね。
    ISOは"byte"でなく"octet"を使うというのもポイントかも。

一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy

処理中...