パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

九州某県、ネット監視で祭られる(w」記事へのコメント

  • by Anonymous Coward

    ↑これなに?
    • Unicodeの負の部分、『Wave Dash - Fullwidth Tilde問題』です。
      JISコード0x2141の全角波型文字をUnicodeに変換するときのマッピングテーブルが共通化されていないために、異なるOSからアップされたテキストが化けてしまいます。

      Windows:
      ~ : U+FF5E Fullwidth Tilde

      それ以外:
      〜 : U+301C Wave Dash

      Google等で佐賀してみると根の深い問題であることが分かりますよ。
      • by zenkakueisuuji (20374) on 2006年10月21日 8時29分 (#1041769) 日記
        いや、それ、共通化されていないというのは不正確ですよ。
        Windows のマッピングが間違っている(波ダッシュとチルドを混同している)というだけですから。
        問題は、これを意図的にやっているのか それとも自社内の互換性を標準準拠より優先するためなのか Microsoft が絶対に直そうとしない点です。 そして Microsoft は Unicode を積極的に推進してきた企業でありのユーザが数は一番多いために「まさか、Microsoft がそんなあきらかな間違いはしないだろう」、「共通化されていない Unicode の問題だ」などという印象を持たれてしまっていることです。
        ぐぐってみても、多く引っかかるには「非共通論」だと思われるので、 それよりも 斯界の泰斗のコメント [srad.jp]を参考にされてはいかがでしょうか。
        親コメント
        • by mew (23987) on 2006年10月21日 13時13分 (#1041919)

          散々既出かもしれませんが、Javaで文字コード変換処理がかかわるときに以前から参考にさせていただいている「日本語のUnicodeベンダ依存文字表 [ingrid.org]」へのリンクです。

          Microsoftばかりが悪者にされていますが、事態はもっと複雑だっつーことで。

          親コメント
        • by T.Sawamoto (4142) on 2006年10月21日 13時37分 (#1041929)
          そちらの日記に付けられたコメントを読むと、

          Re:Microsoft のマッピング [srad.jp]
          えっと、『Unicode Encoding to DBCS Code Page & Asian Standards Mappings』(The Unicode Standard, Version 1.0, Volume 1 (October 1991), pp.560-604所収)のXJISと『Shift-JIS to Unicode, Version 0.9』(8 March 1994)を較べてみたところ、少なくとも以下の7字のマッピングが変更されています。
          のリストの中に「0x8160 U+FF5E→U+301C」記述がありますよね。つまり、後から変えたのはUnicode側のようです。
          Microsoftとしては、既に普及してしまっている変換ルールを今更修正するわけにはいかないでしょう。
          (どのバージョンからかは不明ですが、MS-Word等はUnicodeで文字を格納してますし)
          少なくとも、今の時点で変更されたら私は怒ります(^^;)
          そうした経緯も含めて、根の深い問題だなあと。
          親コメント
          • by zenkakueisuuji (20374) on 2006年10月21日 13時52分 (#1041938) 日記
            そのコメントからの引用から
            で、Microsoftは、これらの変更のうち、0x8157、0x815D、0x81FCは従ったけど、残り4つは従わなかった、ってことですよね。うーん、どうしてなんだろう…。
            を省略したのは何故ですか? 本コメントの趣旨がMicrosoftには誤りを正すチャンスがあったのにしなかったことを示しているのに、まるで逆の(後だしされてどうしようもできなかった)ように見えるように引用するのはアンフェアですよ。
            親コメント

一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy

処理中...