パスワードを忘れた? アカウント作成
726536 journal

kubotaの日記: Unicode vs ISO-2022 5

日記 by kubota

なんでみんな、こんなに感情的になるんだろうね。もっと具体的に事務的に、こっちにはこんな問題があり、あっちにはこんな問題があり、それぞれどれくらい改善される見込みがあり、どんな回避法が考えられ、ということを議論しなきゃ。「いろんな問題がある」とか「クソ実装」とか「よく分かってない人」とかの言葉は、情報量ゼロだし参考にならない。

けっきょく、具体的な内容の議論から逃げているように思えるのだが、どうだろうか。

ぼくとしては、そんな「理想的」なシステムよりも、われわれ日曜プログラマが現実的な手間で実装できる、そこそこ使えるシステムに興味があるのだが。そのための手段は、なんでもいい。

日本語について言えば、いま普及しているさまざまなシステムで使える程度と同程度のものができれば、それでいい。もちろん、それ以上のものであってもいいし、そのほうがいいが。そして、Unicode に基づく国際化ソフトウェアが、現在の日本語ソフトウェアと同等のレベルに達するための要件として、

  • 漢字統合に基づく、フォントのデザインの問題
  • JIS ←→ Unicode 変換テーブルの問題
  • 全角・半角の問題

を挙げたのだが。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • Unicode 絡みになると宗教戦争になるのは昔からですので, いまさら驚きはしません. 何にも考えていない欧米人がいるのも,昔からのこと. といって日本人のレベルだって大して高くないのは, 何年か前に盛り上がった JIS 漢字コード批判でわかるとおりですが.

    漢字のフォントについては,Unicode は 「上位レベルで言語指定をつけてフォント切り替えをすればよい」 という立場だし, 「必要ならば言語タグを使えばいい」 といって言語タグ用コードポイントも追加したから, それでいいということなのでしょう. 「ISO 2022 の時は区別できていた」といっても, だいたい ISO 2022 のときは JIS X 0208 の日本の漢字と GB 2312 の中国の漢字との間に, 「この文字とあの文字とは同じ文字である」 という関係すらなくて, まったく別の文字扱いだったから, フォントも別々にならざるを得なかったわけです. その結果,「日本語であると中国語であるとにかかわらず, ある文字を検索したい」という処理は逆に難しかった. (「『毛沢東』が一発検索!」じゃないけれど, その点では Unicode の方が便利.)

    「プレーンテキストでも日本語と中国語とが区別できる」 というのは,そういう意味では,ISO 2022 という 枠組みを使っていた結果 たまたま 出てきた特質であって, Unicode にした結果,こんどはその特質がなくなって 別の特質が出てきただけのことです.

    たとえば,ISO 646 では ASCII に相当するコード表 (ここでは「符号化文字集合」のことをそう呼ぶことにします) に 「各国版」があって,たとえば「ISO 646 の英国版」では ASCII の # の位置に £ を置いていました. ISO 646 の米国版 (ASCII) と英国版とを ISO 2022 の制御シーケンスを使って切り替えて使えば, 「プレーンテキストでもイギリス英語とアメリカ英語とが 区別できる」わけですが, それで便利になるのはスペルチェッカーくらいのものです. しかし,ISO 646 のケニヤ版なんてないから, 「スワヒリ語を区別したい」なんて言われてもできない. ISO 2022 でできる言語識別なんて,その程度のものです.

    漢字に話を戻せば,日本・中国・台湾・韓国は ISO 2022 の 枠組みのコード表があったから区別できるけれど, たとえばベトナム語漢字のコード表はないので 区別はできないのです. たとえば「胡志明」という名前のベトナム人指導者がいましたが, この人の名前をベトナム風 (というのがあるかどうかも知りませんが) に表示したいといっても ISO 2022 では無理なわけです.

    一般論ばかりで済みませんが, 与えられた環境の制約のなかでなんとかするしかないので, どうしても日本語と中国語とでフォントを区別したければ, それを識別できる情報をどこかに埋め込むしかありません. (デフォルトを日本風フォントにするか中国風フォントにするかを 選べるようにするとか,選択を許す必要もあるでしょう.) プレーンテキストでやりたいと言われれば, 「できない」としか言えません.

typodupeerror

日本発のオープンソースソフトウェアは42件 -- ある官僚

読み込み中...