パスワードを忘れた? アカウント作成
12873540 journal
日本

yasuokaの日記: 新たな元号にZERO WIDTH JOINERは使えるのか 3

日記 by yasuoka

一昨日の日記に対して、U+200D「ZERO WIDTH JOINER」を使えばいいのではないか、という御意見をいただいた。たとえば「明治」という元号であれば、<U+660E U+200D U+6CBB>とすることで「㍾」を表現しよう、というアイデアだ。まあ、それしか無い気もするのだが、現在UTF-8では「㍾」が3バイトで表現できるのに、それが9バイトにも増えてしまうのは何ともいただけない。

それよりは、すでに組み文字が存在しているような2文字を、元号として定める方がマシな気がする。たとえば「镸久」という元号なら、U+9579に「镹」があるので、わざわざZERO WIDTH JOINERなど使うまでもない。あるいは「金的」という元号でも、U+2B4ABに「𫒫」がある。「才文」という元号なら、ちょっと苦しいがU+6286「抆」で何とかなるだろう。

ただ、JIS X 0213の1-13-62に「镹」を追加した場合、2-91-51との間で重複符号化になってしまう、という問題が存在する。つまり、当該の組み文字が、第1~4水準漢字に含まれている場合には、また新たな問題が起こってしまう、ということだ。ただこれは、ZERO WIDTH JOINERを漢字に対して適用した場合においても、同様に発生しうる問題だと私(安岡孝一)には思えるのだが、さて、どうなんだろう?

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

物事のやり方は一つではない -- Perlな人

読み込み中...