yasuokaの日記: Unicode 10.0.0がリリース 68
日記 by
yasuoka
昨日(6月20日)付でUnicode 10.0.0がリリースされたとの連絡を、日本時間の今日(6月21日)にいただいた。今回のリリースでは8518字が追加されていて、うちCJK統合漢字拡張Fが7473字(U+2CEB0~U+2EBE0)、変体仮名が285字(U+1B002~U+1B11E)の追加である。私(安岡孝一)個人としては、これで戸籍統一文字と住民基本台帳ネットワーク文字がほぼ一段落したのがありがたいが、5月23日・24日の日記にも書いたとおり、多少、問題が積み残しとなってしまった。また、絵文字の追加(U+1F900~U+1F9E6)や、「BITCOIN SIGN」の追加(U+20BF)は、今後、微妙な禍根を残す気がしないでもない。まあ、とりあえずは、戸籍統一文字と住基統一文字のIVS提案を、早急に進めてもらうべきかしら。
戸籍統一文字について (スコア:1)
フォントのデザイナーが違うせいか、免許証(これもそうだよね?)の自分の名前に違和感のありまくりな文字が一文字。。。
今後も、この状況だけは変わらないんだろうなあ。。。
Re:戸籍統一文字について (スコア:1)
だってデザイン差って主張しても俺の字を勝手に変えるなとか言い出すキチガイを相手にするための仕様なんだもん。
縦線重ね $ ¢、丸囲み、括弧囲み (スコア:1)
丸囲み数字、括弧囲み数字の様に、
全てのアルファベットで縦線重ね文字が導入されていれば
Bitcoinびいきと見られずに済んだかも知れない
# 横線ダブル重ねも全アルファベットで欲しい
# ¥ ₤ € ₣ ₩ ₦
# そもそも丸囲み、括弧囲みは italic bold strike underline の様に
# 文字に対する修飾として実装して欲しかったと思っている
Re: (スコア:0)
「¥」見て思い出したけど、マイクロソフト系OSでUn*x系コマンド打つときに出てくる「バックスラッシュのかわりの通貨記号」、いい加減なんとかならんのかしら
Re: YEN SIGN問題縁起 (スコア:3)
まあ、「REVERSE SOLIDUS (rendered as Halfwidth Yen Sign)」の問題は、1996年時点で解決できなかった以上、今後もずっと残ると思うのです。よければ、私(安岡孝一)の2006年6月5日の日記 [srad.jp]もどうぞ。
Re:縦線重ね $ ¢、丸囲み、括弧囲み (スコア:2, 参考になる)
別にMSのせいじゃない。
https://ja.wikipedia.org/wiki/ [wikipedia.org]円記号
> ISO/IEC 646は128文字分の領域を持つ符号化文字集合だが、このうち12文字は各国で自由に決めてもよい領域である。
> JIS X 0201 円記号が割り当てられた0x5C番地はこの12文字の1つであり、ASCIIではバックスラッシュ (\) 記号が割り当てられていた。
> 従って、ASCIIなどで記述された文書を JIS X 0201 によるものと解釈して読むとバックスラッシュ (\) が円記号 (¥) に文字化けする
ただし、MSはモビルスーツを表す。
Re: (スコア:0)
シフトJISならともかく、UnicodeのU+005CをJIS X 0201と解釈する余地は(本来)ないから関係ない。問題はMSがシフトJISの0x5CをU+005Cにマップしていることだが、それをMSが悪いで済ませられるかはかなり微妙(そうしたくなる気持ちはとてもわかる)。
Re: (スコア:0)
「微妙」どころか、円記号とバックスラッシュを別のコードに割り当てたら世の中大パニックだよ。Microsoftのやり方以外の選択肢はない。
Re: (スコア:0)
OSX「せやな。
Re: (スコア:0)
でもあれって、OSやアプリケーションとしては単にフォントファイルに従って見た目を描画しとるだけやんな。
俺のお気に入りはNasuフォント [hatenablog.com]。こいつのU+005cに対応するグリフ(って言っていいの?)はバックスラッシュ。
というか、元となった源ノ角ゴシックから既にそうなんだっけ?知らん。
# まあ俺個人は別に円マークでも全然戸惑わないし、Nasuフォント気にいってるのは、普通にいろいろキレイだからだけど。
Re: (スコア:0)
いやフォントファイル変えれば、「見た目」は解決するように見えるかもしれないが、
内部的には結局、本来「円マーク」と認識されるべきであったコードが入力されていて
他のOSと通信などをしようとする時に、全然解決してないという・・・
(しかもWindows側ではフォントファイルを不正に変えてるから、見た目だけはちゃんとバックスラッシュに見えてしまい
Windows側では何がおかしいのか全然気づかない)
Ruby界隈がMicrosoftに対して不快感を表してるのは、主にそういう所なんだよな。
Re: (スコア:0)
Ruby界隈ってそんなレベル低いMS叩きやってるの?
って思われる様な事言ってるとRuby界隈の人が怒るぞ。
Re: (スコア:0)
こういう質問を見ると、歴史が忘れ去られるものだということを思い知らされるな。
(古参エンジニアは絶対にしない質問)
Re: (スコア:0)
> 縦線重ね文字
U+20D2 COMBINING LONG VERTICAL LINE OVERLAY というのがあるらしい
> 横線ダブル重ね
合成用二重横線は残念ながら(?)なさそう
> 丸囲み、括弧囲み
丸は U+20DD COMBINING ENCLOSING CIRCLE というのが一応あるけど、1文字しか囲めないのではたとえば丸付き数字2桁以上で役に立たない。
括弧はなさそう
Re:縦線重ね $ ¢、丸囲み、括弧囲み (スコア:2)
漢字構成記述文字(U+2FF0~U+2FFB)で数字をくっつけたものに合成用丸囲み(U+20DD)を合わせると行けるかな? と思ったけど、漢字構成記述文字って非漢字をくっつけるのに使えるのかしら?
Re:縦線重ね $ ¢、丸囲み、括弧囲み (スコア:2)
そうだったのか!
「文字」としての取り扱いは並び順も含めて頭痛いわフォントレンダリングもまじめにやろうとすると大変そうだし完全に魔窟だと思ってましたが、そうか、描画しなくていいのか。
……ええと、想定されてないってことは、禁止もされてないってことでしょうか?
なお世間では (スコア:0)
例によって絵文字の話ばかりです。
Re: (スコア:0)
外人を可変長エンコーディングやら合成やらVSやらに否応なく向き合わせたのは大きい
Re: (スコア:0)
向き合ってる?
奴ら完全無視というか理解しないんで尻拭い大変なんだけど、未だに。
インド辺りの下請けやってる連中がメインだけどさ。
日記に書いていらっしゃいましたが (スコア:0)
追加したのは良いけど書き順がよくわからない漢字と言うのは、気が付きませんでした。
あの辺の字を漢字書き取りの試験に出すことはなさそうなので、文科省は管轄外と放り投げそう。
有識者会議というか、漢字研究の有力な研究者がそれぞれの見解を学会のトークセッションでぶつけて、その結果を学会とししての見解とする
という手順なんでしょうか。
そもそも今の漢字の書き順って何処で決めたものなのでしょう。
学校で教える範囲は文科省で決めてるんでしょうけど。
Re:日記に書いていらっしゃいましたが (スコア:2)
文字の書き順という物を定義する意義が少ないからどうでもよく思われてるんでしょうかね。
なんとなく、きちんと規格のしてほしい気もします。
プロッターや古いWindowsにあったストロークフォントにはきっと向きと順番があったのでしょうけど。
Re: (スコア:0)
まあ世間的に書き順と呼ばれているのは楷書の書き順ですよね。行書の書き順はまた違いますし。
だいたい、活字の場合は書き順以前に文字の構造自体が違ったりもしますから。例えば手書きで明朝体のしんにょうを書いたり、比の左側を3画で書く人はいない。
Re: (スコア:0)
日本人なら書かないだろうけど外人は活字を見て見よう見まねで書くから書いちゃうよ。中国や台湾のフォントのほうが合理的だ。
Re: (スコア:0)
フォントは見やすさ重視だから、書き文字と異なるのは当然で合理的だよ。
たとえば、アルファベットの g (丸が2つ重なってヒゲが生えてるやつ)を、実際にそんな文字として手書きしないのと同じ。
Re:日記に書いていらっしゃいましたが (スコア:2)
比に限らず漢字がまるで駄目ですが小学校は行ってましたよ
行けば学習できているなんてできる人間のおごりです
# 今なら小学校レベルの漢字はほぼ書けると思うが…
Re: (スコア:0)
あのビャンビャン麺 [wikipedia.org]のやつとかな。
「幺言幺」はなんで「言」が先なのか
「長馬長」はなんで「馬」が先じゃないのか
さっぱりわかんねえ・・
Re: (スコア:0)
文科省が決めたもの以外はなんとなく決まったものです。
書家の流派毎にもあるかもしれませんが。
基本的に綺麗にかければ書き順はどうでも良い。ただ主流な書き順で書くほうが綺麗に書ける。
Re: (スコア:0)
>>そもそも今の漢字の書き順って何処で決めたものなのでしょう。
今ではなく、昔の話なら、親から習った or 寺子屋で習った or 他の人が書いてるのを見て真似た etc
プログラミング言語ではないので、最初に仕様・規格が定まっているわけではありませんん
元号 (スコア:0)
㍾、㍽、㍼、㍻の次はいつ登録されるのだろうか?
新たな元号はUnicodeに入るのか (スコア:2)
とりあえずは、JIS X 0213をすっとばして、ダイレクトにUnicodeに入れるしかない気がしてるんですけど、なかなか予断を許しません。よければ、私(安岡孝一)の2016年8月8日 [srad.jp]・2016年8月10日 [srad.jp]・2017年1月10日 [srad.jp]の日記もどうぞ。
Re:元号 (スコア:1)
それは NEC 特殊文字に入ってたから入れただけだとマジレス
Re: (スコア:0)
コードポイントだけ予約して、グリフは実際に発表されてから決めることもいちおう可能らしい。
Re: (スコア:0)
事前予約なんて不謹慎
Re: (スコア:0)
いや、再来年には新元号だろ
ニュース観てねーのか?
Re: (スコア:0)
譲位の制度を恒久化しないからこういうアホが出てくる
Re:元号 (スコア:1)
アホのために譲位制度の恒久化なんて政治的に危ないことさせる余裕はありません。
Re: (スコア:0)
どれだけ先まで予約するつもりなんだよ。
Re: (スコア:0)
明治より前の元号の組文字も、いつ登録されるのだろう?
Re:元号 (スコア:2)
慶應義塾大学「明治や大正があるんだから慶応も!」
早稲田大学「慶応が登録されるなら早稲田も!」
Re: (スコア:0)
大同は?
Re: (スコア:0)
あ~確かに新元号対応でないと微妙に困るね。
新しいフォーマットでシステムを作り直してくれればいいけれど、金出してくれる客いないんだよなあ。
昨日なんか、2年前から開発して納品したんだけれど、新元号対応が必要なことは分かっているのだから、当然設定変更するだけで対応できるようになっているんだよなって、顧客に脅されたけれど、そんなもの設計要件になってないっていうの。
Re: (スコア:0)
消費税をどう設計しているのか気になります。
Re: (スコア:0)
元号で年次の管理なんかやるわけないんだから、西暦とのコンバーターを作れってだけの話じゃないの?
Re: (スコア:0)
それより、アルファベット1文字がいつまでも持つとも思えないのですが。
QとかXとかLとか使いにくいやつも有るし。
JIS改正およびAdobe-Japan1-7まだー? (スコア:0)
AdobeがAdobe-Japan1-7を制定してくれないと新しい文字が各種フォントに実装されません。
その制定を促すためにも、早めにJIS改正を行ってほしいところですね。
特に今回のUnicode 10で、ようやく入管正字 [wikipedia.org]が揃ったので、タイミング的に丁度良いと思いますし。
Re: (スコア:0)
AdobeとJISは異体字セレクタの互換性がないのに、これを"Uni"codeっていうのはちゃんちゃらおかしい。
ウンコの種類は増えたのか? (スコア:0)
💩💩💩💩💩💩💩💩💩💩
💩💩💩💩💩💩💩💩💩💩
💩💩💩💩💩💩💩💩💩💩
Re: (スコア:0)
牛乳がぶ飲みしたあととか、とうもろこし食いまくったあととか、ニラレバ食った後とか、
そういうバリエーション?
#ニラでぶら下がってるのが感覚でわかる…
Re: (スコア:0)
そういやニホニウムの中文表記がtohuになってましたが (スコア:0)
あれ [science.srad.jp]は今回のアップデートで対応するんでしょうかね