パスワードを忘れた? アカウント作成
13315895 journal
ニュース

yasuokaの日記: Unicode 10.0.0がリリース 68

日記 by yasuoka

昨日(6月20日)付でUnicode 10.0.0がリリースされたとの連絡を、日本時間の今日(6月21日)にいただいた。今回のリリースでは8518字が追加されていて、うちCJK統合漢字拡張Fが7473字(U+2CEB0~U+2EBE0)、変体仮名が285字(U+1B002~U+1B11E)の追加である。私(安岡孝一)個人としては、これで戸籍統一文字と住民基本台帳ネットワーク文字がほぼ一段落したのがありがたいが、5月23日24日の日記にも書いたとおり、多少、問題が積み残しとなってしまった。また、絵文字の追加(U+1F900~U+1F9E6)や、「BITCOIN SIGN」の追加(U+20BF)は、今後、微妙な禍根を残す気がしないでもない。まあ、とりあえずは、戸籍統一文字と住基統一文字のIVS提案を、早急に進めてもらうべきかしら。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2017年06月24日 8時18分 (#3233316)

    フォントのデザイナーが違うせいか、免許証(これもそうだよね?)の自分の名前に違和感のありまくりな文字が一文字。。。
    今後も、この状況だけは変わらないんだろうなあ。。。

  • by Anonymous Coward on 2017年06月24日 9時23分 (#3233328)

    丸囲み数字、括弧囲み数字の様に、
    全てのアルファベットで縦線重ね文字が導入されていれば
    Bitcoinびいきと見られずに済んだかも知れない

    # 横線ダブル重ねも全アルファベットで欲しい
    # ¥ ₤ € ₣ ₩ ₦

    # そもそも丸囲み、括弧囲みは italic bold strike underline の様に
    # 文字に対する修飾として実装して欲しかったと思っている

    • by Anonymous Coward

      「¥」見て思い出したけど、マイクロソフト系OSでUn*x系コマンド打つときに出てくる「バックスラッシュのかわりの通貨記号」、いい加減なんとかならんのかしら

      • by yasuoka (21275) on 2017年06月25日 8時31分 (#3233702) 日記

        まあ、「REVERSE SOLIDUS (rendered as Halfwidth Yen Sign)」の問題は、1996年時点で解決できなかった以上、今後もずっと残ると思うのです。よければ、私(安岡孝一)の2006年6月5日の日記 [srad.jp]もどうぞ。

        親コメント
      • by Anonymous Coward on 2017年06月24日 10時21分 (#3233355)

        別にMSのせいじゃない。

        https://ja.wikipedia.org/wiki/ [wikipedia.org]円記号

        > ISO/IEC 646は128文字分の領域を持つ符号化文字集合だが、このうち12文字は各国で自由に決めてもよい領域である。
        > JIS X 0201 円記号が割り当てられた0x5C番地はこの12文字の1つであり、ASCIIではバックスラッシュ (\) 記号が割り当てられていた。

        > 従って、ASCIIなどで記述された文書を JIS X 0201 によるものと解釈して読むとバックスラッシュ (\) が円記号 (¥) に文字化けする

        ただし、MSはモビルスーツを表す。

        親コメント
        • by Anonymous Coward

          シフトJISならともかく、UnicodeのU+005CをJIS X 0201と解釈する余地は(本来)ないから関係ない。問題はMSがシフトJISの0x5CをU+005Cにマップしていることだが、それをMSが悪いで済ませられるかはかなり微妙(そうしたくなる気持ちはとてもわかる)。

          • by Anonymous Coward

            「微妙」どころか、円記号とバックスラッシュを別のコードに割り当てたら世の中大パニックだよ。Microsoftのやり方以外の選択肢はない。

      • by Anonymous Coward

        でもあれって、OSやアプリケーションとしては単にフォントファイルに従って見た目を描画しとるだけやんな。
        俺のお気に入りはNasuフォント [hatenablog.com]。こいつのU+005cに対応するグリフ(って言っていいの?)はバックスラッシュ。
        というか、元となった源ノ角ゴシックから既にそうなんだっけ?知らん。
        # まあ俺個人は別に円マークでも全然戸惑わないし、Nasuフォント気にいってるのは、普通にいろいろキレイだからだけど。

        • by Anonymous Coward

          いやフォントファイル変えれば、「見た目」は解決するように見えるかもしれないが、
          内部的には結局、本来「円マーク」と認識されるべきであったコードが入力されていて
          他のOSと通信などをしようとする時に、全然解決してないという・・・
          (しかもWindows側ではフォントファイルを不正に変えてるから、見た目だけはちゃんとバックスラッシュに見えてしまい
          Windows側では何がおかしいのか全然気づかない)

          Ruby界隈がMicrosoftに対して不快感を表してるのは、主にそういう所なんだよな。

          • by Anonymous Coward

            Ruby界隈ってそんなレベル低いMS叩きやってるの?
            って思われる様な事言ってるとRuby界隈の人が怒るぞ。

      • by Anonymous Coward

        こういう質問を見ると、歴史が忘れ去られるものだということを思い知らされるな。
        (古参エンジニアは絶対にしない質問)

    • by Anonymous Coward

      > 縦線重ね文字

      U+20D2 COMBINING LONG VERTICAL LINE OVERLAY というのがあるらしい

      > 横線ダブル重ね

      合成用二重横線は残念ながら(?)なさそう

      > 丸囲み、括弧囲み

      丸は U+20DD COMBINING ENCLOSING CIRCLE というのが一応あるけど、1文字しか囲めないのではたとえば丸付き数字2桁以上で役に立たない。
      括弧はなさそう

      • 丸は U+20DD COMBINING ENCLOSING CIRCLE というのが一応あるけど、1文字しか囲めないのではたとえば丸付き数字2桁以上で役に立たない。
        括弧はなさそう

        漢字構成記述文字(U+2FF0~U+2FFB)で数字をくっつけたものに合成用丸囲み(U+20DD)を合わせると行けるかな? と思ったけど、漢字構成記述文字って非漢字をくっつけるのに使えるのかしら?

        親コメント
  • by Anonymous Coward on 2017年06月24日 8時32分 (#3233319)

    例によって絵文字の話ばかりです。

    • by Anonymous Coward

      外人を可変長エンコーディングやら合成やらVSやらに否応なく向き合わせたのは大きい

      • by Anonymous Coward

        向き合ってる?
        奴ら完全無視というか理解しないんで尻拭い大変なんだけど、未だに。
        インド辺りの下請けやってる連中がメインだけどさ。

  • by Anonymous Coward on 2017年06月24日 10時25分 (#3233358)

    追加したのは良いけど書き順がよくわからない漢字と言うのは、気が付きませんでした。
    あの辺の字を漢字書き取りの試験に出すことはなさそうなので、文科省は管轄外と放り投げそう。
    有識者会議というか、漢字研究の有力な研究者がそれぞれの見解を学会のトークセッションでぶつけて、その結果を学会とししての見解とする
    という手順なんでしょうか。

    そもそも今の漢字の書き順って何処で決めたものなのでしょう。
    学校で教える範囲は文科省で決めてるんでしょうけど。

    • 文字の書き順という物を定義する意義が少ないからどうでもよく思われてるんでしょうかね。

      なんとなく、きちんと規格のしてほしい気もします。

      プロッターや古いWindowsにあったストロークフォントにはきっと向きと順番があったのでしょうけど。

      親コメント
    • by Anonymous Coward

      まあ世間的に書き順と呼ばれているのは楷書の書き順ですよね。行書の書き順はまた違いますし。

      だいたい、活字の場合は書き順以前に文字の構造自体が違ったりもしますから。例えば手書きで明朝体のしんにょうを書いたり、比の左側を3画で書く人はいない。

      • by Anonymous Coward

        日本人なら書かないだろうけど外人は活字を見て見よう見まねで書くから書いちゃうよ。中国や台湾のフォントのほうが合理的だ。

        • by Anonymous Coward

          フォントは見やすさ重視だから、書き文字と異なるのは当然で合理的だよ。

          たとえば、アルファベットの g (丸が2つ重なってヒゲが生えてるやつ)を、実際にそんな文字として手書きしないのと同じ。

    • by Anonymous Coward

      あのビャンビャン麺 [wikipedia.org]のやつとかな。
      「幺言幺」はなんで「言」が先なのか
      「長馬長」はなんで「馬」が先じゃないのか
      さっぱりわかんねえ・・

    • by Anonymous Coward

      文科省が決めたもの以外はなんとなく決まったものです。
      書家の流派毎にもあるかもしれませんが。
      基本的に綺麗にかければ書き順はどうでも良い。ただ主流な書き順で書くほうが綺麗に書ける。

    • by Anonymous Coward

      >>そもそも今の漢字の書き順って何処で決めたものなのでしょう。

      今ではなく、昔の話なら、親から習った or 寺子屋で習った or 他の人が書いてるのを見て真似た etc
      プログラミング言語ではないので、最初に仕様・規格が定まっているわけではありませんん

  • by Anonymous Coward on 2017年06月24日 11時58分 (#3233393)

    ㍾、㍽、㍼、㍻の次はいつ登録されるのだろうか?

    • とりあえずは、JIS X 0213をすっとばして、ダイレクトにUnicodeに入れるしかない気がしてるんですけど、なかなか予断を許しません。よければ、私(安岡孝一)の2016年8月8日 [srad.jp]・2016年8月10日 [srad.jp]・2017年1月10日 [srad.jp]の日記もどうぞ。

      親コメント
    • by Anonymous Coward on 2017年06月24日 19時05分 (#3233561)

      それは NEC 特殊文字に入ってたから入れただけだとマジレス

      親コメント
    • by Anonymous Coward

      コードポイントだけ予約して、グリフは実際に発表されてから決めることもいちおう可能らしい。

      • by Anonymous Coward

        事前予約なんて不謹慎

        • by Anonymous Coward

          いや、再来年には新元号だろ
          ニュース観てねーのか?

        • by Anonymous Coward

          譲位の制度を恒久化しないからこういうアホが出てくる

          • by Anonymous Coward on 2017年06月24日 22時21分 (#3233619)

            アホのために譲位制度の恒久化なんて政治的に危ないことさせる余裕はありません。

            親コメント
          • by Anonymous Coward

            どれだけ先まで予約するつもりなんだよ。

    • by Anonymous Coward

      明治より前の元号の組文字も、いつ登録されるのだろう?

    • by Anonymous Coward

      あ~確かに新元号対応でないと微妙に困るね。
      新しいフォーマットでシステムを作り直してくれればいいけれど、金出してくれる客いないんだよなあ。
      昨日なんか、2年前から開発して納品したんだけれど、新元号対応が必要なことは分かっているのだから、当然設定変更するだけで対応できるようになっているんだよなって、顧客に脅されたけれど、そんなもの設計要件になってないっていうの。

      • by Anonymous Coward

        消費税をどう設計しているのか気になります。

      • by Anonymous Coward

        元号で年次の管理なんかやるわけないんだから、西暦とのコンバーターを作れってだけの話じゃないの?

    • by Anonymous Coward

      それより、アルファベット1文字がいつまでも持つとも思えないのですが。
      QとかXとかLとか使いにくいやつも有るし。

  • by Anonymous Coward on 2017年06月24日 13時24分 (#3233439)

    AdobeがAdobe-Japan1-7を制定してくれないと新しい文字が各種フォントに実装されません。
    その制定を促すためにも、早めにJIS改正を行ってほしいところですね。
    特に今回のUnicode 10で、ようやく入管正字 [wikipedia.org]が揃ったので、タイミング的に丁度良いと思いますし。

    • by Anonymous Coward

      AdobeとJISは異体字セレクタの互換性がないのに、これを"Uni"codeっていうのはちゃんちゃらおかしい。

  • by Anonymous Coward on 2017年06月24日 17時06分 (#3233516)

    💩💩💩💩💩💩💩💩💩💩
    💩💩💩💩💩💩💩💩💩💩
    💩💩💩💩💩💩💩💩💩💩

    • by Anonymous Coward

      牛乳がぶ飲みしたあととか、とうもろこし食いまくったあととか、ニラレバ食った後とか、
      そういうバリエーション?

      #ニラでぶら下がってるのが感覚でわかる…

    • by Anonymous Coward
      男女と人種それぞれにLGBTの組み合わせが必要だよな
  • あれ [science.srad.jp]は今回のアップデートで対応するんでしょうかね

typodupeerror

吾輩はリファレンスである。名前はまだ無い -- perlの中の人

読み込み中...