パスワードを忘れた? アカウント作成
41460 journal

flashの日記: Googleが携帯絵文字のユニコード文字化に協力 141

日記 by flash

現在、日本の携帯絵文字の全てをユニコードの文字として共通符号化しようという提案が進行しています。そのためには、現在使用されている絵文字のうちどれが既にユニコード符号化されているか、新しく符号化しなければならない絵文字はどれかなどを調査する作業が必要です。この提案を支援する目的で、私たちが提案している絵文字のマッピングや変換表、更に絵文字データからHTMLの表などを作成するのに役立つツールなどを 「emoji4unicode 」という名前でオープンソースプロジェクトとして公開します。 これによりユニコード コンソーシアムの他のメンバーとの協力を強め、携帯電話会社、更に携帯絵文字に関心のある皆様からフィードバックをいただければ幸いです。

絵文字のユニコード符号化: 符号化提案用のオープンソースデータ

という記事をみつけた。GoogleとしてはGmailに限らず、インターネット全体で携帯絵文字がネイティブに使えるようにしちゃおうという意向をもっているらしい。これは、そのためのツールなどをフリーで提供するという趣旨の記事。

で、個人的にはまずその「日本の携帯絵文字をユニコードの文字として共通符号化しようという提案が進行して」いること自体にびっくりした。

ノキアが日本撤退するというニュースへのスラド内のコメントなどを見ると「ガラパゴス」というキーワードが出てくるわけですが、仮に今後ガラパゴスが解消される方向に圧力がかかっていくとしても、ガラパゴスが世界基準に呑まれるのか、あるいは、世界中がガラパゴスになるのかは、わからないわけです。

とりあえず、ノキアに関してはガラパゴスに世界基準をそのままつっこんで失敗したわけですが、Googleは日本の独自文化に「迎合」しているとも見える面がある一方、やはり根っこの部分ではかなりドラスティックな変化を起こしたわけです。Googleが来るまでは、モバイル業界って「SEO」なんてだれも気にしていないような状況だったわけですから。それが、いまやキャリアさえ戦略の上手さで抑えて、ビジネスの主導権をにぎりつつあります。

で、ガラパゴスとグローバルスタンダードの関係がどうなるかといえば、最終的にはおそらく両者の折衷的なポイントにいくのでしょう。それが実際どんな状況になるのかは、ぜんぜんわからないけど。

ただ、このような記事(引用)をみると、日本独自の「文化」は、やはりそれなりの魅力を持っているとも言えるかもしれない。とも思う。もちろん、日本語ユーザの経済的影響力が、けっこう強いという言い方もできなくはないですが。

とはいえ、Googleは、やはりガラパゴスのエキゾチックな魅力をある程度認め、おもしろがっていると感じられる。ユニコードとして携帯絵文字が「輸出」されれば、非日本語圏でも、「汗」とか「ハートブレク」とかがぼんぼん出てるようなデコラティブな文章が出回るかもしれないと思うと、それは、ちょっとわくわくする。

追記: こんな記事をみつけた。
 

絵文字はもともと日本の携帯電話会社が固有のものを使っており、異なる通信会社同士で絵文字を送り合うことはできなかった。現在では各キャリアが協力して、お互い似たような絵文字がある場合には、変換して表示している。
 グーグルはこれを拡大し、絵文字をユニコードとして標準化することで、どの通信事業者間で送った絵文字も同じように表示される世界を実現したいという。さらに、「検索エンジンで絵文字を探せば、結果が返ってくる」(グーグル ユニコードソフトウェアエンジニアのMarkus Scherer氏)ようにもしたいとのことだ。

http://japan.cnet.com/mobile/story/0,3800078151,20384345,00.htm

ええ、信じがたいのはわかりますが。わたくしも信じがたいですもの。でも、日本のモバイル業界はもはや無視できないだけの市場規模にふくれあがっているということなのでしょう…。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 結局は (スコア:3, すばらしい洞察)

    by kawashima (34583) on 2008年11月28日 17時12分 (#1463625) ホームページ 日記
    Googleの携帯プラットフォームを日本で広めたいだけでは、とか思っちゃうんだよなー
  • by kcg (26566) on 2008年11月28日 18時24分 (#1463695) ホームページ 日記
    象形文字復活の兆しでしょうか。
    ITで文字にコードが振られることによって、文字は誤記を含め新規生成の機会を大きく失いました。
    その反面、手では記入困難な複雑な記号である絵文字が、これまでの文字と同等に入力可能となりました。
    これは人類の文字利用の歴史における新たなステップだと思います。
    象形文字から抽象化を重ねて出来上がった漢字も、今後は複雑な形状に戻るかもしれません。
    たとえば「木」という漢字も、茶色の幹に青々とした葉が茂り風に揺らめくアニメーション絵文字のほうが本来の意味を伝えやすいかもしれません。
    1文字の情報量が増すことで、非漢字県の人が見ても理解できるようにできるかもしれません。

    身近にある物を抽象化して絵文字としてコードを割り振るという行為の歴史的文化的な意味合いはとても大きいのではないか、そんな妄想をしてみました。
  • えー (スコア:2, すばらしい洞察)

    by Anonymous Coward on 2008年11月27日 23時18分 (#1463127)
    そんなことのために文字種ふやすんじゃねぇ!

    とか思います... マークアップでいいじゃん...
    • 今更過ぎる (スコア:2, 参考になる)

      by STRing (14928) on 2008年11月28日 18時08分 (#1463680) 日記
      デコメール [wikipedia.org] なるものもあって、実際表現力ならマークアップの方が将来性において有利です。
      現状携帯端末で PC 向けに企業などから送られる華美な HTML メールはまともに再現できないと思いますし、 H.264 の Profile/Level みたいに HTML メールにデバイスごとの基準を作った方がよっぽどマシに思います。
      (CSS の media って例える方が適切かしら。
      親コメント
    • by flash (28428) on 2008年11月28日 4時26分 (#1463227) ホームページ 日記
      たしかに、そもそもあれが「文字」かどうかというのは結構微妙ではあります。
      親コメント
    • by greentea (17971) on 2008年11月28日 22時02分 (#1463821) 日記
      そのために、Han unificationがあるんですよ。
      Unicodeのルールに従って、意味が同じ文字は統合しないといけません。

      それにより、
      ・わざわざ絵文字なんて面倒なもの考えなくても、普通に漢字でメール打つだけで絵文字だらけのメールに
      ・絵文字うぜぇって方は絵文字じゃなく漢字字体を使用しているフォントを使うと漢字メールに
      といった利点があります。

      # 冗談で書いてみたが、なんかそれでよくね?と思えてきた
      --
      1を聞いて0を知れ!
      親コメント
  • by tomotan (20625) on 2008年11月29日 2時37分 (#1463923)
    ユニコードがこれから何十年、何百年も使われて続けていくと仮定しての話ですが・・・

    今、使われている絵文字って、当然ながら21世紀の現代の身の回りにある生活様式を取り入れた
    デザインセットになってますよね。

    時代が変われば生活様式も変わるので、今後、新たな絵文字が時代に要請によって
    追加されていくことだろうと思います。
    (絵文字コードの上書きがなかったとして)

    そうなると、後世の人はユニコードの絵文字をコード順に見ていくだけで時代の移り変わりを
    さながら絵巻物語のように楽しめるのではないでしょうか。

    そう考えると、なんだか楽しいかも。
  • by likeamagic (32922) on 2008年11月28日 16時53分 (#1463607)
    全く知識が無くて教えていただきたいのですが、
    Unicodeの文字って1ドットごとに色をつけられたりするんですか?

    それとも今回のは絵文字で色がないのかな?
    (Webdingsフォントみたいなもの?)
  • Unicodeって、ハンユニフィケーションやってるぐらいだから、
    概念なんですよね?

    http://www.nttdocomo.co.jp/service/imode/make/content/pictograph/extention/index.html
    これのタイトルからフォントを起こせとか、既存フォントと合わせろとか。

    #なんか、すごい楽しみになってきた。勘亭流とか。
  • by baka_gahaku (4542) on 2008年11月28日 17時12分 (#1463624) 日記
    うーん、提案段階のものにケチをつける趣味は無いのだけれども…

    新しくユニコードに含める、ってことは、書体の(フォントファイルの)中に入るって話だよね。
    そうすると、絵文字に対応した書体と対応してない書体が世の中で入り乱れたりすると。

    Q.「送られてきたメールの文字がソフトバンクのマークになります」
    A.「書体を変更してください」

    見たいな文章がそこここにあふれることになるんでしょう?

    A.「エンコード形式を UTF-8+emojiに設定してください 」
    とか
    A.「その書体は絵文字入って無いので、新しく買いなおしてください、○万円です」
    とか
    A.「その書体は、CID、Pro、Pr5、Pr6、Pr6+emoji の5種類あり、それぞれ値段が違います」
    とかなるんでしょう?

    正直、勘弁してほしい。
    せめて、HTMLでタグ指定か、CSSでの指定とか、そういう方向でどうにかしてほしい。

    でも実際に、そうなってしまったら、「ホニャララって書体の顔文字は感情表現が弱いが、その分視認性に優れている。丸ゴシックの従属書体だけあって、ガーリーな表現と意外にもあう」なんてしたり顔でコメントしてると思うけどね。
    • by Anonymous Coward on 2008年11月28日 17時37分 (#1463649)
      策定や提案されてるものをみたらいいよ。
      マージャン牌とかも普通にコードがふられているし。

      そもそも、ハングルでもキリルでもなんでもいいけど自分のシステムに無いフォントは今でも
      表示できないんだから、読みたい文章があれば合わせてフォントをインストールする
      しかないでしょ。
      親コメント
      • Re:悪夢じゃね? (スコア:2, おもしろおかしい)

        by Anonymous Coward on 2008年11月28日 18時55分 (#1463713)
        >マージャン牌とかも普通にコードがふられているし。

        おお!フォントさえインストールすればラムちゃんのママとも文通できるのか!
        親コメント
    • by Anonymous Coward on 2008年11月28日 17時48分 (#1463662)
      unicode.orgのWGがだした対応表(巨大なので注意)
      http://www.unicode.org/~scherer/emoji4unicode/snapshot/full.html [unicode.org]
      によるとまだunicodeコードの割り当ては当然まだですが、
      携帯各社はU+Exxx(外字領域; Private Use Area)を使い、
      google内部コードはU+FExxxになっていますね。

      U+5桁ということは、サロゲートペア…

      もし正式採用でもサロゲートペア(非BMP面、つまり16bits/charで収まらない領域)であれば、悪夢です。
      utf-8はサロゲートペアの処理時に特殊な扱いをしなければならないのですが、正式な規格とはことなる独自規格もひろまっていますし(そのうち正式な規格に統一されるでしょうが)。
      内部表現もucs2(16bit/char)では足りなくなってしまいますので、変更が必要でしょう。

      現在の大半の「unicodeをなんとか使えるようになっている」ソフトは対応できないんじゃないでしょうか。

      悪夢となるか、unicode or ISO10646にしっかり準拠させるための強い動機付けとなるか…

      # 16ビットの空間に文字を全部いれることができなかった時点で個人的には充分悪夢だと思う。
      親コメント
      • by vn (10720) on 2008年11月29日 6時50分 (#1463963) 日記

        もし正式採用でもサロゲートペアであれば、悪夢です。
        サロゲートペアの処理というのは、UTF-16 を扱うときには必ず考慮しなければならない、
        税金のようなものです。考慮せずに、いわば汚染された UTF-8 を世の中に垂れ流すのは
        言語道断ですし、汚染された UTF-8 (BMP 以外は6バイトで表現) に新しいエンコーディング名を
        付けて世間に認めさせちゃおう、なんてのは馬鹿としか言いようがありません。

        どちらかというと、サロゲートペアであれば悪夢、という言い方が残っていることに驚きました。
        いわば税金を払うことを厭わしいという考え方の残存こそが、悪夢の前兆であるように思います。
        親コメント
    • by ruto (17678) on 2008年11月28日 22時25分 (#1463836) 日記
      合成フォントにしたらいいじゃん。
      親コメント
  • 正直止めてくれ (スコア:1, すばらしい洞察)

    by Anonymous Coward on 2008年11月28日 17時47分 (#1463661)
    人名漢字だって全然足りてない.
    LC_COLLATEとかソートの問題もあるよね.
    JISにも働きかけるのか?
    フォントはどうすんだ.
    入力もどうするの.
    絵文字を無くすように働きかけてくれ.
    • by nmaeda (5111) on 2008年11月28日 18時22分 (#1463693)
      絵文字も別に良いとは思いますけど、数字のバリエーションとか、約物が欲しいですね。
      実際の出版物でも、アルファベット圏や中国、韓国にくらべて、日本では約物が多いので、そういう点も考慮して欲しい。

      珍しい人名用漢字の場合、少なくない文字が、当て字や戸籍の写し間違い、微妙なデザインの違いでできていると考えられますから、適当なところで諦めるしかない気がします。

      ソートは、もう、文字コードを直接使った方法は諦めても良いでしょう。ソートプログラム中、もしくは外部ファイルで順位を指定すれば充分では。
      親コメント
    • by Anonymous Coward on 2008年11月28日 19時16分 (#1463724)
      > フォントはどうすんだ.

      Adobe やモリサワが格調高い絵文字をデザインしてくれるのでしょうかねぇ。
      小塚ゴシックやリュウミンの顔文字ってのも、ちょっと見てみたい気がします。
      親コメント
  • by kilin28 (10167) on 2008年11月28日 22時47分 (#1463846) 日記
    tronCODEでいいじゃん! 最近G社が嫌いになったんだけど、どうせマーケティング用に解析するデータのフォーマットを統一したいだけだろ? 社内で変換しとけばいいじゃん
  • どの民族にも贔屓偏り無く地球規模に採録してゆくUNICODEに、ケータイ絵文字を追加するのも蟻かもしれないけど・・・

    現状の仕様にある「○などで囲みたくてもシーケンスが不足して鞭撻よく結合できない囲みCJK文字」とかも、もう少し上手な方法に改訂したらどうなんだろう。

    (* ちょびオフトピ *)
    --
    大槻昌弥(♀) http://www.ne.jp/asahi/pursuits/ootsuki/
  • ケータイ絵文字を載せるだけじゃなくって、X68000 [wikipedia.org]やPC-9801 [wikipedia.org]などPCメーカ定義の外字もUNICODEに採録してほしいなぁ。

    専門誌の付録とか、過去に書いた文章とかを・・・・何も考えずにUNICODEへ変換さえすれば、エミュレータとか外字ファイルの組み込み無しに読むことができる様になるよねぇ。

    ケータイとは違って絶対枯れているので、(しっかり調査すれば)「おらが文字も!」って、次々出てくることもなさそうだし。

    (* オフトピックだけど「全てのパソコンに平等」というUNICODEの思想に期待をよせて。 *)
    --
    大槻昌弥(♀) http://www.ne.jp/asahi/pursuits/ootsuki/
typodupeerror

一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy

読み込み中...