携帯絵文字のUnicode化、Googleも協力 141
ストーリー by hylom
ガラパゴスから世界に、 部門より
ガラパゴスから世界に、 部門より
現在、Unicode Consortiumで日本の携帯電話で使われる絵文字をユニコードの文字として共通符号化しよう、という提案が進んでいるそうで、これにはGoogleも協力を行っているそうです。
Google Japan Blogの「絵文字のユニコード符号化: 符号化提案用のオープンソースデータ」によると、
Google Japan Blogの「絵文字のユニコード符号化: 符号化提案用のオープンソースデータ」によると、
とのこと。また、CNET Japanの記事によると現在、日本の携帯絵文字の全てをユニコードの文字として共通符号化しようという提案が進行しています。そのためには、現在使用されている絵文字のうちどれが既にユニコード符号化されているか、新しく符号化しなければならない絵文字はどれかなどを調査する作業が必要です。この提案を支援する目的で、私たちが提案している絵文字のマッピングや変換表、更に絵文字データからHTMLの表などを作成するのに役立つツールなどを 「emoji4unicode 」という名前でオープンソースプロジェクトとして公開します。 これによりユニコード コンソーシアムの他のメンバーとの協力を強め、携帯電話会社、更に携帯絵文字に関心のある皆様からフィードバックをいただければ幸いです。
とのことだ。絵文字はもともと日本の携帯電話会社が固有のものを使っており、異なる通信会社同士で絵文字を送り合うことはできなかった。現在では各キャリアが協力して、お互い似たような絵文字がある場合には、変換して表示している。グーグルはこれを拡大し、絵文字をユニコードとして標準化することで、どの通信事業者間で送った絵文字も同じように表示される世界を実現したいという。さらに、「検索エンジンで絵文字を探せば、結果が返ってくる」(グーグル ユニコードソフトウェアエンジニアのMarkus Scherer氏)ようにもしたいとのことだ。
flashの日記 曰く、
GoogleとしてはGmailに限らず、インターネット全体で携帯絵文字がネイティブに使えるようにしちゃおうという意向をもっているらしい。これは、そのためのツールなどをフリーで提供するという趣旨の記事である。個人的には、まずその「日本の携帯絵文字をユニコードの文字として共通符号化しようという提案が進行して」いること自体にびっくりした。
このような記事(引用)をみると、日本独自の「文化」は、やはりそれなりの魅力を持っているとも言えるかもしれない。とも思う。もちろん、日本語ユーザの経済的影響力が、けっこう強いという言い方もできなくはないですが。ユニコードとして携帯絵文字が「輸出」されれば、非日本語圏でも、「汗」とか「ハートブレク」とかがぼんぼん出てるようなデコラティブな文章が出回るかもしれないと思うと、それは、ちょっとわくわくする。
結局は (スコア:3, すばらしい洞察)
逆に (スコア:1)
Re:結局は (スコア:1)
Re:結局は (スコア:1)
Re:結局は (スコア:3, おもしろおかしい)
MyClass::operator new なんて書いてると:oが絵文字に変換されて、なんのこっちゃねんと突っ込みたくなります。
文字の進化か退化か (スコア:3, 興味深い)
ITで文字にコードが振られることによって、文字は誤記を含め新規生成の機会を大きく失いました。
その反面、手では記入困難な複雑な記号である絵文字が、これまでの文字と同等に入力可能となりました。
これは人類の文字利用の歴史における新たなステップだと思います。
象形文字から抽象化を重ねて出来上がった漢字も、今後は複雑な形状に戻るかもしれません。
たとえば「木」という漢字も、茶色の幹に青々とした葉が茂り風に揺らめくアニメーション絵文字のほうが本来の意味を伝えやすいかもしれません。
1文字の情報量が増すことで、非漢字県の人が見ても理解できるようにできるかもしれません。
身近にある物を抽象化して絵文字としてコードを割り振るという行為の歴史的文化的な意味合いはとても大きいのではないか、そんな妄想をしてみました。
Re:文字の進化か退化か (スコア:1)
それはともかく、こんな [lcv.ne.jp]になっちゃうと帰って解り難い。
Re:文字の進化か退化か (スコア:2, おもしろおかしい)
てな具合に、このところ皆さんこぞって非漢字で三重県庁所在地の宣伝をしてくれていますよね。これほどネットユーザに愛されている都道府県は他にないと思います。
Re:文字の進化か退化か (スコア:1)
えー (スコア:2, すばらしい洞察)
とか思います... マークアップでいいじゃん...
今更過ぎる (スコア:2, 参考になる)
現状携帯端末で PC 向けに企業などから送られる華美な HTML メールはまともに再現できないと思いますし、 H.264 の Profile/Level みたいに HTML メールにデバイスごとの基準を作った方がよっぽどマシに思います。
(CSS の media って例える方が適切かしら。
Re:えー (スコア:1)
Re:えー (スコア:1)
Re:えー (スコア:1)
Unicodeのルールに従って、意味が同じ文字は統合しないといけません。
それにより、
・わざわざ絵文字なんて面倒なもの考えなくても、普通に漢字でメール打つだけで絵文字だらけのメールに
・絵文字うぜぇって方は絵文字じゃなく漢字字体を使用しているフォントを使うと漢字メールに
といった利点があります。
# 冗談で書いてみたが、なんかそれでよくね?と思えてきた
1を聞いて0を知れ!
ふと思ったこと (スコア:2, 興味深い)
今、使われている絵文字って、当然ながら21世紀の現代の身の回りにある生活様式を取り入れた
デザインセットになってますよね。
時代が変われば生活様式も変わるので、今後、新たな絵文字が時代に要請によって
追加されていくことだろうと思います。
(絵文字コードの上書きがなかったとして)
そうなると、後世の人はユニコードの絵文字をコード順に見ていくだけで時代の移り変わりを
さながら絵巻物語のように楽しめるのではないでしょうか。
そう考えると、なんだか楽しいかも。
色は? (スコア:1)
Unicodeの文字って1ドットごとに色をつけられたりするんですか?
それとも今回のは絵文字で色がないのかな?
(Webdingsフォントみたいなもの?)
Re:色は? (スコア:1)
BLACK SUN って何?!
Re:色は? (スコア:1)
Re:色は? (スコア:1)
# 皇紀U+2600年は関係ないか。
符号には何が関連付けられるんでしょ? (スコア:1)
概念なんですよね?
http://www.nttdocomo.co.jp/service/imode/make/content/pictograph/extention/index.html
これのタイトルからフォントを起こせとか、既存フォントと合わせろとか。
#なんか、すごい楽しみになってきた。勘亭流とか。
悪夢じゃね? (スコア:1)
新しくユニコードに含める、ってことは、書体の(フォントファイルの)中に入るって話だよね。
そうすると、絵文字に対応した書体と対応してない書体が世の中で入り乱れたりすると。
Q.「送られてきたメールの文字がソフトバンクのマークになります」
A.「書体を変更してください」
見たいな文章がそこここにあふれることになるんでしょう?
A.「エンコード形式を UTF-8+emojiに設定してください 」
とか
A.「その書体は絵文字入って無いので、新しく買いなおしてください、○万円です」
とか
A.「その書体は、CID、Pro、Pr5、Pr6、Pr6+emoji の5種類あり、それぞれ値段が違います」
とかなるんでしょう?
正直、勘弁してほしい。
せめて、HTMLでタグ指定か、CSSでの指定とか、そういう方向でどうにかしてほしい。
でも実際に、そうなってしまったら、「ホニャララって書体の顔文字は感情表現が弱いが、その分視認性に優れている。丸ゴシックの従属書体だけあって、ガーリーな表現と意外にもあう」なんてしたり顔でコメントしてると思うけどね。
Re:悪夢じゃね? (スコア:2, 興味深い)
マージャン牌とかも普通にコードがふられているし。
そもそも、ハングルでもキリルでもなんでもいいけど自分のシステムに無いフォントは今でも
表示できないんだから、読みたい文章があれば合わせてフォントをインストールする
しかないでしょ。
Re:悪夢じゃね? (スコア:2, おもしろおかしい)
おお!フォントさえインストールすればラムちゃんのママとも文通できるのか!
Re:悪夢じゃね? (スコア:1, 興味深い)
http://www.unicode.org/~scherer/emoji4unicode/snapshot/full.html [unicode.org]
によるとまだunicodeコードの割り当ては当然まだですが、
携帯各社はU+Exxx(外字領域; Private Use Area)を使い、
google内部コードはU+FExxxになっていますね。
U+5桁ということは、サロゲートペア…
もし正式採用でもサロゲートペア(非BMP面、つまり16bits/charで収まらない領域)であれば、悪夢です。
utf-8はサロゲートペアの処理時に特殊な扱いをしなければならないのですが、正式な規格とはことなる独自規格もひろまっていますし(そのうち正式な規格に統一されるでしょうが)。
内部表現もucs2(16bit/char)では足りなくなってしまいますので、変更が必要でしょう。
現在の大半の「unicodeをなんとか使えるようになっている」ソフトは対応できないんじゃないでしょうか。
悪夢となるか、unicode or ISO10646にしっかり準拠させるための強い動機付けとなるか…
# 16ビットの空間に文字を全部いれることができなかった時点で個人的には充分悪夢だと思う。
Re:悪夢じゃね? (スコア:1)
税金のようなものです。考慮せずに、いわば汚染された UTF-8 を世の中に垂れ流すのは
言語道断ですし、汚染された UTF-8 (BMP 以外は6バイトで表現) に新しいエンコーディング名を
付けて世間に認めさせちゃおう、なんてのは馬鹿としか言いようがありません。
どちらかというと、サロゲートペアであれば悪夢、という言い方が残っていることに驚きました。
いわば税金を払うことを厭わしいという考え方の残存こそが、悪夢の前兆であるように思います。
Re:悪夢じゃね? (スコア:2, 参考になる)
http://dev.mysql.com/doc/refman/6.0/en/charset-unicode.html [mysql.com]
Re:悪夢じゃね? (スコア:1)
正直止めてくれ (スコア:1, すばらしい洞察)
LC_COLLATEとかソートの問題もあるよね.
JISにも働きかけるのか?
フォントはどうすんだ.
入力もどうするの.
絵文字を無くすように働きかけてくれ.
Re:正直止めてくれ (スコア:2, 興味深い)
実際の出版物でも、アルファベット圏や中国、韓国にくらべて、日本では約物が多いので、そういう点も考慮して欲しい。
珍しい人名用漢字の場合、少なくない文字が、当て字や戸籍の写し間違い、微妙なデザインの違いでできていると考えられますから、適当なところで諦めるしかない気がします。
ソートは、もう、文字コードを直接使った方法は諦めても良いでしょう。ソートプログラム中、もしくは外部ファイルで順位を指定すれば充分では。
Re:正直止めてくれ (スコア:2, 興味深い)
Adobe やモリサワが格調高い絵文字をデザインしてくれるのでしょうかねぇ。
小塚ゴシックやリュウミンの顔文字ってのも、ちょっと見てみたい気がします。
日本語圏だったら (スコア:1)
Re:日本語圏だったら (スコア:2, おもしろおかしい)
TRON文字収録センター [tron.org]
おや、iモード絵文字はすでに入っているのか。
囲みCJK文字の結合文字とか (スコア:1)
現状の仕様にある「○などで囲みたくてもシーケンスが不足して鞭撻よく結合できない囲みCJK文字」とかも、もう少し上手な方法に改訂したらどうなんだろう。
(* ちょびオフトピ *)
大槻昌弥(♀) http://www.ne.jp/asahi/pursuits/ootsuki/
PCメーカー定義の外字も (スコア:1)
専門誌の付録とか、過去に書いた文章とかを・・・・何も考えずにUNICODEへ変換さえすれば、エミュレータとか外字ファイルの組み込み無しに読むことができる様になるよねぇ。
ケータイとは違って絶対枯れているので、(しっかり調査すれば)「おらが文字も!」って、次々出てくることもなさそうだし。
(* オフトピックだけど「全てのパソコンに平等」というUNICODEの思想に期待をよせて。 *)
大槻昌弥(♀) http://www.ne.jp/asahi/pursuits/ootsuki/
Re:絵文字使ってるだけで取引を止めたくなる (スコア:2, おもしろおかしい)
正直、じぶんが絵文字を使うことが無いので(入力が極端にめんどくさい!)、ごっちゃごちゃのギャルギャルしいメールをもらうと、センスはともかく、その労力に申し訳なさを感じてしまいます。(というより、だいたいそういうのは女性からなので、異性からメールをもらったということだけで感動しているだけだ、という可能性も否定しきれないのは遺憾ですが。)
Re:絵文字使ってるだけで取引を止めたくなる (スコア:3, 興味深い)
とある神社で働いてまして、今年から七五三の祈祷をメールでも受け付けていたのですが、携帯メールからの申し込みで、ギャル文字・絵文字全開だったのでげんなりしたことがあります。
(というか、初対面の相手にメールするのに、自分の名前までギャル文字で書くのは本当に困ります……)
流石にどうなのかなぁ、と思いつつ返信した記憶が。
#モロバレだと思いますが一応、AC
Re:神社ってIT業界? (スコア:4, おもしろおかしい)
Re:絵文字使ってるだけで取引を止めたくなる (スコア:4, 参考になる)
#元AC氏の勤務されている神社がそうだと言ってるわけではないですよ?
ギャル文字対応の音声読み上げとかあったらそれはそれで新技術な気もしますが……技術の無駄遣い?
とか思いつつ、もしや……と思ってぐぐってみたらあったよ! [j-tokkyo.com](びっくり)
Re:絵文字使ってるだけで取引を止めたくなる (スコア:1)
ギャルをGEEKに置き換えればすぐに理解ができてくる (スコア:3, すばらしい洞察)
# たとえになるか微妙ですが、Vi派がViを使ったら生産性高いが、Emacs派が使ったら地獄なのと同じようなもんです
# ローマ字入力なら母音うつときは指が勝手にxかlをうってるんですよ、きっと。
単語を絵文字に置き換えてしまう人に至っては短縮してデータ量減らしてるくらいにしか思ってないっす。
# IT業界にはびこるアルファベットの略語みたいなもんかも。XMLとかERPとか素人はわからぬ。
# 業界人がCRM=Customer Relation Managementと瞬時に展開できるように、同様にギャルは絵文字を瞬時に展開できるんですよ。
彼らが逆に絵文字抜きで文章を書こうとすると、こちらの伝えたいことが誤解なく伝わっただろうかとか心配になるようです。
同じ文面でも{絵文字|顔文字}ないときつくなってしまっているように感じてしまったり。
文字コミュニケーションをかなり強力に補完してる存在です。
# GEEKがカタカナ語や英単語抜きでしゃべったら相手に伝わってるか不安で仕方がないでしょう?
Re:絵文字使ってるだけで取引を止めたくなる (スコア:1)
「^^」も、絵文字だったら1文字で済むしね。
顔文字の多くは絵文字一文字で済ませられるから、ケータイで
私用メールだす時にはいろいろ便利なのよ。
Re:絵文字使ってるだけで取引を止めたくなる (スコア:2, すばらしい洞察)
Re:絵文字使ってるだけで取引を止めたくなる (スコア:1, すばらしい洞察)
Re:絵文字使ってるだけで取引を止めたくなる (スコア:1)
会社支給の携帯がSMSのみの契約で、一文字でも短くしたいので積極的に使ってます。
#相手を選んで使ってますけどね。
Re:で、コード化が完了したら (スコア:1)
「機種依存文字使うなボケぇ」という懐かしいフレーズが世界中に
広まるだけじゃないの?
# これ、日本のキャリアが三社まとまって5年前に提唱してたら
# ガラパゴスって揶揄されることはなかったと思うんだがなぁ。
Re:で、コード化が完了したら (スコア:2, おもしろおかしい)
DDIポケットはなかったことになってますかそうですか。
Re:で、コード化が完了したら (スコア:2, すばらしい洞察)
マイナーな日本ローカルの電話会社が乗り込んでも反応は鈍かったと思うねー。
Re:入力方法 (スコア:1)
一番スマートかな?
ブログとかmixiとかで絵文字入力するときにやっているあれ。
Re:入力方法 (スコア:1)
・[ctrl]+[SPACE]とかでIME起動
・「SMILE」と入力
・[SPACE(変換キー)]連打で、笑顔っぽい各絵文字が順に表示される。
・[ENTER]で確定。
たぶん、既存の日本語IMEのサブセットみたいなモノで十分に役に立つと思います。
Re:パラダイムシフト? (スコア:1)
現状ではケータイ発インターネット行のメール(つまりケータイどうしでないメール)は、
キャリア側のサーバでご丁寧に絵文字を全部ゲタ(〓)に置き換えてくれます。
はっきりいってクソ実装だと思います。