Unicode 6.0で絵文字が採用される 96
ストーリー by hylom
これで携帯メールの文字化けも解消……されるのかな 部門より
これで携帯メールの文字化けも解消……されるのかな 部門より
cvmonto 曰く、
InternetWatchの記事によれば、Unicode ConsortiumがUnicode Version 6.0を策定し、携帯電話で利用される絵文字が「emoji」として取り入れられたそうだ。記事には絵文字用のCode Chartsが掲載されているが、スマイルなどの感情、様々な動物などが含まれていることが分かる。
絵文字のUnicode化にまつわる経緯についてはCNETの『絵文字が開いてしまった「パンドラの箱」』シリーズ記事が詳しい。また、今月18日より開催されるThe Internationalization and Unicode Conference (IUC) にて、GoogleやAppleの担当者らがこれについて講演を行うそうだ。
まさに絵文字のための拡張 (スコア:5, 参考になる)
Summaryでは
adds 2,088 characters, including
* over 1,000 additional symbols—chief among them the additional emoji symbols, which are especially important for mobile phones
なっておりますので、まさに絵文字のための拡張なんですね。ガラパゴス恐るべし。
iPhoneもSMS/MMSにの時だけ絵文字キーパッドが現れるのですが、他のアプリでの入力でも絵文字キーパッドが現れることになるのでしょうか?
Re: (スコア:0)
>ガラパゴス恐るべし。
むしろ「Googleおそるべし」だと思う。
DoCoMoもSoftbankも、Googleという巨人の前には赤子同然なのではあるまいか。
Re: (スコア:0)
グローバルスタンダード化として「何でも取り込む」という方針を持って来られたら、ガラパゴス化で閉じこもる事はもう無理ですからね。
追加されたシンボルの抜粋 (スコア:5, 参考になる)
個人的発見としては,トランプのCカードなんてあったんだとか,歴史的な仮名って何これとか,
干支が国によってこんなに違うのか,などがありました。
Re:追加されたシンボルの抜粋 (スコア:2, 興味深い)
Re:追加されたシンボルの抜粋 (スコア:1)
Re:追加されたシンボルの抜粋 (スコア:1)
http://www.unicode.org/charts/PDF/U1F000.pdf [unicode.org]
元コメに書いてある通り、1F000を探してみると発見。
Re:追加されたシンボルの抜粋 (スコア:1, 参考になる)
あ、すみません、今回(6.0)で入ったのではなく、Unicode5.1で入ってたんですね。
Re:追加されたシンボルの抜粋 (スコア:1)
>トランプのCカード
元々はJがPage(小姓)でC(Cavallo,騎士)の付き人なんですよね.
#だから強さ的にはK,Q,C,J.
それが地方によってJとCが一緒にされてJが騎士的なイメージで生き残ったり,逆にCがそのまま残ったり,はたまた今でも両方使っていたりといろいろあります.
Re:追加されたシンボルの抜粋 (スコア:1)
correlate を考えるとぞっとする。
えぇい、どうせなら「そば」も変体仮名で書けるようにいっぱい収録せんかぁ
Re:追加されたシンボルの抜粋 (スコア:1)
昔、Yahooなんかのリンク集で"Cool"って使われてましたよね、なつかしい。
ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:3, すばらしい洞察)
日本発のケータイ絵文字が世界標準に Unicode 6.0で [itmedia.co.jp]という題名にしておりますが、あくまでも過去のインフラとの相互運用性、互換性を確保するのが狙いであって、別に威張れるような話ではないと思うのですが。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:2, 興味深い)
威張れはしないかも知れないけど、他の多バイト言語圏にはない独特の文化でしょう。
テキストしか書けない入力領域に、絵を入れたい、という要求。
それが携帯キャリアで実現しちゃう、という文化。
AAも根っこは一緒な気がします。
絵が好きな民族なんですよ、日本人って。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:5, すばらしい洞察)
漢字自体が絵文字ですから、なじみやすいでしょうね。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:3, 参考になる)
とはいっても、☀☁☂☃☄という絵文字は元々割り当てられているんですけどね。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:2)
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:1)
U+2604 : Comet [wikipedia.org]だそうです。
中世の天文関係や、占星術のテキストで使われるっぽいですね。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:3, すばらしい洞察)
今回の件は例えれば、それぞれの藩で独自の方言でしゃべってたところ、
海外から黒船が来航して司令官におまえらの国の標準語を作ってやったぞ、
おまえらは、これからはコレを使えって言われた状態。
それぞれの携帯会社が後先考えずにベンダー依存で拡張したのを
歩み寄って統一の符号表を作り出さずということを怠り
海外の組織であるGoogleが言い出し、
やっと標準化に至ったという経緯は
威張れないどころか穴があったら入りたいレベルの恥ずべきことだと思います。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:1)
いやいやいやw
何故恥ずかしいのですか?
積極的に標準化した方が、色々と有益だと思いますが。
恥ずかしさとか、何処から出てくるんですかね。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:1)
各社追加競争を行った上で、cHTML ベースのデーターフォーマットに則ったデコメの方に舵を切り、絵文字の追加を停止したという辺りは「一見差別化のために好きな事をやっているように見えても、結局足並みを揃えている」ように見えませんか?
絵文字は元々 Shift-JIS の外字領域に突っ込まれていた文字ですし、Netscape Navigator や IE のブラウザー戦争で行われていたようなベンダー独自拡張とは一線を画すものですよ。
規格の範囲で好きに拡張するのは独自色を出すための拡張ですし、許されている範囲の変更です。元々そんなに変な事ではありませんよ。
# それこそ PDF で Adobe がやってるような拡張とか、そんな感じ。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:1)
現在の事情を元に過去を批判しても意味がないばかりか害だらけだと思いますが。
インターネットが利用される前からポケベルでのメッセージング機能とかが盛んに非ビジネス用途で利用され、携帯電話でもかなり早期から普通にメッセージング機能は搭載されていました。当初は JIS X 0201 の範囲のみだったかと思います。
この時点では、いまだに一般的にインターネットが利用されていない状況であり、メッセージングサービスも相互乗り入れなどは利用できないのが普通という状況でした。
そうした基本的な日本のメッセージングサービスにおける文化背景がありますので、インターネットを介して他のシステムへメッセージを送るところまでをどれだけ視野に入れていたか、といった部分を考慮する必要があるでしょう。
根本的に最優先事項は自社ネットワークに接続される端末における利用文字セットの定義です。
相互で利用が可能であることを互いに認識している状況においては、別に強く拒否されることもありませんよ。その状況でも拒否するのは、単に偏執的なだけです。
もちろん相互コミュニケーションを目的とする上で、対象が適切に表示できないと分かっている状況であっても利用するのは問題ですが。
また、現在は過去を踏まえて外字領域への追加を避けている状況であり、絵文字の新規追加などはここ数年で聞いたことはありません。
現状はデコメの方で盛んに追加が行われていたり、携帯電話端末独自 (キャリアではない!) でデコメ用の絵文字が追加されていますが、これは HTML をベースとしたデーターであり、絵文字と言いつつ絵です。
誤動作は明らかにソフトウェアのバグであり、ここで言及するのは適切ではないかと思います。
機種依存ではなく環境依存だと思いますが、実際のところ Unicode を採用していたとしても表示できるかどうかはグリフを持っているかという点にまず依存します。リッチな端末でもなければ世界中の言語のグリフなど持っているフォントデーターを採用したいなどとは思わないでしょうね。
また、別に内部処理や出力結果まで Unicode で通す必要などは全くなく、相互通信を行う部分が適切に規格化された符号化方式を採用していれば十分でしょう。その上で、相互に情報の損失や変化が発生せずやり取りが出来れば十分です。
Google はあくまでも日本の携帯電話向けに利用されている絵文字を含んだコンテンツを、自社サービスに取り込む際に自分たちで欲しいから規格化したのです。Apple も iPhone の関係がありますから共に行いました。Microsoft もデジタル TV への対応のために協力しました。自社で必要だから規格化しただけです。
こうした必要を持たない携帯電話会社各社ですが Google が Unicode に入れたいと発表後、docomo、au、SB の各社は必要があれば協力する旨を発表し、実際に docomo はいち早く協力していました。これが「我を通し標準化もしない」という表現に当てはまるのでしょうか。
インターネット上で絵文字が利用されているのを野放しにするのは本当に悪い事なのでしょうか。また、各社がそれを規制しなければならないのでしょうか。
Web で掲示板サービスを提供したい会社が「docomo の絵文字を受け入れられるようにしたい」などとした場合、docomo と契約を結ばないとダメなのでしょうか。外部に出ないように docomo ネットワーク内に配置されないとダメだとしたら、各携帯会社間のユーザーが同一の掲示板サイトを利用する事が出来ない事になりませんか。不便すぎるように思えますが。
ASCII や Latin-1 だけ処理できればいいような状況ではありませんし、i モードの開始当時は Unicode の処理を行うのは PC でもまだまだ進んでいるとは言えない状況でした。(1999 年頃を考えてみてください)
そのような状況下で絵文字を追加したいね、じゃあまず世界的に標準化して行いましょうか、なんてやってたら機動性がなさ過ぎてビジネスチャンスを逃しますよ。
Unicode に絵文字を追加できるような状況になったのも近年になってから (ピクトグラムの収録が過去に行われたことから、文字ではない文字に対する抵抗感が減ってきている状況) であり、かつそこから実際に追加しようと働きかけた結果、2 年以上の月日が経過しています。
さて、ようやく Unicode に絵文字が収録されることとなった訳ですが、「今の今まで i モードメールで絵文字を送ることができなかった」ら、日本でここまで携帯電話が普及したでしょうか。
そもそも絵文字が利用されているコンテンツが大量にあり、ユーザーからの利用需要が高いために Gmail などでも絵文字の処理が行われるし、Google も標準化するだけの価値があると判定できたのではないでしょうか。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:2, 参考になる)
なんで根拠もなく国民性や民族性のせいにするかなあ。
日本に独特だってこと、本当なんですか?
たとえばIBM-PCの文字セット [wikipedia.org]には、顔、トランプのマーク、音符などがありますよ。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:1)
そりゃーベンダー定義外字領域にベンダーが何を入れようがお構いなしでしょう。
共通部分に突っ込んだ訳でもないのですから、惨状というほどでもありません。
さらに言えば Shift-JIS が Shift-JIS として規格化されたのは Windows 3.1 登場よりも遥か後です。
その意味では、曲がりなりにもベンダー定義外字として定義されている領域に揃えて突っ込んであるだけマシともいえます。
まぁ、IANA の文字コード一覧にもある通り、Shift-JIS のエイリアスの一つである MSKanji にも表される通り Shift-JIS 自体 Microsoft が作成したものですので、「マイクロソフト標準キャラクタセット」に収まるのは当然の帰結と言えるようにも思えますが。
EBCDIK のようなものの方がよほど「ガラパゴス」にふさわしいと思いますが、なんで曲がりなりにも特に変換も必要とせずに Shift-JIS を採用したさまざまな環境を「ガラパゴス」だと思えるのかの方が不思議ですね。ASCII との互換性も保たれているというのに。
Shift-JIS のベンダー定義外字領域にある文字の差異と ISO-8859 ファミリーにおける ASCII 非互換部における差異とで、どれだけ差があるのでしょうか。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:1)
日本発、日本起源とは言えても、日本が主導して標準化したと言えないところに日本企業の閉鎖性を感じるんだな。
日本の外の世界では「GoogleとAppleがまた変なこと始めた」としか思われないのではないでしょうか。
そして絵文字の起源はいつの間にか韓国辺りにすり替わっていきそうになるも、60億人の人々はさして疑問に思わなかったりして。
家電のシェアを考えたら、案外笑い事では済まんと思うが、絵文字の起源が日本じゃなくなっても、日本人が困ることはないか...。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:1)
Wingdings とか、 Webdings をみれば、
「テキストしか書けない入力領域に、絵を入れたい、という要求。」
が日本独自でないという風に思えますが。
Re:ITmedia「日本発が世界標準なったぞ(キリッ」 (スコア:1)
「emoji iPhone」で検索すると、「日本語以外のコンテンツ」が大量にヒットするくらい、iPhone で絵文字を使う事はそれなりに興味をもたれ、かつ価値があることと評価されているようですよ。
タレコミにある『絵文字が開いてしまった「パンドラの箱」』第5回の中 [cnet.com]には「アラビア語で絵文字が使えるようになったことを、アッラーの神に感謝しているらしき掲示板の書き込み」などという記述があるほどです。
現状広く興味を持たれていると言えるほどではないにしろ、世界中の様々なところで絵文字に対する興味というものは既に存在しているものである、という程度の事は言えるのではないでしょうか。
Re: (スコア:0)
絵文字の中には串団子や麺類の丼が含まれているわけで、これを使って欧米人が日本人と同じ情報量をやり取りできるとは思えない。となると、将来の拡張は必至という恐ろしい未来予想図が待っている。
一方で、現行バージョンの絵文字が日本人向けに特化していることは確かだから、これが現代日本の風俗を端的に捉えたスナップショットになっている、とも言える。その記録がずっと残るわけだから、やっぱり日本人にとっては得、なんじゃないかな。何にしても番号が若いってのはいいことだよ。
欧米向けにはトランプが入っちゃったから、タロットはどうなるんだろう、とか気になるけれども。今回追加された片仮名の「衣」と平仮名の「江」よりは利用者が多いだろうし。
やめてー!! 1F5FEのことでケンカしないで〜!! (スコア:3, おもしろおかしい)
1F5FE - SILHOUETTE OF JAPAN (日本列島のシルエット)
こりゃ、フォントサイズを超巨大にして、隅っこにある点の数を数える奴らが一部地域で続出するな。
# ちなみにUnicode.org本家版 [unicode.org]では、北方領土は入ってるようにみえる。
Re:やめてー!! 1F5FEのことでケンカしないで〜!! (スコア:2, おもしろおかしい)
混乱解消はよいこと (スコア:1)
だけど個人的には採用されてほしくなかったなー
# 文字集合,文字セット,文字エンコードについてOSI7層構造みたいな分割統治がうまくいってない気がするんだよなぁ
まあ、これでますますUTF-8化が進んで、メールで問題減るなら、それはそれでいいか。
M-FalconSky (暑いか寒い)
Re:混乱解消はよいこと (スコア:3, 参考になる)
RFC 2130 [ietf.org]というのがあって、
ユーザーインターフェイス
オンザワイヤ
という7階層で分割統治されております。Unicodeはコード化文字集合、UTF-8は文字符号化スキーム、BASE64は伝送文法に相当します。
は、日本語だと指定するのが言語層、
が2001年2月3日だと指定するのがロカール層、みたいなことです。
IAB発行とはいえ、informationalな文書なので規格とはいえず、まぁ、RFC作るときに参考にしようね、という程度ですかね。
/K
Re:混乱解消はよいこと (スコア:1)
ああ、この規格は知りませんでした。
まずは感謝を。
その上での返信なのですが
> という7階層で分割統治されております。Unicodeはコード化文字集合、UTF-8は文字符号化スキーム、BASE64は伝送文法に相当します。
層としては大体はいいんですが、例えていうならTCP/IP上にHTTP/SMTP/...が上手く混ぜて通信できるみたいに
UCS-2などの文字集合(TCP)に入れる言語セット(HTTPとか)は自由でそれぞれのバージョンあり、みたいなのができてないなと。
Unicodeに含まれる日本語の改訂とかで揉めたりしますけど、できれば日本語は日本語として整備を進めれればいいし、それをある利用のための集合に入れる時に適切に互換をもちつつピックアップ&写像(射影か?)できれば、なんというか、多少は問題が減るんじゃないかとか思ってて。
じゃないと、すべての*言語*を収録した...Unicodeに絵文字(言語的背景があんまりない)っていうのが座りが悪くて。
XML文書に好きなスキーマ混在できる、みたいなのが近いかな?
すべての文字表現物の集合ルールのVer.X.Yとかならあんまり違和感ないし、場合によって収録されてない字とか出ても、その時の表現能力の限界があったと思えばそれはそれでいいや、とも思えるんですけどねぇ...
住基とかで必要ならEx-UCS-8とか互換ルール&日本語ローカルな内部規格使うぞーみたいなのが、うまく擦り合うことができるんじゃないかなとか。
# ほぼグチです...御目汚し失礼
M-FalconSky (暑いか寒い)
Re:混乱解消はよいこと (スコア:2)
/K
異字体はどのくらいまで許容されるのでしょうか。 (スコア:1)
Re:異字体はどのくらいまで許容されるのでしょうか。 (スコア:1)
1F4A9のことか〜!
と脊髄反射ののち念のためググってみたら1F4A9の原典は鳥山明ではない [bit.ly]らしい。
そもそもこれ、一瞥してそれと認識できるほどの万国共通の普遍的なシンボルなの?
だとしたらそっちのほうがこのニュースより衝撃なんですけど・・・。
Youthの半分はバファリンでできています。
セキュリティ上の重大な懸念 (スコア:3, 参考になる)
□□□ Welcome □□□
というデザインのふりをして、
💩💩💩 Welcome 💩💩💩
と書いておくとか。実際に書くと(/.のシステムがこの書き方の実体参照を通してくれると仮定して)、
💩💩💩 Welcome 💩💩💩
こんな感じ。書き込み時点、Unicode 6.0未対応の間は、IEだと「□□」、Chromeだと「□」っぽくレンダリングされるのでぱっと見は問題のないページに見えます。 が、時間が経って、Unicode 6.0対応の環境でブラウジングするとあらどっきり。
Webのデザインを他社に委託したりした場合には慎重な検収作業が求められますね。 まあ、そんな信用できない相手に仕事として委託する状況というのは分かりませんが・・・友人・親戚縁者からのお願いとかだと、仕込まずに済ませる自信がありません。
ちなみに、FireFoxは「□」の中に文字コードを入れた表示になって、「これ、なんか謎の文字ですよ、気をつけて」と教えてくれるのでセキュアですね。
Re:セキュリティ上の重大な懸念 (スコア:1)
和文組版では〓(ゲタ、活字の頭と足を逆に組んだもの)がそれだったはずなのが、コードポイントを与えられてしまったので、ゲーデル的にはそのグリフにもいずれコードポイントが与えられ・・・
Re:異字体はどのくらいまで許容されるのでしょうか。 (スコア:2, おもしろおかしい)
「とりやま」でないなら「とりい」かもしれない。
絵文字の導入はUnicodeの破壊行為 (スコア:1)
私がUnicodeへの絵文字の導入に反対する理由はたくさんあるのですが,一番致命的だと感じるのが以下の絵文字の導入です。
これらは形は全く同一でありながら表示色が違うことを理由に別のコードポイントを与えられた絵文字です。これらの存在は「文字コードとは何か」「文字コードを表示するためのフォントの設計はどうあるべきか」という問題において深刻な影響をもたらします。Unicodeの設計思想が根本的に崩壊する危険すらあります。
何故こんなものをいれてしまったのでしょうか?
すべての絵文字をUnicodeにマップしなければならない理由があった (スコア:2)
んですよ。ガラケーがそれら文字を送ってくる限り、ガラケーが打ち出した絵文字が歴史から消えない限りUnicodeに収録しなければならないんです。ただUnicodeではそれらの「色」は文字の意図を示すもので、フォントの色とは関係がないということにしているようです。
Re:すべての絵文字をUnicodeにマップしなければならない理由があった (スコア:1)
>ガラケーがそれら文字を送ってくる限り、
そう,それが諸悪の根源で,そもそも各キャリアは絵文字をインターネットの世界に垂れ流すべきではなかった。
いまでも私は絵文字は「文字」に対応づけるのではなく「文字列」に対応づけるべきだった,思っています。つまり,ナルトの絵文字はU+1F365という「文字」ではなく[au:なると]のような「文字列」に変換されるべきです。
そして,これらの変換はキャリアがGW上で実行するべきです。
Re:絵文字の導入はUnicodeの破壊行為 (スコア:1)
同様に,色の違いで異なる文字とされたモノ。
Re:絵文字の導入はUnicodeの破壊行為 (スコア:1)
白抜き黒抜きは許容できるんですよ。単色で表現可能ですし(○と●のように)図形として異なると言えなくもありません。文字色を変えられたときに表示する内容も自明です。
ですが,例えばHTML中に,
とあったら,何色でハートを表示すればいいのですか? 赤ですか? 青ですか?
何語で入れます?
超漢字の優位性 (スコア:1)
http://www.chokanji.com/features/moji.html [chokanji.com] 超漢字Vで扱える文字
ユニコード6.0 ←→ iモードの互換テーブルが早々に出てきそうです(絵文字の送受信を可能にするために)。
絵文字以外 (スコア:0)
カード(トランプ)の絵柄とか、錬金術のシンボルとか増えてますね。
Re:そんなことより (スコア:3, 参考になる)
Re:そんなことより (スコア:1, おもしろおかしい)
ヒロインの名前に変体仮名を使った アニメ|ゲーム が大ヒットしてふりだしに戻る
Re:そんなことより (スコア:3, 興味深い)
http://law.e-gov.go.jp/htmldata/S22/S22F00501000094.html [e-gov.go.jp]
戸籍法施行規則
第三章 届出
第六十条 戸籍法第五十条第二項 の常用平易な文字は、次に掲げるものとする。
一 常用漢字表(昭和五十六年内閣告示第一号)に掲げる漢字(括弧書きが添えられているものについては、括弧の外のものに限る。)
二 別表第二に掲げる漢字
三 片仮名又は平仮名(変体仮名を除く。)
駄目みたいですね。
#マジレス失礼
Re:そんなことより (スコア:1)
Re:そんなことより (スコア:1)
現状だと、たいと [wikipedia.org]のように画像にして対処するのでしょうかね。余談ですが、Category:Unicodeに存在しない文字 [wikipedia.org]なんてカテゴリもあります。