国際化ドメインネームを使った ccTLDが3つできたそうな 19
ストーリー by soara
読める人を囲い込み 部門より
読める人を囲い込み 部門より
.日本を作ろうという話があったが、ICANNによれば エジプト、サウジアラビア、アラブ首長国連邦 で、それぞれ国際化ドメインネーム(IDN)を使った国別トップレベルドメイン(ccTLD)が登録されたとのことである。
早速、本家で話題 になっているが、エジプト通信情報省 が紹介されている。
http:// は一緒なんだね。とか、URI が /ar/default.aspx で、UNICODEじゃないのはどうかなという気もするが、肝心のドメインのところは、残念ながら私愛用の Firefox ブラウザでは xn-- でしか表示されない。それでは、というので Safariでアクセスしたら、
موقع.وزارة-الأتصالات.مصر
と表示されてた。ふーむ、'.' が入っても全部まとめて右から左へ表示されるのか。
あ、別に読めてるわけじゃなくて、 Egypt: مصر (Egypt) ... (ICANN のページよりコピペ) と見比べてるだけなんだけどね。
別の問題もあるからねぇ... (スコア:5, 参考になる)
あー、始まってたんですね。
ほんで
1.http://
これは識別子の問題なので、変更できないですね。別の話題にありましたけど、今となってはWebブラウザとしては表示しない、もありかもしれませんね。
2./ar/default.aspx
URLエンコード - Wikipedia [wikipedia.org]
という方法自体はありますが、問題として文字コードは何?というのがあるので簡単にはいかないかと。まあUTF-8にしとけばいいんですが
3.xn--でしか
表示を逆変換するかとか、細かいルールがよくわかんないですね...
4.'.'があってもまとめて右から左
Unicode制御文字のRLE/RLOごとエンコードしたIDNになってるのかな?
これも結局、Punycode - Wikipedia [wikipedia.org]後にASCII+.のドメイン名になればいいってことだから、問題ないんでしょうね。
# Unicode制御文字にルビ用があったら、ルビ表示付きのIDNが作れたのだろーか?
# http:/// [http]とある科学の超電磁砲(レールガン).jp/
# とかやったりして
M-FalconSky (暑いか寒い)
Re:別の問題もあるからねぇ... (スコア:5, 参考になる)
URIじゃなくてPATH部ですね。URIではなくIRIでは、PATH部のパーセントエンコーディングの際の文字エンコードはUTF-8に基づくそうです (RFC 3987 [ietf.org] 1.2節のcとか)。
セキュリティの問題で、IDNをデコードするTLDによる制限が行われています (Bug 286534 [mozilla.org])。about.configで network.IDN.whitelist.xn--wgbh1c にtrueを設定することで、デコードして表示できるようになります。
アラビア文字にLTR (左→右) の並びで書くという作法があるとは聞きませんし、デフォルトでRTLになっていてそれに倣ってると思います。細かいルールは例によってRFC 3987 [ietf.org]を。4.4節に例がありますが、(スキーム以降の) "."、"/" 以外すべてがアラビア文字ならドメイン名が最後に来るというような変換が行われるそうです (Firefoxが対応しているかは不明です)。
Re:別の問題もあるからねぇ... (スコア:2)
追記。IE8/Firefox3.5/Opera10.5での設定方法がIDN Usability [icann.org] (ICANN Blog) にあったのでぺたり。
Re:別の問題もあるからねぇ... (スコア:3, 参考になる)
Re:別の問題もあるからねぇ... (スコア:2)
ちなみにいまさらなのですが、ルビできるなら括弧はいらない(例示のために分りやす書いただけ)なので、まあ括弧は無視でいいんですが...
# でもURLエンコードとか、それくらい調べようよ、な内容になってたな...スミマセン
M-FalconSky (暑いか寒い)
Re:別の問題もあるからねぇ... (スコア:1, 参考になる)
NAMEPREP(国際化ドメイン用の前処理)で禁止されていますね。
http://tools.ietf.org/html/rfc3491#section-5 [ietf.org]
http://tools.ietf.org/html/rfc3454#appendix-C.2.2 [ietf.org]
Re: (スコア:0)
Re: (スコア:0)
今日も「IDNではNFKCの正規化によって全角半角が同一視されます」ってツッコミを入れる仕事が始まるお…
Re:別の問題もあるからねぇ... (スコア:2)
1.http://
これは識別子の問題なので、変更できないですね。別の話題にありましたけど、今となってはWebブラウザとしては表示しない、もありかもしれませんね。
https:/// [https] とか gopher:// [gopher] とか ftp:// [ftp] とか file:// とかで目的が違うから表示しないのは危険…かな?
あ、でも、表示しないで今の http と https みたいに色を変えたりする方法でもいいのか…な?
Re: (スコア:0)
こんな偽装しやすそうなドメイン名、国が使っていいのか? (スコア:3, すばらしい洞察)
国際化ドメインネームはドメイン名偽装がしやすいとの指摘が結構あるのに、今のところ使用例(というか、悪用された例)が少なくて十分に対策がなされているとは言い難い状況にあるように思えるのですが、
そういうのを国の公的機関が使っても大丈夫なのでしょうか。
Firefoxのようにpunycodeをそのまま表示する方法は、従来のドメインを装った国際化ドメインには有効な対策ですが、
脳内punycodeデコーディングができない人にとっては、国際化ドメインを装った国際化ドメインにはあまりに無力です。
1を聞いて0を知れ!
Re:こんな偽装しやすそうなドメイン名、国が使っていいのか? (スコア:2)
> そういうのを国の公的機関が使っても大丈夫なのでしょうか。
すでに、わかっているかと思いますが、リンク先のエジプト通信情報省は、http://www.mcit.gov.eg/ar/Default.aspx [mcit.gov.eg] と全く同じで、その英語版は http://www.mcit.gov.eg/ [mcit.gov.eg] ですね。
ということで、アラビア語 URL サイトの方は、ローマ字よりアラビア文字の方が心地良い人のための、フィッシングサイト(笑)なんですよ。
Re:こんな偽装しやすそうなドメイン名、国が使っていいのか? (スコア:1)
アラビア文字を直接打ち込んでアクセスする人には「goggle.com」みたいなことやらかさなければ安全ですが。。。
そうでなくリンクとして貼られていた場合には、やはり危険です。
アラビア文字が読める人にとってもpunycode表示になってたらもはや暗号ですし、
なっていなくても、アラビア文字しか知らない人には国際化ドメインネームは危険なのです。
そこに使われているのは、アラビア文字ではなく、ギリシャ文字・キリル文字や漢字かもしれないし、
その他のもっとマイナーな文字かもしれません。そのどれでもないことを、判別しないといけません。
1を聞いて0を知れ!
Re: (スコア:0)
決済システムの委託先が中東だとか何とか言って
Re:こんな偽装しやすそうなドメイン名、国が使っていいのか? (スコア:1)
国際化ドメイン名(IDN)のフィッシング詐欺脆弱性について - 日本語.jp [xn--wgv71a119e.jp]
にあるように、レジストリが適切に管理すればOKという方針だそうです。別コメにも書いたとおりFirefoxではTLD毎にpunycodeをデコードして表示しますから、IDN導入 (ドメイン名の文字セット拡張) による類似ドメイン名の氾濫は一定の抑制が可能になるかと思います。
example.jpとexample.comの区別は簡単でしょう。 xn--zckzah.jp [xn--zckzah.jp]と xn--zckzbh.jp [xn--zckzbh.jp]の区別がつきにくいとは自分も思いますけど、つかないとはちょっと思えません。zckzah--xn.jpとzckzbh--xn.jpの区別のつかなさと程度問題なんじゃないかと。「信用できないURIにはアクセスしない」という原点に戻るだけで充分にも思えます。
IDNの発想自体が、「母国語でのURIの利用」が原点だと思います。ラテンアルファベットなら誰でも読めると決め打ち出来るんならいいんですが、そうでない層にとっては、ラテンアルファベットからなる意味のある単語とランダムな文字列の区別はつきにくいのは一緒なんじゃないかと思います。
# 逆に、現在のFirefoxのように読めもしない文字をデコードされるほうが害悪かも。
つまるところ、問題は国際化ドメイン名の導入により (punycodeのままの、デコードされない) ドメイン名の長大化傾向が加速するということになるかと思います。長い、しかもランダムに見える文字列同士の比較は確かに面倒です。が、そもそもそれをせねばならないという状況がちょっと思い浮かばなかったりします。…ちょっと想像が足りてない?
# まぁ短縮URIリダイレクターの流行とどちらが、というと…。
httpsだとどうなるか (スコア:3, 興味深い)
証明書はどうなってるのかなと、
https://موقع.وزارة-الأتصالات.مصر/ar/default.aspx [.-.]
にアクセスしてみたところ、
「mcit-b1web-03」というcommon nameの証明書が降ってきました。
(投稿のリンクがおかしいのだけど、面白いのでそのまま)
以上
ところで (スコア:2)
ストーリ文中のアドレスはひっくり返ってない件について。
見てみました…… (スコア:1, おもしろおかしい)
http://????.?????-?????????.???/ar/default.aspx
に……(本当に疑問符連発)
当然リロードもできませぬ。
ごめんなさい。/.とかじゃ超嫌われそうなIE8+DonutLの組み合わせです。
でも、これじゃあアクセス不能ですがな。アクセシビリティって何だろう。
Re: (スコア:0)
アラビア語でアクセスできるようにすることでは?