アカウント名:
パスワード:
だけど個人的には採用されてほしくなかったなー
# 文字集合,文字セット,文字エンコードについてOSI7層構造みたいな分割統治がうまくいってない気がするんだよなぁ
まあ、これでますますUTF-8化が進んで、メールで問題減るなら、それはそれでいいか。
RFC 2130 [ietf.org]というのがあって、
ユーザーインターフェイス
オンザワイヤ
という7階層で分割統治されております。Unicodeはコード化文字集合、UTF-8は文字符号化スキーム、BASE64は伝送文法に相当します。
to be to be ten made to be
は、日本語だと指定するのが言語層、
01/02/03
が2001年2月3日だと指定するのがロカール層、みたいなことです。
IAB発行とはいえ、informationalな文書なので規格とはいえず、まぁ、RFC作るときに参考にしようね、という程度ですかね。
ああ、この規格は知りませんでした。まずは感謝を。
その上での返信なのですが
> という7階層で分割統治されております。Unicodeはコード化文字集合、UTF-8は文字符号化スキーム、BASE64は伝送文法に相当します。層としては大体はいいんですが、例えていうならTCP/IP上にHTTP/SMTP/...が上手く混ぜて通信できるみたいにUCS-2などの文字集合(TCP)に入れる言語セット(HTTPとか)は自由でそれぞれのバージョンあり、みたいなのができてないなと。
Unicodeに含まれる日本語の改訂とかで揉めたりしますけど、できれば日本語は日本語として整備を進めれればいいし、それをある利用のための集合に入れる時に適切に互換をもちつつピックアップ&写像(射影か?)できれば、なんというか、多少は問題が減るんじゃないかとか思ってて。
じゃないと、すべての*言語*を収録した...Unicodeに絵文字(言語的背景があんまりない)っていうのが座りが悪くて。
XML文書に好きなスキーマ混在できる、みたいなのが近いかな?すべての文字表現物の集合ルールのVer.X.Yとかならあんまり違和感ないし、場合によって収録されてない字とか出ても、その時の表現能力の限界があったと思えばそれはそれでいいや、とも思えるんですけどねぇ...住基とかで必要ならEx-UCS-8とか互換ルール&日本語ローカルな内部規格使うぞーみたいなのが、うまく擦り合うことができるんじゃないかなとか。
# ほぼグチです...御目汚し失礼
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
UNIXはただ死んだだけでなく、本当にひどい臭いを放ち始めている -- あるソフトウェアエンジニア
混乱解消はよいこと (スコア:1)
だけど個人的には採用されてほしくなかったなー
# 文字集合,文字セット,文字エンコードについてOSI7層構造みたいな分割統治がうまくいってない気がするんだよなぁ
まあ、これでますますUTF-8化が進んで、メールで問題減るなら、それはそれでいいか。
M-FalconSky (暑いか寒い)
Re:混乱解消はよいこと (スコア:3, 参考になる)
RFC 2130 [ietf.org]というのがあって、
ユーザーインターフェイス
オンザワイヤ
という7階層で分割統治されております。Unicodeはコード化文字集合、UTF-8は文字符号化スキーム、BASE64は伝送文法に相当します。
は、日本語だと指定するのが言語層、
が2001年2月3日だと指定するのがロカール層、みたいなことです。
IAB発行とはいえ、informationalな文書なので規格とはいえず、まぁ、RFC作るときに参考にしようね、という程度ですかね。
/K
Re:混乱解消はよいこと (スコア:1)
ああ、この規格は知りませんでした。
まずは感謝を。
その上での返信なのですが
> という7階層で分割統治されております。Unicodeはコード化文字集合、UTF-8は文字符号化スキーム、BASE64は伝送文法に相当します。
層としては大体はいいんですが、例えていうならTCP/IP上にHTTP/SMTP/...が上手く混ぜて通信できるみたいに
UCS-2などの文字集合(TCP)に入れる言語セット(HTTPとか)は自由でそれぞれのバージョンあり、みたいなのができてないなと。
Unicodeに含まれる日本語の改訂とかで揉めたりしますけど、できれば日本語は日本語として整備を進めれればいいし、それをある利用のための集合に入れる時に適切に互換をもちつつピックアップ&写像(射影か?)できれば、なんというか、多少は問題が減るんじゃないかとか思ってて。
じゃないと、すべての*言語*を収録した...Unicodeに絵文字(言語的背景があんまりない)っていうのが座りが悪くて。
XML文書に好きなスキーマ混在できる、みたいなのが近いかな?
すべての文字表現物の集合ルールのVer.X.Yとかならあんまり違和感ないし、場合によって収録されてない字とか出ても、その時の表現能力の限界があったと思えばそれはそれでいいや、とも思えるんですけどねぇ...
住基とかで必要ならEx-UCS-8とか互換ルール&日本語ローカルな内部規格使うぞーみたいなのが、うまく擦り合うことができるんじゃないかなとか。
# ほぼグチです...御目汚し失礼
M-FalconSky (暑いか寒い)
Re:混乱解消はよいこと (スコア:2)
/K
机上の空論 (スコア:0)