残念ながら、彼らとて、アルファベットを普通に使用することはあるわけで、画一的に文字コードによって向きを規定するなんていうのはナンセンス極まりないでしょう。 Unicodeが異なるレイヤの問題を一つのレイヤに組み込みすぎたという意見には一部納得しますが、かといって、歴史を変えるわけにも行かない以上、私たちには、Unicodeとうまくやっていくしかないんでしょうね。なんだかんだいって、Windows, Mac OS X, Javaなどは既にUnicode族ですし、Linuxの多くのディストリビューションも既にデフォルトがUTF-8になりつつあります。
機能美 (スコア:0)
最低限の制御文字とサロゲートペア、そして文字の定義だけにしてほしい。
制御文字なんてASCIIコードですら余計なものがあると感じるのに。
通信とかで特別な文字が必要なんだったら、外字コードみたいにユーザに開放された制御文字空間を作ればいいだけじゃないの?
その意味を定義するべき団体はそれを利用する団体であって、Unicode(, Inc.)ではないだろうし。
ただの文字として使いたいだけなのに複雑なパーサが必要になるのは納得いかない。
Re:機能美 (スコア:0)
ファイルネームにUnicodeってのはtoo muchであって「システム処理に関わる部分はASCII文字のみ」とでもするのが理想なのでしょうが、今更無理でしょうし(日本語の名前がついたファイルを山のように抱えてるひとがどれだけいるかだけ考えても)。
Re:機能美 (スコア:-1)
文字が文字として必要な機能と、外側の枠組みとして必要な機能(デザインや意味分解)を分けて考えて下さい。
Unicodeは漢字に対応する為に制御文字を必要としていますか?
我々は縦書きの為に制御文字を必要としていますか?
これはhtmlとcssの関係にも似ているでしょう。
しかし文字コードはhtmlとcssの関係以上に必要なものが明確でシンプルな関係だと思っています。
Re:機能美 (スコア:0)
> 我々は縦書きの為に制御文字を必要としていますか?
そりゃ我々の大多数は日本人なんで、日本語に制御文字がない状態は想像つきますが。
日本語だけで自明な話を、安易に別の言語にまで広げるのは思慮が浅いですね。
自国の単語と外来語で方向が逆になる言語ではどうなりますか?
複雑なリガチャーをもつ言語ではどうなりますか?
日本語でも「き」と「ゃ」の間には制御コードを入れませんが、「き」と「゛」の間には制御コードを入れますね。
これって不要だと思いますか?
文字セットを文字カタログのようなものと考えられているのであればそれは大きな間違いです。
Re:機能美 (スコア:0)
他言語に関しては想像しづらいので至らないところは申し訳ありません。
> 自国の単語と外来語で方向が逆になる言語ではどうなりますか?
架空の例をいくら挙げても重箱の隅になるのでおたずねしますが、
実際にそういう国があると捉えてよろしいのですね?
その場合、自国語と他国語で文字の使用範囲が異なるのであれば問題ないでしょう。
もし自国語も他国語も例えばアルファベット26文字だけで表すような文化であれば無理ですね。
しかしそれは制御コードに意味分解をさせている事になります。
強調やアンダーラインにいちいちコードを割り当てるようなものであり、本来の文字の領分では無いと思います。
もっとも、突き詰めると改行まで無くすのかという話になるので線引きがUnicodeと私で違ったという事なのでしょう。
> 複雑なリガチャーをもつ言語ではどうなりますか?
> 「き」と「゛」の間には制御コードを入れますね。
> これって不要だと思いますか?
リガチャやハングル文字のようなものは単語に対して行うものではなく、意味分解ではありません。
濁音についても同様です。
しかし濁音については現実に不便しています。
ソフトウェアのバグなのか、セキュリティの為に制御コードを除去しているのかは分りませんが、
濁音が通らないソフトウェアがあります。
以下は個人的にそういう体験をして苛ついているから思う身勝手な感想ですが、
濁音が付く文字は少数であり、Shift_JISのような非常に狭い空間でも1字に納めていたのですから、わざわざ分ける必要は無かったと思います。
それに分けたとしたら、どちらにせよ表示時に組み合わせなければいけないわけですから
「き」「゛」と続いたら「ぎ」にするだけです。制御文字は要らなかったと思います。
(ただの身勝手な意見なので「き゛」と分けて書きたいというイレギュラーな考えは無視します。)
Re:機能美 (スコア:3, 興味深い)
> 架空の例をいくら挙げても重箱の隅になるのでおたずねしますが、
> 実際にそういう国があると捉えてよろしいのですね?
少なくともインドではそのような記述をしている人々がいます。
彼らがノートにメモを取っている様子などは興味深いです。右から左に文章を書いているのに、途中にWindowsなどの外来単語が出現すると、少し左までペンを移動した後に、Windowsと書き、その後にまた左に続けて書いていきます。
残念ながら、彼らとて、アルファベットを普通に使用することはあるわけで、画一的に文字コードによって向きを規定するなんていうのはナンセンス極まりないでしょう。
Unicodeが異なるレイヤの問題を一つのレイヤに組み込みすぎたという意見には一部納得しますが、かといって、歴史を変えるわけにも行かない以上、私たちには、Unicodeとうまくやっていくしかないんでしょうね。なんだかんだいって、Windows, Mac OS X, Javaなどは既にUnicode族ですし、Linuxの多くのディストリビューションも既にデフォルトがUTF-8になりつつあります。
また、ハングルやインドの言語などに関しては、文字合成という概念は極めて合理的かつ効率的であるので、文字合成という概念がUnicodeに導入されたのも必然性はあったのではなでしょうか。
そのせいで、合成・分解のルールが設定されたことは規格として複雑性を高めたとも言えますが、一方で、日本人が全角・半角といっている文字群に対しても画一的な説明を付けることが出来るようになったのは大きいでしょう。個人的には、Unicodeのおかげで、全角・半角の文字を同一視できるようになったのは大きいなぁと勝手に感動したりもしました。
Re:機能美 (スコア:1, 参考になる)
議論そのものに参加するつもりはないのですが、とりあえず
ウィキペディアのヘブライ語版 [wikipedia.org]やアラビア語版 [wikipedia.org]
を対応ブラウザで見ると、自国の文字は右から左、英数字は左から右、
となっていますね。
# まあ、文字コードさえ被っていなければ制御文字がなくても
# 表示側で対応すれば問題ない、というのは確かに正論かも。
Re:機能美 (スコア:0)
そして、途中に英語などの外来語や数字が入る時は、左から右の表記になるよ。
常識なので覚えておこうね。
言うまでもないけど、アラビア文字は少数派の文字ではないですよ。
…ヘブライ文字は少数派だと思うけど。
---
ま、最初にUnicode作ったのが英語圏の人たちなんで、めちゃくちゃな実装になっちゃったのは有る意味必然ですね…。
16bitで足りるわきゃない(;´ω`)
Re:機能美(オフトピック) (スコア:0)
何処の?ここが言語学を主に扱うところなら、まだ分かるんだけど。
この流れでそれを常識といってしまうのは随分狭い世界の住人さんだな、と思ってしまう。
# 常識の必要は感じるか、常識の存在は認めていないAC.
Re:機能美(オフトピック) (スコア:0)
まあ日本ではあまり馴染みが無い生活の常識だけど、それを類推できる柔軟性も無いの??
Re:機能美(オフトピック) (スコア:0)
/.j(コンピュータトピック)で、例えば2進数や16進数位常識でしょ?っていう感覚なら分かるけれど、
右から書くのと、左から書くのが混在する文字体系の存在を知っていることが「生活の中の常識」
に入ると思っているなら、なおの事、随分世界の狭い住人さんだな、という思いが強くなる。
(Unicodeを語るなら常識でしょ?って反論ならもうちょっと納得できたかもなのですが)
そもそも「日本ではあまり馴染みが無い」と言う時点で常識と呼ぶのは「日本では」無理があるのでは?