アカウント名:
パスワード:
ISO-2022-JPの「高」はくち高・はしご高の区別(異体字の区別)はありませんよね。いろんな異体字を含む同一の文字としての「高」に対してコードが割り振られてるわけで。
現在主流のOSやフォントが「高」に対してくち高を割り当てているのは、たまたまそうなってるだけ。
そんなこと言い出したら「うちは変体仮名でないとだめ」とか「絵文字でないとだめ」とかきりがない。(「かまわぬ」とか?)
口高、はしご高を同一文字としてしまっている、言語学的に不備があり、実用上も不便のあるコード体系ですよね、ISO-2022-JP。
そんなこと言い出したら、日本語はすべて英語アルファベットを用いてローマ字書きでいいとかきりがない。(「かまわぬ」とか?)
いえいえ、くち高とはしご高は同一の文字です。
同一じゃないでしょ.異体字の話をしてるんですよ?
同じ文字に属する別の異体字です。
活字でよくある、丸の上に横棒が伸びてきている「a」と、手書きでよくある、丸の上に横棒が伸びてきていない「a」は、別の異体字ですが、同じ文字です。
> 誰もアルファベットの話はしていません。馬鹿じゃねえの。
はい。馬鹿です。あなたが例を例として受け取る能力を欠いた人だということを見抜けなかった私が馬鹿です。
その例にこだわるつもりはないのでその部分はとりさげてもいいですが(「言」の例とか「木」の例とかが別のコメントにあるのでそれを見て頂いてもいいですし、例はよりわかりやすくるためのものですから、なくてもいいです)、「同じ文字に属する別の異体字」という点については、いかがでしょうか。
日本語で、何をもってひとつの文字とするのかを定義している物、場所、規格ってあるんでしょうか?常用漢字?国語審議会みたいのが決めてる?本気で知らないので、教えてください。
規格はいろいろあるようですが1978年に制定されて1997年に「何をもってひとつの文字とするのかを定義」するための基準(包摂という)が明確化されたJIS X 0208という日本工業規格を紹介します。
JIS X 0208 http://ja.wikipedia.org/wiki/JIS_X_0208 [wikipedia.org]
JIS X 0208の1997年改定でどのような字体差を含み包むかが明示され、公開されています。 http://www.aozora.gr.jp/hosetsu_kijyun/0208-6.6.3 [aozora.gr.jp]
これって、工業規格で、完全に電子機器へのコード化に際しての決まりですよね。言語学的には、無いんでしょうか。これだけ異体字とか同じ字とか言われているのに、国語学としては、言及さえない?ちょっとびっくりというか、それでいいのか?
たとえば表外漢字字体表 [mext.go.jp]とか?
内閣告示の常用漢字表 [bunka.go.jp]では、「デザイン差」に触れられており、「この程度の違いは同じ字である(異体字でない)と考えられる」ということが書かれています(何を持って1つの文字とするかという定義はありませんが)。もちろん、常用漢字のみが対象ですけど。
あなたが喋った「アホ」と他の比とが喋った「アホ」は音声波形、基本周波数、周波数スペクトルの変動特性が同一では無いのに、それを同じ「アホ」と表記してしまっている、音響学的に不備があり、実用上も不便のある言語体系ですよね、日本語。
そんなこと言い出したら、日本語の各地域の方言はすべて異なる別々の言語だとかきりがない。
たまたまじゃねぇよ。常用漢字表の字体に合わせてあるんだよ。
> たまたまじゃねぇよ。常用漢字表の字体に合わせてあるんだよ。
合わせたのはフォント作者の自由意志によるものでしょう?はしご高で作っても規格に違反しない。
ガラパゴス規格ではそうだね。国産の規格なのに常用漢字表の通用字体とそうじゃない字体も区別できないんだね。
文字としては同一なのだから区別できなくて当然、というのが日本の立場。たとえば、「言」の第1画は、手書きではふつう縦に書くけど活字だと横に書きますね。第1画が縦か横かというのはけっこう大きな違いですが、別々の文字と見なすべきでしょうか?日本の立場は、これを同一の文字の書き方が違うだけ(異体字)だとみなすものです。だからそれを受けて作られたJIS規格も、それを元に作られたコンピュータやOSも、第1画が縦と横の「言」を区別することはできません。
ところでUnicode (ISO10646) は各国の規格の寄せ
ひらがなの「そ」のゆれみたいなもんだと思えばいいのでは。
でも、同一の文字であるはずの「斉」「斎」「齋」「齊」とかはISO-2022-JP(というかJISX0208とかJISX0213)に含まれてたり、がちがちの原則一辺倒でもなく実用性重視なところもあるので、「くち高」「はしご高」「つち吉」「さむらい吉」についても実用性重視で別々のコードポイントを割り振ってしまってもいいのにと思う。
でも、過去との互換性を考えると、やりにくいのだろうね。たとえばくち高とはしご高を区別できるJISX0213の改訂規格を作るとして、従来の「高」のコードポイントの扱いはどうするのか(従来と同じく、くち高とはしご高の両方を包摂する文字という解釈なのか、それともくち高だけを表すというふうに変更するのか。もし前者の場合、「包摂文字」「くち高」「はしご高」の3種類のコードポイントを作るのか)、いろいろと面倒なことになりそう。
そういえばUnicodeでは「骨」の字がおかしくなるって言ってた人たちは、今どうしてるのだろう。
「斉」と「齊」、「斎」と「齋」はそれぞれ同じ文字ですが、「斉」(「齊」)と「斎」(「齋」)は同じ文字ではありません。もう少し勉強して出直してきてください。
まあ、面倒なことは「辻」なんかで起きてますねえ。「鴎」とか「葛」もね。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
物事のやり方は一つではない -- Perlな人
ISO-2022-JPの「高」 (スコア:2, 参考になる)
ISO-2022-JPの「高」はくち高・はしご高の区別(異体字の区別)はありませんよね。
いろんな異体字を含む同一の文字としての「高」に対してコードが割り振られてるわけで。
現在主流のOSやフォントが「高」に対してくち高を割り当てているのは、たまたまそうなってるだけ。
そんなこと言い出したら「うちは変体仮名でないとだめ」とか「絵文字でないとだめ」とか
きりがない。(「かまわぬ」とか?)
Re:ISO-2022-JPの「高」 (スコア:1)
口高、はしご高を同一文字としてしまっている、言語学的に不備があり、実用上も不便のあるコード体系ですよね、ISO-2022-JP。
そんなこと言い出したら、日本語はすべて英語アルファベットを用いてローマ字書きでいいとか
きりがない。(「かまわぬ」とか?)
Re: (スコア:0)
いえいえ、くち高とはしご高は同一の文字です。
Re: (スコア:0)
同一じゃないでしょ.異体字の話をしてるんですよ?
Re:ISO-2022-JPの「高」 (スコア:1)
同じ文字に属する別の異体字です。
活字でよくある、丸の上に横棒が伸びてきている「a」と、
手書きでよくある、丸の上に横棒が伸びてきていない「a」は、
別の異体字ですが、同じ文字です。
Re: (スコア:0)
> 誰もアルファベットの話はしていません。馬鹿じゃねえの。
はい。馬鹿です。あなたが例を例として受け取る能力を欠いた人だということを見抜けなかった私が馬鹿です。
その例にこだわるつもりはないのでその部分はとりさげてもいいですが
(「言」の例とか「木」の例とかが別のコメントにあるのでそれを見て頂いてもいいですし、
例はよりわかりやすくるためのものですから、なくてもいいです)、
「同じ文字に属する別の異体字」という点については、いかがでしょうか。
Re: (スコア:0)
日本語で、何をもってひとつの文字とするのかを定義している物、場所、規格ってあるんでしょうか?
常用漢字?国語審議会みたいのが決めてる?
本気で知らないので、教えてください。
Re: (スコア:0)
規格はいろいろあるようですが1978年に制定されて1997年に「何をもってひとつの文字とするのかを定義」するための基準(包摂という)が明確化された
JIS X 0208という日本工業規格を紹介します。
JIS X 0208
http://ja.wikipedia.org/wiki/JIS_X_0208 [wikipedia.org]
JIS X 0208の1997年改定でどのような字体差を含み包むかが明示され、公開されています。
http://www.aozora.gr.jp/hosetsu_kijyun/0208-6.6.3 [aozora.gr.jp]
Re: (スコア:0)
これって、工業規格で、完全に電子機器へのコード化に際しての決まりですよね。
言語学的には、無いんでしょうか。
これだけ異体字とか同じ字とか言われているのに、国語学としては、言及さえない?
ちょっとびっくりというか、それでいいのか?
Re: (スコア:0)
たとえば表外漢字字体表 [mext.go.jp]とか?
Re: (スコア:0)
内閣告示の常用漢字表 [bunka.go.jp]では、「デザイン差」に触れられており、「この程度の違いは同じ字である(異体字でない)と考えられる」ということが書かれています(何を持って1つの文字とするかという定義はありませんが)。もちろん、常用漢字のみが対象ですけど。
Re: (スコア:0)
あなたが喋った「アホ」と他の比とが喋った「アホ」は音声波形、基本周波数、周波数スペクトルの変動特性が同一では無いのに、それを同じ「アホ」と表記してしまっている、音響学的に不備があり、実用上も不便のある言語体系ですよね、日本語。
そんなこと言い出したら、日本語の各地域の方言はすべて異なる別々の言語だとかきりがない。
Re: (スコア:0)
たまたまじゃねぇよ。常用漢字表の字体に合わせてあるんだよ。
Re: (スコア:0)
> たまたまじゃねぇよ。常用漢字表の字体に合わせてあるんだよ。
合わせたのはフォント作者の自由意志によるものでしょう?
はしご高で作っても規格に違反しない。
Re: (スコア:0)
ガラパゴス規格ではそうだね。
国産の規格なのに常用漢字表の通用字体とそうじゃない字体も区別できないんだね。
Re: (スコア:0)
文字としては同一なのだから区別できなくて当然、というのが日本の立場。
たとえば、「言」の第1画は、手書きではふつう縦に書くけど活字だと
横に書きますね。第1画が縦か横かというのはけっこう大きな違いですが、
別々の文字と見なすべきでしょうか?日本の立場は、これを同一の文字の
書き方が違うだけ(異体字)だとみなすものです。だからそれを受けて
作られたJIS規格も、それを元に作られたコンピュータやOSも、第1画が
縦と横の「言」を区別することはできません。
ところでUnicode (ISO10646) は各国の規格の寄せ
Re: (スコア:0)
ひらがなの「そ」のゆれみたいなもんだと思えばいいのでは。
Re: (スコア:0)
でも、同一の文字であるはずの「斉」「斎」「齋」「齊」とかはISO-2022-JP(というかJISX0208とかJISX0213)に含まれてたり、
がちがちの原則一辺倒でもなく実用性重視なところもあるので、「くち高」「はしご高」「つち吉」「さむらい吉」についても
実用性重視で別々のコードポイントを割り振ってしまってもいいのにと思う。
でも、過去との互換性を考えると、やりにくいのだろうね。たとえばくち高とはしご高を区別できるJISX0213の改訂規格を作るとして、
従来の「高」のコードポイントの扱いはどうするのか(従来と同じく、くち高とはしご高の両方を包摂する文字という解釈なのか、
それともくち高だけを表すというふうに変更するのか。もし前者の場合、「包摂文字」「くち高」「はしご高」の3種類のコードポイントを
作るのか)、いろいろと面倒なことになりそう。
そういえばUnicodeでは「骨」の字がおかしくなるって言ってた人たちは、今どうしてるのだろう。
Re: (スコア:0)
「斉」と「齊」、「斎」と「齋」はそれぞれ同じ文字ですが、「斉」(「齊」)と「斎」(「齋」)は同じ文字ではありません。
もう少し勉強して出直してきてください。
まあ、面倒なことは「辻」なんかで起きてますねえ。
「鴎」とか「葛」もね。