アカウント名:
パスワード:
何より文字自体に意味をもってるのはデカいと思う。
漢字は情報処理と相性が悪いのがダメ。
入力するのも出力するのも見るのも大変。JIS漢字の「驫」「鸞」ちゃんと見えてますか?文字と読みが一致しないのでソート目的によっては読みまで入力する必要あり。文字コードが増えるためにデータとして圧縮するのも不利。文字コードの問題から扱える文字数に制限が出る。同音異字のため入力した後に期待した文字が出ているか確認が必要。
いいなと思うところは知らない文字でも意味を推測しやすいのと、文字としての芸術にもなりうる美しさぐらいか?
違うよ。漢字の本当に大きなメリットは造語力と、文字数あたりの情報密度。
英語で知らない言葉の意味を類推したり新しい言葉を作ったりするにはギリシャ語やラテン語をある程度勉強していないといけない。日本語の場合はそれが漢字にあたるのだが、ローマ字に移行してしまうと漢字の新語生成能力が失われてしまう。そして漢語は少ない文字数で複雑な概念を表すことが出来るので、いったん覚えてしまえば文書を読むのがとても楽になる。ちなみに私は米国育ちで、語彙力と作文力は日英だいたい同じくらいなのだけど、読む速度だけは昔から日本語の方がずっと上。
日本語をローマ字表記にしよう、なんてのはあまりにもバカげていて、まともに議論をする気にもなれない。日本語を放り捨てて英語を公用語にしよう、という方がまだマシだ。(その案ももちろん反対だけど)
経験上、英語と日本語で同じ内容なら、UTF-8の場合日本語はだいたい1.5倍のバイト数になる。描画幅だとだいたい同じくらいかちょっと多めの領域が必要になる。だからたしかに文字数あたりの情報密度は高いかな。ちょっとだけ。
漢字は読むのが楽という印象をうけるのはわかるけど、読みやすく感じる=理解できているではないのに注意が必要だね。漢字だけひろって読んでいるつもりになってしまうことがある。
出版物はあまり漢字を使わない傾向にある(常用漢字だけとかじゃなくて、ひらく場合が多い)けど、なんかエビデンスがあってやってるんだろうかね。
ローマ字については慣れの問題だから、おれもやだよ。
どんな文章で比較しているかしらんが、英文は長文に陥りやすい。バイト数でも文字量でも日本語のほうが少ない場合が多いだろう。英語は略字になった途端に前提知識アリでないと読めない場合が多くて嫌。丁寧に説明しだすと更に冗長になってうざい。その点日本語は文意でちゃんとあちこち省略しても大丈夫で簡略化に繋がる。開発言語に例えたらPerlの様な感じ。それなりに訓練されていないと使いこなせない代物だがな。みんな嫌がるのも無理はない。あと出版物でひらがなが増えたのはバカに迎合してるか、書いているのがバカなだけ。
ふつうの散文だよ。簡略化したら表現が変わるじゃん。まともな英文と表現を無視して省略した日本語じゃ比較にならない。
まあ、冠詞の意味を日本語に含めるのは難しいから、たいていは無視するが……
割とどんな言語でも「訳すと長くなる」ことが多いらしい やっぱニュアンスのこだわりとかあるしなので元が英語を日本語に訳すか、日本語を英語に訳すかでだいぶ違う「英語と日本語で同じ内容」ってのが難しいんよな
村上春樹の英訳本は日本語より薄くなってない?
例えばkindleの電子本で調べてみるとページ数でいえば英語よりも日本語の方が長くなってそう。英語では日本語よりも小さな文字で快適に読めるのかもしれない。
世界の終りとハードボイルド・ワンダーランド日本語版 7293KB 715ページ英語版 5799KB 418ページ
ねじまき鳥クロニクル日本語版 6454KB 1121ページ英語版 4858KB 626ページ
後者の方がページ数が多いのにファイルサイズが小さい理由は不明だけどイラストなどの影響だと思う。
UTF-8にすると日本語ばほぼ3バイトになるからバイト数と情報量は違うので…
バイト数? アスキー文字ならUTF-8で1バイト。基本多言語面ならUTF-8で3バイト。
でも、元コメの言う情報密度はコンピュータでの話じゃなくて、読むにしても紙の書籍とかでの話では?
漢字の新語生成能力って活躍してる?最近は原語そのまま日本語で発音しやすいカタカナにして使っているケースが多いのでは?コンピューターでなく電算機、プログラムでなく算譜とか言ってるのかなあ。
電算機や算譜を聞いた記憶はありませんが、今の情報システム部に相当する部門が、以前は「電算室」だったような記憶があります。単にコンピュータールームの訳の可能性もありますが。
これらに限らず、外国語の訳である漢字2文字程度の新語で最も新しいものは何だろうという興味があります。自分の周りを見渡すと、ひょっとして「液晶」?
電脳や算法あたりは耳にしたことありませんか?
活躍してますよ、あなたの目の前で。「新語生成能力」なんて単語、辞書に載ってないでしょ?私がさっき書き込みながら新しくこしらえたんです。これを日本語の文章でニューボキャブラリージェネレーションアビリティなんてわざわざ言うことはまずないと思います。
それなら new-vocabulary-generation-ability でも新しい単語だと言えるのでは?
ドイツ語ならNewervokabelngenerierungfaehigkeitで一語になるよ!たぶん。
英語で知らない言葉の意味を類推したり新しい言葉を作ったりするにはギリシャ語やラテン語をある程度勉強していないといけない。
ギリシャ語やラテン語を便利するまでもなく、ギリシャ語やラテン語由来の語源をそれなりに知っているだけでかなり助かりますね。
文字数あたりの情報密度は確かに日本語の方が高いがページあたりの情報密度だとどうだろうか?
英語の本が日本語に翻訳されていると日本語の方がやたらと分厚くなっているように思う。反対に日本語の本が英語に翻訳されるとかなり薄くなる印象がある。
本のサイズの違いもあるしページ数だけでの比較にはあまり意味がないかもしれないが。
追加、フォントの開発が困難
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond
漢字って優れてるよね (スコア:2)
何より文字自体に意味をもってるのはデカいと思う。
日本語における漢字のダメなところ (スコア:0)
漢字は情報処理と相性が悪いのがダメ。
入力するのも出力するのも見るのも大変。
JIS漢字の「驫」「鸞」ちゃんと見えてますか?
文字と読みが一致しないのでソート目的によっては読みまで入力する必要あり。
文字コードが増えるためにデータとして圧縮するのも不利。
文字コードの問題から扱える文字数に制限が出る。
同音異字のため入力した後に期待した文字が出ているか確認が必要。
いいなと思うところは
知らない文字でも意味を推測しやすいのと、文字としての芸術にもなりうる美しさぐらいか?
Re: (スコア:0)
違うよ。漢字の本当に大きなメリットは造語力と、文字数あたりの情報密度。
英語で知らない言葉の意味を類推したり新しい言葉を作ったりするにはギリシャ語やラテン語をある程度勉強していないといけない。日本語の場合はそれが漢字にあたるのだが、ローマ字に移行してしまうと漢字の新語生成能力が失われてしまう。
そして漢語は少ない文字数で複雑な概念を表すことが出来るので、いったん覚えてしまえば文書を読むのがとても楽になる。ちなみに私は米国育ちで、語彙力と作文力は日英だいたい同じくらいなのだけど、読む速度だけは昔から日本語の方がずっと上。
日本語をローマ字表記にしよう、なんてのはあまりにもバカげていて、まともに議論をする気にもなれない。日本語を放り捨てて英語を公用語にしよう、という方がまだマシだ。(その案ももちろん反対だけど)
Re: (スコア:0)
経験上、英語と日本語で同じ内容なら、UTF-8の場合日本語はだいたい1.5倍のバイト数になる。
描画幅だとだいたい同じくらいかちょっと多めの領域が必要になる。
だからたしかに文字数あたりの情報密度は高いかな。ちょっとだけ。
漢字は読むのが楽という印象をうけるのはわかるけど、読みやすく感じる=理解できている
ではないのに注意が必要だね。漢字だけひろって読んでいるつもりになってしまうことがある。
出版物はあまり漢字を使わない傾向にある(常用漢字だけとかじゃなくて、ひらく場合が多い)けど、
なんかエビデンスがあってやってるんだろうかね。
ローマ字については慣れの問題だから、おれもやだよ。
Re: (スコア:0)
どんな文章で比較しているかしらんが、英文は長文に陥りやすい。
バイト数でも文字量でも日本語のほうが少ない場合が多いだろう。
英語は略字になった途端に前提知識アリでないと読めない場合が多くて嫌。
丁寧に説明しだすと更に冗長になってうざい。
その点日本語は文意でちゃんとあちこち省略しても大丈夫で簡略化に繋がる。
開発言語に例えたらPerlの様な感じ。それなりに訓練されていないと使いこなせない代物だがな。
みんな嫌がるのも無理はない。
あと出版物でひらがなが増えたのはバカに迎合してるか、書いているのがバカなだけ。
Re: (スコア:0)
ふつうの散文だよ。
簡略化したら表現が変わるじゃん。
まともな英文と表現を無視して省略した日本語じゃ比較にならない。
まあ、冠詞の意味を日本語に含めるのは難しいから、たいていは無視するが……
Re: (スコア:0)
割とどんな言語でも「訳すと長くなる」ことが多いらしい やっぱニュアンスのこだわりとかあるし
なので元が英語を日本語に訳すか、日本語を英語に訳すかでだいぶ違う
「英語と日本語で同じ内容」ってのが難しいんよな
Re: (スコア:0)
村上春樹の英訳本は日本語より薄くなってない?
Re: (スコア:0)
例えばkindleの電子本で調べてみるとページ数でいえば英語よりも日本語の方が長くなってそう。
英語では日本語よりも小さな文字で快適に読めるのかもしれない。
世界の終りとハードボイルド・ワンダーランド
日本語版 7293KB 715ページ
英語版 5799KB 418ページ
ねじまき鳥クロニクル
日本語版 6454KB 1121ページ
英語版 4858KB 626ページ
後者の方がページ数が多いのにファイルサイズが小さい理由は不明だけどイラストなどの影響だと思う。
Re: (スコア:0)
UTF-8にすると日本語ばほぼ3バイトになるからバイト数と情報量は違うので…
Re: (スコア:0)
バイト数? アスキー文字ならUTF-8で1バイト。基本多言語面ならUTF-8で3バイト。
でも、元コメの言う情報密度はコンピュータでの話じゃなくて、読むにしても紙の書籍とかでの話では?
Re: (スコア:0)
漢字の新語生成能力って活躍してる?
最近は原語そのまま日本語で発音しやすいカタカナにして使っているケースが多いのでは?
コンピューターでなく電算機、プログラムでなく算譜とか言ってるのかなあ。
Re:日本語における漢字のダメなところ (スコア:1)
電算機や算譜を聞いた記憶はありませんが、今の情報システム部に相当する
部門が、以前は「電算室」だったような記憶があります。
単にコンピュータールームの訳の可能性もありますが。
これらに限らず、外国語の訳である漢字2文字程度の新語で
最も新しいものは何だろうという興味があります。
自分の周りを見渡すと、ひょっとして「液晶」?
-- う~ん、バッドノウハウ?
Re: (スコア:0)
電脳や算法あたりは耳にしたことありませんか?
Re: (スコア:0)
活躍してますよ、あなたの目の前で。「新語生成能力」なんて単語、辞書に載ってないでしょ?私がさっき書き込みながら新しくこしらえたんです。これを日本語の文章でニューボキャブラリージェネレーションアビリティなんてわざわざ言うことはまずないと思います。
Re: (スコア:0)
それなら new-vocabulary-generation-ability でも新しい単語だと言えるのでは?
Re:日本語における漢字のダメなところ (スコア:1)
ドイツ語ならNewervokabelngenerierungfaehigkeitで一語になるよ!たぶん。
Re: (スコア:0)
英語で知らない言葉の意味を類推したり新しい言葉を作ったりするにはギリシャ語やラテン語をある程度勉強していないといけない。
ギリシャ語やラテン語を便利するまでもなく、ギリシャ語やラテン語由来の語源をそれなりに知っているだけでかなり助かりますね。
Re: (スコア:0)
文字数あたりの情報密度は確かに日本語の方が高いがページあたりの情報密度だとどうだろうか?
英語の本が日本語に翻訳されていると日本語の方がやたらと分厚くなっているように思う。
反対に日本語の本が英語に翻訳されるとかなり薄くなる印象がある。
本のサイズの違いもあるしページ数だけでの比較にはあまり意味がないかもしれないが。
Re: (スコア:0)
追加、フォントの開発が困難