![ビジネス ビジネス](https://srad.jp/static/topics/business_64.png)
非漢字圏の開発者にグリフの違いと重要性を解説するウェブページ 78
ストーリー by nagazou
英語圏の人から見たら同じじゃんと思うだろうけども 部門より
英語圏の人から見たら同じじゃんと思うだろうけども 部門より
アプリケーションや製品マニュアルなどで日本語が使われているのに、漢字が中国のものになっている例はよく見かける。しかも中国語圏であっても簡体字と繁体字で漢字表記に違いがある。こうした差を非漢字圏の開発者に伝えることはなかなか難しいものがある。「Your Code Displays Japanese Wrong」はそんな日本語の漢字表記について英語で説明したサイト(GIGAZINE)。
このサイトでは、こうした文字の違いは大きなものだと指摘、簡体字混じりの日本語表記は、日本語母語話者にこの開発者は言語について気にかけていないと感じさせてしまうと警告している。サイトではウェブ開発とゲーム開発で、原因となる文字セットの変更方法も記載されている。なお同サイトの制作者は日本人エンジニアの井口健治さんだそうだ。
このサイトでは、こうした文字の違いは大きなものだと指摘、簡体字混じりの日本語表記は、日本語母語話者にこの開発者は言語について気にかけていないと感じさせてしまうと警告している。サイトではウェブ開発とゲーム開発で、原因となる文字セットの変更方法も記載されている。なお同サイトの制作者は日本人エンジニアの井口健治さんだそうだ。
漢字圏の日本語話者でも気にしてない例 (スコア:4, 興味深い)
大阪の「阪」が中国語フォントでも気にせずに広報に使っている市役所とか政党があったりする
https://twitter.com/oneosaka/status/1361909712611016710 [twitter.com]
https://twitter.com/osakacity_koho/status/1156842977584488448 [twitter.com]
まあ、適当なデザイン事務所に発注したらそこが中国のデザイナーに丸投げしたとかそういう感じなのかなコレって
Re:漢字圏の日本語話者でも気にしてない例 (スコア:2)
さすがにデザインじゃねの…かなぁ…
Re: (スコア:0)
「阪」「維」「新」の字が中国語フォントだと指摘を受けて修正してるんですよ
https://twitter.com/oneosaka_factck/header_photo [twitter.com]
Re:漢字圏の日本語話者でも気にしてない例 (スコア:2)
それは維新の会がデザインを改めたというだけで
デザイナがデザインとして選んだら中国語フォントだった、という可能性を否定しないのでは
しかしこれ例示されてる2個似てるなぁ…同じ事務所だったりするんかな
Re:漢字圏の日本語話者でも気にしてない例 (スコア:3)
どこにぶら下げるか迷ったけど、明朝・ゴシックなんかでは日本語の書体と中国語の書体では明らかに違うけど、楷書・行書なんかの昔風かつ筆書きの書体では、日本語用の書体でも中国語書体に似たデザインになる場合が……。
で、それに該当するモノの例が糸偏の文字。
そう、維新の「維」も、その1つなんですよ……。
Re:漢字圏の日本語話者でも気にしてない例 (スコア:2)
使用率の高いと思われる小塚ゴシック(OSX付属)UD新ゴ、新ゴは、はっきり違いますし
フォントワークス系列も違いましたね。
なんの書体だろう?
Re:漢字圏の日本語話者でも気にしてない例 (スコア:1)
筆書きの書体が中国に似ているというか、中国が筆書きの書体に合わせて明朝体のデザイン改革をしたんだよな。慣れれば画数もわかりやすくて合理的
Re: (スコア:0)
もしかして:大阪は日本ではない
Re: (スコア:0)
そうは言っても「へ」と「ヘ」とか「カ」と「力」とか日本人でも気づかないのはいくらでもある
Re: (スコア:0)
以前、漢数字の二がカタカナの二になっていてデータ取り込み時にエラーが発生して
原因調べるのに苦労した記憶がある。
Re: (スコア:0)
でもこれ、打ってる側も気づけないんですよね
どちらも読みが「に」だから、変換できてしまうし
ましてや OCR が誤読なんてしていたら、手の打ちようがない
Re: (スコア:0)
カタカナの単語がアプリの検索でヒットしないという同僚がいた。
入力する様子を見ていたら、「シート」と入力すべきところを「シ-ト」といった具合に、長音をテンキーで入力していた。
Re: (スコア:0)
逆パターンで大阪メトロの案内掲示は繁体簡体にしかない字だけ中国語フォント(明朝系?)でそれ以外は日本語ゴシックという製作者の感性を疑う逸品もあったり。
違いの認識 (スコア:3)
> 簡体字混じりの日本語表記は、日本語母語話者にこの開発者は言語について気にかけていないと感じさせてしまう
感じさせるというか、正しく気にかけてないんだと思うけれど、
非漢字圏の人がアウトプットを見て「文字セットが合ってない」と認識することは可能なんだろうか。
Re:違いの認識 (スコア:3)
今時みんなUTF-8使ってるんだから、表面上の文字セットはUnicode文字セットだよ。
ストーリーが「文字セット」って言ってるけどグリフセットの間違いでしょ。
Re:違いの認識 (スコア:1)
記事より
そもそも日本語の漢字と簡体字と繁体字が混同されてしまいがちなのは、Unicodeが設計された時に、文字セットのサイズを小さくするために中国語・日本語・韓国語で使われる同等の漢字には同等のコードポイントが与えるUnihanが定められたためです。「刃」は日本語の漢字と簡体字と繁体字と韓国語の漢字でそれぞれ見た目が異なりますが、Unicode上では同じコードポイントを与えられており、レンダリングの時に選択した文字セットに応じてふさわしい漢字を表示する仕組みです。
つまり、日本語に翻訳しているのに簡体字や繁体字が表示されてしまう現象の多くは、文字セットを日本語に設定していないことが原因。デフォルトだと簡体字が文字セットに設定されてしまうことが多いので、文字セットを日本語に設定していないと「日本語表記なのに漢字が簡体字表記になる」ということが起こるわけです。
文字セットが未設定で結果として簡体字が選ばれ、その設定でフォント(グリフ)を処理してしまうのが原因ということでいいのかな?
でも私も文字セットはUnicode、フォント(グリフ)はどこぞの言語を指定って認識だったので、文字セットが云々と言われると違和感ありますね。
Re:違いの認識 (スコア:1)
> でも私も文字セットはUnicode、フォント(グリフ)はどこぞの言語を指定って認識だったので、
原文でもまさにこの通りに記載されているように読めますね。
> 文字セットが云々と言われると違和感ありますね。
この「文字セット」の使い方は単に GIGAZINEの文章が変(というか未定義の使い方)なだけだと思います。
Re:違いの認識 (スコア:4, 興味深い)
#この件に関してはこれ以上突っ込む気にはなれません。
Re: (スコア:0)
最低でもあなたがロシアとブルガリアのキリル文字を区別するのと同じくらいは難しいんじゃないだろうか。(要するに無理)
Re: (スコア:0)
表示されてればマシな方で、いわゆる豆腐状態になってることも珍しいわけじゃないから
無理だし気にもしてない(市場規模も的にも)気にする予定もないってところでしょうか
ココ好き (スコア:1)
ιҭ wѳuld bє lѳѳκιng sѳmєҭЋιng lικє ҭЋιs.
コレいいね。
Re: (スコア:0)
そのデザインがleetのようにある程度の一般化して、日本語に中国の漢字混ざってても読めるだろ別にいいんじゃね?となる未来
Re:ココ好き (スコア:2)
そこまで気にしない人たちならリガチャとかも実装されないし
プロポーショナルフォントなんて不要で等幅フォントのままでもいいやろ。
そうじゃないってことは英語ユーザは気になる人が多いって事。
それと同じで日本語ユーザだって気にするわけ。
どっちのユーザも気にしない人はもちろんいるというだけ。
[Q][W][E][R][T][Y]
Re: (スコア:0)
海外版ギャル文字みたいなものが成立するのか
Re:ココ好き (スコア:1)
中華フォントの場合は検索に支障はないじゃん。この例示はそこを表現しきれていないのが残念
Re: (スコア:0)
結構前に海外でPC支給されたとき、環境にIME自体が存在しなくてダイレクト入力で
ネイティブに比べて日本語は入力の手間暇にかかるコストがスゲーなと体感した
その分の表現力はあると思っているけれど、世界と勝負するのは別だからねぇ。
Re: (スコア:0)
その代わりスマートデバイスでの入力は日本語が有利と言われていたような
アルファベットの「a」と「Q」もそっくりだから (スコア:0)
同じ文字に割り当てよう!
Re:アルファベットの「a」と「Q」もそっくりだから (スコア:1)
ギリシャ文字のΑとラテン文字のAも一緒にしよう。
というよりもなによりも、ロゴなんかでAの代わりにΛを使う文化を撲滅しよう。
歌手の「HΛL」、2文字目はギリシャ文字、3文字目がギリシャ文字に存在しない文字なので、1文字目が「H」なのか「Η」なのか判別できない。
Re:アルファベットの「a」と「Q」もそっくりだから (スコア:1)
キリル文字のНだろう。欧州3大アルファベットをコンプするのだ。
Re: (スコア:0)
そうは言ってもロゴだと単なるデザインだからな
これみたい [google.com]に
Re: (スコア:0)
それは言いすぎだけど、
Σと E とか
α と a とか
ω と w くらいなら
同じ文字扱いでいいんじゃね?
#ドイツ語初心者が通る道。「エスツェットとベータってどこが違うの?」
ほっとけばいい (スコア:0)
注意喚起なぞしなくていい
偽造品の識別に役に立ってるから。
# メールでも変な日本語/文字セットで注意する一助になってる
フィッシング詐欺は結構グリフで見分けられる事が多い。 (スコア:0)
この知識が詐欺業者にまで広く知られてしまうと、こちらが見分けにくくなって困るかも。
Re:フィッシング詐欺は結構グリフで見分けられる事が多い。 (スコア:1)
フィッシング詐欺犯はわざと突っ込みどころがあるサイトにしてるんですよ。それでも引っかかる馬鹿を選別するために。うっかり完璧な偽物を作ってITリテラシーがある人も引っ掛けてしまうと泣き寝入りしてくれなくて面倒なことになる可能性が高い。
Re: (スコア:0)
詐欺をしていないまっとうな業者まで間違っていたら、結局区別がつかないのでは?
Re: (スコア:0)
間違っていたらまっとうな業者じゃないんですよ
まっとうな業者は、言われなくてもちゃんとコストを掛けてちゃんとしている
Re: (スコア:0)
日本語キーボードで変換キーの右横が「カ夕カナ(カゆうカナ)」になってるかもな
Re: (スコア:0)
ま、そんなのならご愛嬌ですね。
# いまキーボードの裏見たらMADE IN JAPANだったよ(topre)
Re: (スコア:0)
最近のフィッシングキットはオリジナルのサイトをほぼ完コピするから、どのみちグリフで見分けるのは難しいね
リバースプロキシでも使ってんのかな
Re: (スコア:0)
一昔前には「貴様メール」など笑いのネタにもなったが、今、そんな初歩的な間違いはもうない。
詐欺業者も進歩しているのだ。
Re: (スコア:0)
適当なドメイン取ってフィッシングすることから何も進化できないじゃん
yѳur ҭєxҭ lѳѳκs κιnd ѳf lικє ҭЋιs (スコア:0)
In short, from a native Japanese eye, yѳur ҭєxҭ lѳѳκs κιnd ѳf lικє ҭЋιs.
中華フォントってそこまで違和感ないでしょ。
your te☓t looκs κιnd of lικe thιs
アルファベットネイティブの感覚なんて知らんが、せいぜいこのレベルでは。
Re:yѳur ҭєxҭ lѳѳκs κιnd ѳf lικє ҭЋιs (スコア:2)
高さ方向半分より上に飛び出している文字が少なすぎて、すごく違和感がある
Re: (スコア:0)
<span lang="zh">刃直海角骨入</span>
Unicodeの功罪 (スコア:0)
HTMLでもテキストでも良いんだけど、Unicode文字列中に日本語を意図する部分と簡体字を意図する部分があっても、Unicode規格の範疇ではそれらを区別できないんだよね。
HTMLでlang属性使っても、そのHTMLのソースを扱う時の表現は、ワープロ的に部分毎に変わってくれたりはしない。
SNSやらでも普通に、一つのメッセージに「会話を構成する主な言語」と「人名など別言語での本来の表記を尊重したい部分」が混ざったりするだろうけれど、そういう混在コンテンツの捉え方はどうなんだろうなあ。
Re: (スコア:0)
こういうことですかね?
<p lang="ja">刃直海角骨入</p>
<p lang="zh-tw">刃直海角骨入</p>
<p lang="zh-cn">刃直海角骨入</p>
HTMLオンラインエディタ [liveweave.com]
まあソースはソースなので、HTMLレンダリングの結果さえ部分毎に変わってくれるなら別にいいかなと
ワープロつーかdocxも内部的にはXMLでlang属性指定するのが正道でしょ
Re:Unicodeの功罪 (スコア:2)
とあるゲームで「直」の字体だけ間違ってて謎だったんだけど、そうか。あれは中国語での直だったのか。すっきりした、thx
日本HPのPC (スコア:0)
Support Assistantの妙なフォントは一向に直らない。
Re:日本HPのPC (スコア:2)
CSS指定がバグっている模様。
https://www.dell.com/support/home/ja-jp [dell.com]