非漢字圏の開発者にグリフの違いと重要性を解説するウェブページ

非漢字圏の開発者にグリフの違いと重要性を解説するウェブページ 78

ストーリー by nagazou 2021年11月02日 14時02分
英語圏の人から見たら同じじゃんと思うだろうけども部門より

アプリケーションや製品マニュアルなどで日本語が使われているのに、漢字が中国のものになっている例はよく見かける。しかも中国語圏であっても簡体字と繁体字で漢字表記に違いがある。こうした差を非漢字圏の開発者に伝えることはなかなか難しいものがある。「Your Code Displays Japanese Wrong」はそんな日本語の漢字表記について英語で説明したサイト（GIGAZINE）。

このサイトでは、こうした文字の違いは大きなものだと指摘、簡体字混じりの日本語表記は、日本語母語話者にこの開発者は言語について気にかけていないと感じさせてしまうと警告している。サイトではウェブ開発とゲーム開発で、原因となる文字セットの変更方法も記載されている。なお同サイトの制作者は日本人エンジニアの井口健治さんだそうだ。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索78コメント Log In/Create an Account

漢字圏の日本語話者でも気にしてない例 (スコア:4, 興味深い)

by simon (1336) on 2021年11月02日 14時06分 (#4144366)

大阪の「阪」が中国語フォントでも気にせずに広報に使っている市役所とか政党があったりする
https://twitter.com/oneosaka/status/1361909712611016710 [twitter.com]
https://twitter.com/osakacity_koho/status/1156842977584488448 [twitter.com]
まあ、適当なデザイン事務所に発注したらそこが中国のデザイナーに丸投げしたとかそういう感じなのかなコレって
- Re:漢字圏の日本語話者でも気にしてない例 (スコア:2)
  
  by nnnhhh (47970) on 2021年11月02日 14時49分 (#4144416) 日記
  
  さすがにデザインじゃねの…かなぁ…
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    「阪」「維」「新」の字が中国語フォントだと指摘を受けて修正してるんですよ
    https://twitter.com/oneosaka_factck/header_photo [twitter.com]
    - Re:漢字圏の日本語話者でも気にしてない例 (スコア:2)
      
      by nnnhhh (47970) on 2021年11月02日 16時40分 (#4144542) 日記
      
      それは維新の会がデザインを改めたというだけで
      デザイナがデザインとして選んだら中国語フォントだった、という可能性を否定しないのでは
      しかしこれ例示されてる2個似てるなぁ…同じ事務所だったりするんかな
      
      シェア
      
      親コメント
      - Re:漢字圏の日本語話者でも気にしてない例 (スコア:3)
        
        by Takahiro_Chou (21972) on 2021年11月02日 20時57分 (#4144752) 日記
        
        どこにぶら下げるか迷ったけど、明朝・ゴシックなんかでは日本語の書体と中国語の書体では明らかに違うけど、楷書・行書なんかの昔風かつ筆書きの書体では、日本語用の書体でも中国語書体に似たデザインになる場合が……。
        で、それに該当するモノの例が糸偏の文字。
        そう、維新の「維」も、その1つなんですよ……。
        
        シェア
        
        親コメント
        
        Re:漢字圏の日本語話者でも気にしてない例 (スコア:2)
        
        by bubu-duke (47248) on 2021年11月04日 12時20分 (#4145533)
        
        しっかりチェックしたわけではないですが
        使用率の高いと思われる小塚ゴシック（OSX付属）UD新ゴ、新ゴは、はっきり違いますし
        フォントワークス系列も違いましたね。
        なんの書体だろう？
        
        シェア
        
        親コメント
        
        Re:漢字圏の日本語話者でも気にしてない例 (スコア:1)
        
        by Anonymous Coward on 2021年11月03日 18時23分 (#4145222)
        
        筆書きの書体が中国に似ているというか、中国が筆書きの書体に合わせて明朝体のデザイン改革をしたんだよな。慣れれば画数もわかりやすくて合理的
        
        シェア
        
        親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  もしかして:大阪は日本ではない
- Re: (スコア:0)
  
  by Anonymous Coward
  
  そうは言っても「へ」と「ヘ」とか「カ」と「力」とか日本人でも気づかないのはいくらでもある
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    以前、漢数字の二がカタカナの二になっていてデータ取り込み時にエラーが発生して
    原因調べるのに苦労した記憶がある。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      でもこれ、打ってる側も気づけないんですよね
      どちらも読みが「に」だから、変換できてしまうし
      ましてや OCR が誤読なんてしていたら、手の打ちようがない
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    カタカナの単語がアプリの検索でヒットしないという同僚がいた。
    入力する様子を見ていたら、「シート」と入力すべきところを「シ－ト」といった具合に、長音をテンキーで入力していた。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  逆パターンで大阪メトロの案内掲示は繁体簡体にしかない字だけ中国語フォント（明朝系？）でそれ以外は日本語ゴシックという製作者の感性を疑う逸品もあったり。
違いの認識 (スコア:3)

by oni-giri.rice (49266) on 2021年11月02日 13時54分 (#4144352) 日記

> 簡体字混じりの日本語表記は、日本語母語話者にこの開発者は言語について気にかけていないと感じさせてしまう
感じさせるというか、正しく気にかけてないんだと思うけれど、
非漢字圏の人がアウトプットを見て「文字セットが合ってない」と認識することは可能なんだろうか。
- Re:違いの認識 (スコア:3)
  
  by 7743 (11762) on 2021年11月02日 14時43分 (#4144411)
  
  今時みんなUTF-8使ってるんだから、表面上の文字セットはUnicode文字セットだよ。
  ストーリーが「文字セット」って言ってるけどグリフセットの間違いでしょ。
  
  シェア
  
  親コメント
  - Re:違いの認識 (スコア:1)
    
    by Anonymous Coward on 2021年11月02日 15時30分 (#4144466)
    
    記事より
    そもそも日本語の漢字と簡体字と繁体字が混同されてしまいがちなのは、Unicodeが設計された時に、文字セットのサイズを小さくするために中国語・日本語・韓国語で使われる同等の漢字には同等のコードポイントが与えるUnihanが定められたためです。「刃」は日本語の漢字と簡体字と繁体字と韓国語の漢字でそれぞれ見た目が異なりますが、Unicode上では同じコードポイントを与えられており、レンダリングの時に選択した文字セットに応じてふさわしい漢字を表示する仕組みです。
    つまり、日本語に翻訳しているのに簡体字や繁体字が表示されてしまう現象の多くは、文字セットを日本語に設定していないことが原因。デフォルトだと簡体字が文字セットに設定されてしまうことが多いので、文字セットを日本語に設定していないと「日本語表記なのに漢字が簡体字表記になる」ということが起こるわけです。
    文字セットが未設定で結果として簡体字が選ばれ、その設定でフォント（グリフ）を処理してしまうのが原因ということでいいのかな？
    でも私も文字セットはUnicode、フォント（グリフ）はどこぞの言語を指定って認識だったので、文字セットが云々と言われると違和感ありますね。
    
    シェア
    
    親コメント
    - Re:違いの認識 (スコア:1)
      
      by Anonymous Coward on 2021年11月02日 16時18分 (#4144530)
      
      > でも私も文字セットはUnicode、フォント（グリフ）はどこぞの言語を指定って認識だったので、
      原文でもまさにこの通りに記載されているように読めますね。
      > 文字セットが云々と言われると違和感ありますね。
      この「文字セット」の使い方は単に GIGAZINEの文章が変(というか未定義の使い方)なだけだと思います。
      
      シェア
      
      親コメント
    - - Re:違いの認識 (スコア:4, 興味深い)
        
        by alp (1425) on 2021年11月02日 22時12分 (#4144788) ホームページ日記
        
        一応範囲内です。Unicode 内に言語タグ指定方法は提供されているから。
        ＃この件に関してはこれ以上突っ込む気にはなれません。
        
        シェア
        
        親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  最低でもあなたがロシアとブルガリアのキリル文字を区別するのと同じくらいは難しいんじゃないだろうか。（要するに無理）
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    表示されてればマシな方で、いわゆる豆腐状態になってることも珍しいわけじゃないから
    無理だし気にもしてない(市場規模も的にも)気にする予定もないってところでしょうか
ココ好き (スコア:1)

by Anonymous Coward on 2021年11月02日 14時34分 (#4144397)

ιҭ wѳuld bє lѳѳκιng sѳmєҭЋιng lικє ҭЋιs.
コレいいね。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  そのデザインがleetのようにある程度の一般化して、日本語に中国の漢字混ざってても読めるだろ別にいいんじゃね？となる未来
  - Re:ココ好き (スコア:2)
    
    by qwerty (20776) on 2021年11月02日 15時54分 (#4144500) 日記
    
    そこまで気にしない人たちならリガチャとかも実装されないし
    プロポーショナルフォントなんて不要で等幅フォントのままでもいいやろ。
    そうじゃないってことは英語ユーザは気になる人が多いって事。
    それと同じで日本語ユーザだって気にするわけ。
    どっちのユーザも気にしない人はもちろんいるというだけ。
    
    --
    [Q][W][E][R][T][Y]
    
    シェア
    
    親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    海外版ギャル文字みたいなものが成立するのか
  - - Re:ココ好き (スコア:1)
      
      by Anonymous Coward on 2021年11月03日 18時25分 (#4145223)
      
      中華フォントの場合は検索に支障はないじゃん。この例示はそこを表現しきれていないのが残念
      
      シェア
      
      親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  結構前に海外でPC支給されたとき、環境にIME自体が存在しなくてダイレクト入力で
  ネイティブに比べて日本語は入力の手間暇にかかるコストがスゲーなと体感した
  その分の表現力はあると思っているけれど、世界と勝負するのは別だからねぇ。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    その代わりスマートデバイスでの入力は日本語が有利と言われていたような
アルファベットの「a」と「Q」もそっくりだから (スコア:0)

by Anonymous Coward on 2021年11月02日 14時09分 (#4144369)

同じ文字に割り当てよう！
- Re:アルファベットの「a」と「Q」もそっくりだから (スコア:1)
  
  by nim (10479) on 2021年11月02日 15時17分 (#4144450)
  
  ギリシャ文字のΑとラテン文字のAも一緒にしよう。
  というよりもなによりも、ロゴなんかでAの代わりにΛを使う文化を撲滅しよう。
  歌手の「HΛL」、2文字目はギリシャ文字、3文字目がギリシャ文字に存在しない文字なので、1文字目が「H」なのか「Η」なのか判別できない。
  
  シェア
  
  親コメント
  - Re:アルファベットの「a」と「Q」もそっくりだから (スコア:1)
    
    by Anonymous Coward on 2021年11月02日 20時18分 (#4144731)
    
    キリル文字のНだろう。欧州3大アルファベットをコンプするのだ。
    
    シェア
    
    親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    そうは言ってもロゴだと単なるデザインだからな
    これみたい [google.com]に
- Re: (スコア:0)
  
  by Anonymous Coward
  
  それは言いすぎだけど、
  ΣとＥとか
  α と a とか
  ω とｗくらいなら
  同じ文字扱いでいいんじゃね？
  ＃ドイツ語初心者が通る道。「エスツェットとベータってどこが違うの？」
ほっとけばいい (スコア:0)

by Anonymous Coward on 2021年11月02日 14時14分 (#4144375)

注意喚起なぞしなくていい
偽造品の識別に役に立ってるから。
# メールでも変な日本語/文字セットで注意する一助になってる
フィッシング詐欺は結構グリフで見分けられる事が多い。 (スコア:0)

by Anonymous Coward on 2021年11月02日 14時16分 (#4144378)

この知識が詐欺業者にまで広く知られてしまうと、こちらが見分けにくくなって困るかも。
- Re:フィッシング詐欺は結構グリフで見分けられる事が多い。 (スコア:1)
  
  by Anonymous Coward on 2021年11月03日 4時51分 (#4144894)
  
  フィッシング詐欺犯はわざと突っ込みどころがあるサイトにしてるんですよ。それでも引っかかる馬鹿を選別するために。うっかり完璧な偽物を作ってITリテラシーがある人も引っ掛けてしまうと泣き寝入りしてくれなくて面倒なことになる可能性が高い。
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  詐欺をしていないまっとうな業者まで間違っていたら、結局区別がつかないのでは？
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    間違っていたらまっとうな業者じゃないんですよ
    まっとうな業者は、言われなくてもちゃんとコストを掛けてちゃんとしている
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      日本語キーボードで変換キーの右横が「カ夕カナ（カゆうカナ）」になってるかもな
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        ま、そんなのならご愛嬌ですね。
        # いまキーボードの裏見たらMADE IN JAPANだったよ(topre)
- Re: (スコア:0)
  
  by Anonymous Coward
  
  最近のフィッシングキットはオリジナルのサイトをほぼ完コピするから、どのみちグリフで見分けるのは難しいね
  リバースプロキシでも使ってんのかな
- Re: (スコア:0)
  
  by Anonymous Coward
  
  一昔前には「貴様メール」など笑いのネタにもなったが、今、そんな初歩的な間違いはもうない。
  詐欺業者も進歩しているのだ。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    適当なドメイン取ってフィッシングすることから何も進化できないじゃん
yѳur ҭєxҭ lѳѳκs κιnd ѳf lικє ҭЋιs (スコア:0)

by Anonymous Coward on 2021年11月02日 14時33分 (#4144395)

In short, from a native Japanese eye, yѳur ҭєxҭ lѳѳκs κιnd ѳf lικє ҭЋιs.
中華フォントってそこまで違和感ないでしょ。
your te☓t looκs κιnd of lικe thιs
アルファベットネイティブの感覚なんて知らんが、せいぜいこのレベルでは。
- Re:yѳur ҭєxҭ lѳѳκs κιnd ѳf lικє ҭЋιs (スコア:2)
 
 by donadona (37711) on 2021年11月03日 20時53分 (#4145271)
 
 高さ方向半分より上に飛び出している文字が少なすぎて、すごく違和感がある
 
 シェア
 
 親コメント
- Re: (スコア:0)
 
 by Anonymous Coward
 
 刃直海角骨入
Unicodeの功罪 (スコア:0)

by Anonymous Coward on 2021年11月02日 15時34分 (#4144470)

HTMLでもテキストでも良いんだけど、Unicode文字列中に日本語を意図する部分と簡体字を意図する部分があっても、Unicode規格の範疇ではそれらを区別できないんだよね。
HTMLでlang属性使っても、そのHTMLのソースを扱う時の表現は、ワープロ的に部分毎に変わってくれたりはしない。
SNSやらでも普通に、一つのメッセージに「会話を構成する主な言語」と「人名など別言語での本来の表記を尊重したい部分」が混ざったりするだろうけれど、そういう混在コンテンツの捉え方はどうなんだろうなあ。
- Re: (スコア:0)
 
 by Anonymous Coward
 
 こういうことですかね？
 刃直海角骨入
 刃直海角骨入
 刃直海角骨入
 HTMLオンラインエディタ [liveweave.com]
 まあソースはソースなので、HTMLレンダリングの結果さえ部分毎に変わってくれるなら別にいいかなと
 ワープロつーかdocxも内部的にはXMLでlang属性指定するのが正道でしょ
 - Re:Unicodeの功罪 (スコア:2)
 
 by donadona (37711) on 2021年11月02日 21時41分 (#4144772)
 
 とあるゲームで「直」の字体だけ間違ってて謎だったんだけど、そうか。あれは中国語での直だったのか。すっきりした、thx
 
 シェア
 
 親コメント
日本HPのPC (スコア:0)

by Anonymous Coward on 2021年11月02日 17時08分 (#4144560)

Support Assistantの妙なフォントは一向に直らない。
- Re:日本HPのPC (スコア:2)
  
  by Ponta2 (47202) on 2021年11月04日 10時49分 (#4145484)
  
  DELLのサポートサイトも中文簡体フォントですねえ。
  CSS指定がバグっている模様。
  https://www.dell.com/support/home/ja-jp [dell.com]
  
  シェア
  
  親コメント

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

漢字圏の日本語話者でも気にしてない例 (スコア:4, 興味深い)

Re:漢字圏の日本語話者でも気にしてない例 (スコア:2)

Re: (スコア:0)

Re:漢字圏の日本語話者でも気にしてない例 (スコア:2)

Re:漢字圏の日本語話者でも気にしてない例 (スコア:3)

Re:漢字圏の日本語話者でも気にしてない例 (スコア:2)

Re:漢字圏の日本語話者でも気にしてない例 (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

違いの認識 (スコア:3)

Re:違いの認識 (スコア:3)

Re:違いの認識 (スコア:1)

Re:違いの認識 (スコア:1)

Re:違いの認識 (スコア:4, 興味深い)

Re: (スコア:0)

Re: (スコア:0)

ココ好き (スコア:1)

Re: (スコア:0)

Re:ココ好き (スコア:2)

Re: (スコア:0)

Re:ココ好き (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

アルファベットの「a」と「Q」もそっくりだから (スコア:0)

Re:アルファベットの「a」と「Q」もそっくりだから (スコア:1)

Re:アルファベットの「a」と「Q」もそっくりだから (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

ほっとけばいい (スコア:0)

フィッシング詐欺は結構グリフで見分けられる事が多い。 (スコア:0)

Re:フィッシング詐欺は結構グリフで見分けられる事が多い。 (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

yѳur ҭєxҭ lѳѳκs κιnd ѳf lικє ҭЋιs (スコア:0)

Re:yѳur ҭєxҭ lѳѳκs κιnd ѳf lικє ҭЋιs (スコア:2)

Re: (スコア:0)

Unicodeの功罪 (スコア:0)

Re: (スコア:0)

Re:Unicodeの功罪 (スコア:2)

日本HPのPC (スコア:0)

Re:日本HPのPC (スコア:2)