改定常用漢字表 (#1814377) | 国産 CMS のメリットってどんなん? UTF-8 対応はうれしいの?

「国産 CMS のメリットってどんなん? UTF-8 対応はうれしいの?」記事へのコメント

記事ページを表示すべてのコメント取得

検索64コメント Log In/Create an Account

改定常用漢字表 (スコア:3, 興味深い)

by oguma (17986) on 2010年08月24日 13時09分 (#1814377)

　年末にも内閣告示になる予定の改定常用漢字表 [bunka.go.jp]には、JIS X 0208では表現できない字体が含まれていますので、今後のことを考えればUTF-8（+Extension B）への対応は必須ではないでしょうかね。
参考：
新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 [nikkeibp.co.jp]

--
Nullius addictus iurare in verba magistri
- Re:改定常用漢字表 (スコア:4, おもしろおかしい)
  
  by Anonymous Coward on 2010年08月24日 13時18分 (#1814383)
  
  また頓珍漢な事を。
  UTF8は日本語と中国語の判別もできない欠陥コードです。
  
  なんて言って周囲を興ざめさせるやつが出てこないか心配です。
  ま、UTF8対応は常識になってくるんでしょうね。
  中国語と日本語の区別がつかないことがあるなんて、ほとんどの人には
  どうでもいい気がする。
  
  シェア
  
  親コメント
  - Re:改定常用漢字表 (スコア:2, おもしろおかしい)
    
    by vn (10720) on 2010年08月24日 20時39分 (#1814636) 日記
    
    また頓珍漢な事を。
    UTF8は日本語と中国語の判別もできない欠陥コードです。
    それを書くならＵＴＦ−８って書かなくちゃ。
    
    シェア
    
    親コメント
  - Re:改定常用漢字表 (スコア:2)
    
    by fcp (32783) on 2010年08月25日 3時25分 (#1814820) ホームページ日記
    中国語と日本語の区別がつかないことがあるなんて、ほとんどの人には
    どうでもいい気がする。
    
    文字集合や符号化方式で区別する (「charset=SHIFT_JIS ってことはきっと日本語だな」など)
    文字で区別する (「平仮名が多く含まれているから日本語だろう」「CJKV 包摂を廃止するべきだ!」「ついでに英語の A とフランス語の A も違う文字にするべきだ!」など)
    テキストより上のレイヤーで区別する (「<html lang="ja"> と書いてあるから日本語」など)
    と、言語を区別する方法にもいろいろあるわけで、どの方式を採用するかは確かにほとんどの人にはどうでも良いですが、何らかの方法では区別できるようにしておかないと困るように思います。
    シェア
    
    親コメント
  - Re:改定常用漢字表 (スコア:1)
    
    by nim (10479) on 2010年08月24日 13時48分 (#1814405)
    
    言語と文字セットは別の概念ですから、別に定義するのが妥当な考え方ですよね。
    XHTML だと、xml:lang は、様々な要素にセットできますから、
    Content-type: text/xml; charset=UTF-8
    で XHTML を返して、要素ごとに日本語か中国語かを入れていけば一番よいのでは？
    # ところで、漢文はどっちとして扱うのでしょうか？
    
    シェア
    
    親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      簡体字か繁体字か日本の漢字かで判断するしかないですね。
      「骨」とか一見似ていて、日中でちょっと違うとかいう漢字があると、
      混乱します。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        ＞「骨」とか一見似ていて、日中でちょっと違うとかいう漢字
        
        一瞬、夜は同じなのかと思った。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    その前に、ラテン語の文字と英語の文字を区別できる画期的なコードセットを……
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    > UTF8は日本語と中国語の判別もできない欠陥コードです。
    じゃあ中国語を判別とか以前に書くことすらできないガラパゴスコードなんて欠陥とか論評する以前の論外コードですね。
  - - Re: (スコア:0)
      
      by Anonymous Coward
      
      ASCII TeXって知ってる？
- Re:改定常用漢字表 (スコア:1, すばらしい洞察)
  
  by Anonymous Coward on 2010年08月24日 21時23分 (#1814657)
  
  年末にも内閣告示になる予定の改定常用漢字表には、JIS X 0208では表現できない字体が含まれていますので
  例示字形が違うだけで、JIS X0208 では包摂されてるんだから、表現できないわけじゃないでしょ。
  字形が違うのはフォントの問題であって文字集合の問題ではないし。
  
  シェア
  
  親コメント
  - Re:改定常用漢字表 (スコア:2)
    
    by oguma (17986) on 2010年08月25日 10時03分 (#1814858)
    
    例示字形が違うだけで、JIS X0208 では包摂されてるんだから、表現できないわけじゃないでしょ。
    
    　ご指摘のとおりです。
    　「JIS X 0213:2004で包摂分離された字体」、と書かなければいけませんでした。
    　ただ、PC用OSではJIS X 0213:2004への対応が進んでいますので、UTF-8サポートは望ましいと思います。
    
    --
    Nullius addictus iurare in verba magistri
    
    シェア
    
    親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    > 字形が違うのはフォントの問題であって文字集合の問題ではないし。
    JIS X 0208ではそのとおりですが、Unicodeだとコードポイントの変更やらサロゲートペアや4バイトUTF-8への対応やら大騒ぎになるので(つまり常用漢字表ではデザインの違いということになっているものを分離している文字集合の問題)、むしろ日本語を表現する文字集合としてはJIS X 0208のほうが優れているとさえ言えそうです。唯一の問題はガラパゴスなことくらいですが、これは日本語環境に特化して進化たことで得られるメリットと二律背反なのですから仕方ありません、と日本人なら考えそうですね。たとえば分離されていないほうが都合がいいなんてのはまさに日本の都合です。
    一方中国や韓国は自国の都合を国際規格にねじ込んだ(ハングル大移動とか、例を挙げるまでもありませんよね)。
    - Re:改定常用漢字表 (スコア:2)
      
      by fcp (32783) on 2010年08月25日 3時13分 (#1814818) ホームページ日記
      
      サロゲートペアや4バイトUTF-8への対応やら
      
      どちらも Unicode 文字集合の問題ではありません。サロゲートペアに至ってはただの仕様であって「問題」ですらないような。
      
      シェア
      
      親コメント
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        JIS X 0208なら何もしないで済むはずだったところに対応が発生するのが問題です。
        「サロゲートペアや4バイトUTF-8への対応やら」は具体例を挙げないとどんな対応が必要なのか理解できない馬鹿向けに挙げただけです。
        
        Re:改定常用漢字表 (スコア:2)
        
        by fcp (32783) on 2010年08月26日 23時28分 (#1816060) ホームページ日記
        
        UTF-8 や UTF-16 といった符号化方式にそれぞれ対応の面倒臭そうな点があるのは事実ですが、それとあなたがおっしゃる「常用漢字表ではデザインの違いということになっているものを分離している文字集合の問題」とは全然関係ありません。
        
        シェア
        
        親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  > JIS X 0208では表現できない字体
  嘘ばっかり。ま、JIS X 0208の「TRONによる実装」で表現できないのは確かですし、Unicodeと相互運用性を考慮した実装でも事実上表現をあきらめざるを得ませんから今のご時世では「表現できない」と言っても近似的にはそれほど間違ってないかもしれませんが、事実でないことに変わりはありません。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

国産 CMS のメリットってどんなん? UTF-8 対応はうれしいの? More ログイン

「国産 CMS のメリットってどんなん? UTF-8 対応はうれしいの?」記事へのコメント

改定常用漢字表 (スコア:3, 興味深い)

Re:改定常用漢字表 (スコア:4, おもしろおかしい)

Re:改定常用漢字表 (スコア:2, おもしろおかしい)

Re:改定常用漢字表 (スコア:2)

Re:改定常用漢字表 (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:改定常用漢字表 (スコア:1, すばらしい洞察)

Re:改定常用漢字表 (スコア:2)

Re: (スコア:0)

Re:改定常用漢字表 (スコア:2)

Re: (スコア:0)

Re:改定常用漢字表 (スコア:2)

Re: (スコア:0)

スラド