まだ直します、JIS漢字 48
ストーリー by Oliver
どうなる日本語 部門より
どうなる日本語 部門より
名前を書き忘れたのでAC扱いな誰か曰く、"財団法人 日本規格協会符号化文字集合調査研究委員会は15日、JIS X 0213 改正原案の公開レビュー資料を公開した。意見の提出期限は2月15日。
今回の改正は表外漢字字体表への対応がメイン。このため、X 0213のうち168字の例示字体を変更することを予定している。変更はそれまでの包摂の範囲内である。83JISより遙かにマイルドで「非互換」とも言えない変更とは言え、彼の団体がコードポイントの増加だけで対処しなかったことについて、私はかなり複雑な気分である。"
規格としてはまったく変化がないはず (スコア:2, 参考になる)
ただ、いくら例示にすぎないといっても、規格票を読んだりフォントを作ったりする人は、その例示字体を参考にすることが多いので、実際に世に出てくる製品は例示字体に似た字体を実装しているものが多くなります。ですので、例示字体にどんな文字をもってくるかが問題にされます。
Re:規格としてはまったく変化がないはず (スコア:1, 参考になる)
UCS互換漢字10文字の追加もありますのでお忘れなく。
これに関しては、第一次規格に適合したフォントに文字を 追加するだけでなく、既存の部分の字体設計を変更する 必要がある場合もある、非互換な変更です。例えば、 クワクチヤウ ワタナベ和田研明朝 [asahi-net.or.jp]は、既存のグリフ 6 文字分を追加された 位置に移動しなければなりません。
# 過去に正体がバレているので AC
Re:規格としてはまったく変化がないはず (スコア:1, 参考になる)
ただし、互換性が失われる、というのについては、ほんとうに そうなんでしょうか? 既存のコードポイントについては、包摂規準の変更も 行わないような印象を受けました。
つまり、従来の字体を「A」、「字体表」の字体を「B」とするなら、
「クワクチヤウワタナベ」 (たぶん、従来のコードポイントに「B」の字体を実装してあるのだと想像します) は、そのような方針で実装すればよい (してもよい) と思います。
Re:規格としてはまったく変化がないはず (スコア:1, 参考になる)
なりません。3-1)0213-pdam1.pdf の 3 ページ目をご覧ください。 包摂規準の適用範囲を狭める改定を盛り込んでいます。
互換性という観点からは既存のコードポイントを二つに割るなら 2 個付け加えるべきでしょうけど、重複符号化になります (「B」 を入力するときに、どちらのコードポイントを使えばいいか 分からない) ので、一般使用される符号化文字集合ではそういう 処理は行わないと思います。
結局、移行コストは規格の技術的内容を正確に理解したうえで 積極的に対処していたユーザにかかるわけですが、やむを得ない でしょう。
Re:規格としてはまったく変化がないはず (スコア:0)
これだと、もとの漢字の包摂規準は変更しないという意味になりませんか?
Re:規格としてはまったく変化がないはず (スコア:0)
例示がマズいんですな。
Re:規格としてはまったく変化がないはず (スコア:0)
> 例示がマズいんですな。
そうとも言い切れない。
その辞書が実地調査を一切していなければ、例示が正しくて辞書が間違い。
Re:規格としてはまったく変化がないはず (スコア:0)
ESC $ ( O → ESC $ ( Q など。
参考リンク (スコア:2, 参考になる)
Re:参考リンク (スコア:1)
そうだとしたら、ちょっと残念。
客観性に欠けるんだよね (スコア:0)
緊急リンク (スコア:0)
法務省が人名漢字表を大幅に増やす予定だそうです。 (\\ 朝日 [asahi.com]/ZAKZAK [zakzak.co.jp]/日経 [nikkei.co.jp])
表外漢字字体表の「表外」とは「常用漢字表+人名用漢字別表(その後の追加を含む)ですから、それに伴って多くの文字は「表内字」になってしまうわけ
コードポイントの増加 (スコア:1, 興味深い)
懸念が当たったというか… (スコア:1)
Re:懸念が当たったというか… (スコア:1, 参考になる)
Re:懸念が当たったというか… (スコア:1)
しょうがあるまい (スコア:0)
X0213:2000開発の終期は完全に「Unicodeへの提案作業」だったもの。
Re:懸念が当たったというか… (スコア:0)
その報告書 [jsa.or.jp]の20ページには
(太字は原文ママ) として、下に一覧表まで挙げられています。今回決まったのは面区点位置だけ。ちなみに、この「JIS
Re:懸念が当たったというか… (スコア:0)
# 本当に愚行かも知れないのでAC
TRONプロジェクトは (スコア:0)
JIS規格表がJISコード自身で記述できないことをやり玉に挙げるぐらいだったら、
両者はちゃんと丸飲みするべきだと思うんですがねぇ。:-p
#そして…………という罠。
Re:TRONプロジェクトは (スコア:0)
1. 新字体を完全に無視する
2. 新字体で他にない字体をGTかどこかに追加する
現状でもJIS X 0208-1983は入っているけどJIS78は入ってないし
今回の変更点では実際の使用現場で新旧どちらの意図で使用して
いるかを識別することが事実上不可能なことを考えると丸呑みを
してもメリットはないと思う。
Re:TRONプロジェクトは (スコア:0)
たとえば、a1、a2、a3という漢字(字体)があって、それらはすべて同一の漢字の別字体だとみなすことも可能な場合、
ようするに丸飲みって言うことで (スコア:0)
世の中に流通しているコードセットをまるまる最初から最後まで丸飲みするわけです。
包摂云々は考えないんですよ。だから同じ字形があちこちにあるわけです。
とんでもないと思いません??
たとえばBTRONなんかはファイルシステムレベルでTRONコードですから、
ファイル名(実身名と言いますが)を指定するときに、同じ字を指定した
Re:ようするに丸飲みって言うことで (スコア:1)
第一、現行の超漢字(B-right/V R4.X)では第一第二水準以上の
単語登録がされていないから、自分で文字選んで入力する以上、
文字コードがあっちいったりこっちいったりってのは無いでしょう。
>システムは同じ文字と認識してくれないなんて言うことが起こりうるんですよ。
そこら辺も流石にわかってはいるから、異体字揺らぎ検索 [chokanji.com]って
機能もある訳だし、この機能を強化していくしかないでしょ。
こういった機能があるのにそう書くのは、ちょっと乱暴すぎない?
第一どんな文字コードを使おうと、ちゃんとした入力ツールと
漢字校正機能が無いと話にならないでしょうに。
異体字揺らぎ検索 (スコア:0)
つまり、現行の超漢字は機能不足で、超漢字の利点を十分に生かしきっていないということではないでしょうか。でもたぶん TRON や超漢字の目標としては、すべての漢字を自由に使えるシステムだと思います。で、問題となっているのは、その目標というか理想像そのものが持っている問題点です。
Re:異体字揺らぎ検索 (スコア:0)
禿同.ASCII だとハイフンとマイナスの区別が付かないのがうれしいんだよね.是非 1 と I と l と | の区別が付かないコードを ISO に提案してください.おながいします
Re:ようするに丸飲みって言うことで (スコア:0)
包摂規準が異なる集合を複合する過程でまた包摂するってのは禁じ手ですけど? 0.45 を 2 回四捨五入して 1.00 にしちゃいけないのと同じ.
その過ちを犯しちゃったのが Unicode で,あなたはその轍を TRON も踏めと言うの?
Re:ようするに丸飲みって言うことで (スコア:0)
Re:ようするに丸飲みって言うことで (スコア:0)
文字コードは文字を扱うべき。
TRONコードは文字とグリフをはき違えてる。
Re:ようするに丸飲みって言うことで (スコア:0)
>TRONコードは文字とグリフをはき違えてる
「TRONコード=文字コード」を主張するのね。
ほほぅ
Re:ようするに丸飲みって言うことで (スコア:0)
1文字=1コードとして扱ったら都合の悪い地域ばっかじゃねーか。
Re:ようするに丸飲みって言うことで (スコア:0)
現状,TRON コードは「グリフにコードを振ってる」と(声は小さいですけど)明言してますし,こけらとかきが包摂されてるような文字コードなんぞ屑ですけど何か?
Re:ようするに丸飲みって言うことで (スコア:0)
他のアプローチもあるんですけどぉ。
言わないけどね。ふふふ。
Re:ようするに丸飲みって言うことで (スコア:0)
そのアプローチは本当にTRONのアプローチなの?
#どうも、TRONでない全く別の何かをTRONと定義して批判する人が多いようなので確認。
Re:ようするに丸飲みって言うことで (スコア:0)
>#どうも、TRONでない全く別の何かをTRONと定義して批判する人
TRONのアプローチを知らない人間に、「TRONでない全く別の何かをTRONと定義して批判する……」
なんていう言い方をされる筋合はないな。
大丈夫か?おい?
Re:TRONプロジェクトは (スコア:0)
UCS変更の影響は? (スコア:0)
俺なんかは、字体の変更よりも、UCS変更のが影響でかいだろう とか思ってしまうんだが、そのへんはどうなんだろう?
208 の範囲は入ってないのかな?(まだどの部分が変更に なるかチェックせずにに言ってる)もしそうなら 213 に 対応してるような環境はほとんど無いだろうから 影響は少ないか。仮にMSやAppleがJISX213 が出た時に さっくり対応してたら今回のは大変なことになってたかもね。
Re:UCS変更の影響は? (スコア:0)
初期のユニコードで208/212と中・台コードと統合されていたコードポイントに対し、最近中・台が日本の字体を別コードポイントに登録してきた分について、どのように処理するかの方針についての情報は聞こえてこない。
どうするんだろうね。
Re:UCS変更の影響は? (スコア:0)
# TRON コードのできがいいとは思わないが Unicode よりはまし。
Re:UCS変更の影響は? (スコア:0)
Re:UCS変更の影響は? (スコア:0)
詳細知りたいので、ソースきぼんぬ。
Re:UCS変更の影響は? (スコア:1, 参考になる)
当方が知ったのは漢字文献情報処理研究 [jaet.gr.jp]第2号のpp138から。事情は文献中に明示されていませんが、多分#236282 [srad.jp]さんの話が当たらずとも遠からず、なのでしょう。
Re:UCS変更の影響は? (スコア:0)
どちらにせよ、それはそのままだと ISO 10646 自身の包摂規準に違反するので、例外規定とかが設けられるのでしょうか? (でも、たとえば Unicode 1.0 の時代から存在する KS X 1001 互換
Re:UCS変更の影響は? (スコア:0)
あれはCJK Compatibility Ideographsブロックですから、
当然、互換性のためにしか使ってはいけません。
Re:UCS変更の影響は? (スコア:0)
変更されている文字はUCSへ登録申請中で JIS X 0213:2000では未確定だった文字みたいですね。
正直、 (スコア:0)
個人的には、「えーまた追加するの~」って感じだけど。
# JIS X0213のフリーフォント製作者のみなさまに感謝&表敬