文字感データベースまだ～? (#849764) | 東大坂村教授、世界最多の漢字フォント無償公開

「東大坂村教授、世界最多の漢字フォント無償公開」記事へのコメント

記事ページを表示すべてのコメント取得

検索65コメント Log In/Create an Account

文字感データベースまだ～? (スコア:3, すばらしい洞察)

by kanou (16482) on 2005年12月15日 13時12分 (#849764) 日記

フォントだけなら外注に出す金があれば簡単に作れるんですけど、
それだけでは使えないんですよね。広い意味でのコード化が絶対に
欠かせないんですよ。

まず、最低限でも同じ文字が重複していない必要があります。
(このルールが無いと「同定」ということが意味を持たない。
少なくとも5年前はこれができてなかった)。次に、ソースから
正しく書き写せている必要がある (当たり前ですが、これを
ちゃんとやるには「どこまで文字の形の揺れを認めるか、どこ
まで変えてデザインしてよいか」というルール、つまりJISで
言う「包摂規準」が必要になります。UCS だって、網羅的じゃ
無いけどこのルール一覧は付属書にある)。次に、どこのソース
から持ってきたか(そうでないと一覧表の文字が正しいのか
正しくないのか、似た文字が入力したい文書に出てきたときに
確認できない)のトレーサビリティ。最後に、検索のための整理
と、既存の文字との異体字関係。これだけできて初めて、テキスト
データベースの基礎となる、使い物になる漢字集合ができる
わけです。TRONはそういう物を作ると10年前から言っているので、
そろそろできたのではないかと一抹の期待をかけているところです。
#できたのならUCSに追加提案をしていただかないと、世の中誰も
#使わないわけですが…。

IRG でさえ、7 万字超えてあまりのゴミの多さに、とうとう
Extension C はやっぱり典拠を必須としようと大転換した
ご時世ですから、質が伴っていないとただの「漢字らしき字形
の山」で終わるのでは?

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

東大坂村教授、世界最多の漢字フォント無償公開 More ログイン

「東大坂村教授、世界最多の漢字フォント無償公開」記事へのコメント

文字感データベースまだ～? (スコア:3, すばらしい洞察)

スラド