パスワードを忘れた? アカウント作成
38674 journal

yasuokaの日記: JW-10とJIS C 6226 2

日記 by yasuoka
パソコンは日本語をどう変えたか』(講談社, 2008年8月)を読んだのだが、文字コード関係の部分は誤りが多くて、正直なところ読むに耐えなかった。たとえばpp.136-137のJIS C 6226 (現JIS X 0208)制定のくだり。

そこで日本工業標準調査会は、漢字も含めた新しい規格の制定に乗り出す。これが「JIS X 0208」、通称「78JIS」で、1978年に制定された。汎用的に日本語を扱うことに成功した富士通のJEF、ワープロ一号機である東芝のJW-10が生まれた背景には、この文字コードの制定があった。78JISには、0201に包摂された数字、ラテン文字、カナ、記号に加え、「第1水準」、「第2水準」の漢字6355文字が収録された。第1水準とは、当用漢字表などを基準に採用された2965字で、いわば「よく使う漢字」。これに対して第2水準は第1水準から漏れた人名用漢字、部首や旧字体の漢字などで構成されていた。

どこから指摘したらいいのやら…。とりあえず、目についたところを挙げていってみよう。

  • JIS C 6226の原案開発作業は、工業技術院が日本情報処理開発センターに委託しておこなったものだ。日本工業標準調査会は、日本情報処理開発センターが1976年3月に完成した原案を、さらに審議しただけであって、みずから規格の制定に乗り出したわけではない。
  • JW-10は、1978年9月の発表時点では、文字コードにCO.-59を使っていた。TOSBAC漢字システム15との間の互換性の問題から、出荷開始時(1979年2月)には文字コードをJIS C 6226準拠としたのだ。そもそもJW-10はJIS C 6226制定以前から開発をおこなっており、「JW-10が生まれた背景」にJIS C 6226の制定があった、などということは有り得ない。
  • 「0201に包摂された数字、ラテン文字、カナ、記号」の「包摂」が何を意味しているのかイマイチ理解できないのだが、少なくとも「"」に関しては、このままの形ではJIS C 6226 (現JIS X 0208)に入っておらず、「“」と「”」に分離しているのは有名な話だ。
  • 1978年1月1日制定のJIS C 6226は、第1水準漢字が2965字、第2水準漢字が3384字なので、漢字の合計は6349字だ。現在は第2水準漢字が6字増えて合計6355字になっているが、制定当初から6355字だったわけではない。
  • 「人名用漢字別表」(昭和26年内閣告示第1号)と「人名用漢字追加表」(昭和51年内閣告示第1号)の人名用漢字は、1978年時点ではJIS C 6226の第1水準漢字に全て含まれていた。第1水準漢字から人名用漢字が漏れてしまうのは、1981年10月1日に戸籍法施行規則が改正されて以後のことだ。

つまるところこの文章は、1978年当時のことを全く調べずにJIS C 6226制定のくだりを書いているのだろう。でも、このあたりのことは『文字符号の歴史 欧米と日本編』(共立出版, 2006年2月)に全て書いておいたので、それをちょっとでも読んでいれば、まず間違いようのない事柄なのだが。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
  • その本、読みました。
    80年代からPCいじってる人間には周知の話ばかりでした。
    専門家に言わせれば、「周知」ではあっても、「事実」ではないのかもしれないけれども、
    巷間流布している話ばかりです。
    この程度の本なら、Google検索するだけでも書けるんじゃないでしょうか。
    • 「YOMIURI PC」での連載をブルーバックスにまとめた本ですから、一般ウケしないとダメ、ってのはわからなくもないんですけどね。でもそれと、細部をちゃんと詰めておく、ってのは別の話で、「6355字」じゃなくて「6349字」にしておくくらい、ちょっと調べればできるはずなんですよ。まあ、ちゃんとウラを取る気が、元々ないんでしょう。
      親コメント
typodupeerror

アレゲはアレゲを呼ぶ -- ある傍観者

読み込み中...