ADの日記: 共通語を目指したHTMLという言語 3
まあ、HTML 4.01ベースのメモ。
- HTMLとは電子文書フォーマットの一つである。
- HTMLの記述はマークアップによって行われる。
- マークアップとは、文書に潜在的に存在する要素(見出し、段落など)と、HTMLが提供するハイパーテキスト要素(アンカー、リンクなど)を、HTMLのDTDが定める、それぞれの意味に対応した要素記号(タグ)によって明示することである。
- HTMLはレイアウト、見栄えを定義できない。
- HTML文書は、あるアプリケーションで利用可能な限り、マーク記号によって明示された要素を解釈、要素に即し、ある環境に見合う出力・整形処理が施される。この、「ある特定環境に合わせて出力されるもの」が、いわゆるWebページ・ホームページなるものである。
この程度の内容がわかっていれば、HTMLはおのずとレイアウトではなく文書構造を記述するためのフォーマットであるとわかるはずなのだが(略)、ともかく某所にて久々に談義することになりそうなのでHTMLについての整理。
HTMLの機能のうち、個人的に何が一番感銘を受けたかと言えば、ハイパーテキストの実現もさることながら、下方互換性の考慮であると言わざるを得ない。
過去、SGMLサブセットとして確立を目指しきれていなかった頃のHTMLは、論理要素さえも物理的処理に即したマーク記法が見て取れた。例えば段落の末尾に段落要素であるP要素を置く初期のHTML記法などは、ただの改行処理を考慮した物理的記述だといえる。
それはHTMLの一つの可能性を示していた。すなわち表示制御言語としてのHTMLの可能性である。しかし、それはHTML 3.0の廃案によってHTMLとして相応しくない機能と判断されたことが伺える。
Webがもつ「如何なるマシンから利用されるか限定不可能である」という性質。それに対応しうる「共通語」の必要性。その共通語として考案されたのがHTMLである。(と私は考えている)
Webの共通語として存在するためには、環境に依存せず文書を利用できなくてはならない。さもなくば、Webは本来持ちえる可能性よりも狭く不便なものになる。
環境に依存せず、文書の内容を人間に伝えるためには、出力手段を文書側で限定しないことで可能となる。つまり、HTMLが見栄えを定義しない理由であろう。
利用している環境下で可能な限り文書を再現するという下方互換性の概念。それに関連したレイアウト情報の(HTMLの提供する直接的な機能からの)排除。私は、HTMLの肝とは、ハイパーテキストを実現するフォーマットであることと同時に、Webの共通語を担うべく考慮された下方互換性を意識した仕様ではないかと考える。
最後に小難しく書いたほうの箇条書き
- HTMLは、SGML文法に適合するDTDをもったサブセットである。(要するにDTDによって記述法を限定した公用文書フォーマット)
- HTML文書は原理的にはSGML文書である。
- HTMLの記述はマークアップによって行われる。
- マークアップとは、文書に潜在的に存在する要素(見出し、段落など)と、HTMLが提供するハイパーテキスト要素(アンカー、リンクなど)を、HTMLのDTDが定める、それぞれの意味に対応した要素記号(タグ)によって明示することである。
- HTMLはレイアウト、見栄えを定義できない。
- HTML文書は、あるアプリケーションで利用可能な限り、マーク記号によって明示された要素を解釈、それに即した出力・整形処理が施される。この、「ある特定環境に合わせて出力されるもの」が、いわゆるWebページ・ホームページなるものである。
人に話するなら、、、 (スコア:1)
またはXSL [w3.org]の話も入れといて下さいな。
#CSSとかXSLの中身を話すかどうかは別として。
Re:人に話するなら、、、 (スコア:1)
あとXHTMLは個人的にはあまり好きではありません(ぇ。理由はXML的な機能を必要としない場合はXHTMLには大した利点が存在しないからです。むしろHTML 4.01やISO-HTMLの方が互換性が高い。データ弄くる必要がない文書に、XMLを用いる必要性とか私にはわかりません。
わざわざ必要もない定義を作る人もいますし…w
--労使曰く、ひとごとを尽くして神頼み--
Re:人に話するなら、、、 (スコア:1)
でも、DSSSLを話すんですか?某Nの人かな?
openjadeの更新も止まっているし、もう死んでいるとばかり思っていたのですが、歴史
的にはまだ意味がありますかね。
#それでも、今現在FreeBSDの文書システムの片隅に.dslなファイルがあったりします。
#複雑な心境。
ごく一部の人には、もう人物が特定できそうなのでこのあたりで。
#XHTMLは「これで一挙にウェブをXML化!」という理想が破れた以上、中途半端と
#言われても仕方がない気もしますね。