AD (8507) の日記

○ ◎ ●

共通語を目指したHTMLという言語

AD による 2004年03月30日 21時11分 の日記 (#207493)

まあ、HTML 4.01ベースのメモ。

  1. HTMLとは電子文書フォーマットの一つである。
  2. HTMLの記述はマークアップによって行われる。
  3. マークアップとは、文書に潜在的に存在する要素(見出し、段落など)と、HTMLが提供するハイパーテキスト要素(アンカー、リンクなど)を、HTMLのDTDが定める、それぞれの意味に対応した要素記号(タグ)によって明示することである。
  4. HTMLはレイアウト、見栄えを定義できない。
  5. HTML文書は、あるアプリケーションで利用可能な限り、マーク記号によって明示された要素を解釈、要素に即し、ある環境に見合う出力・整形処理が施される。この、「ある特定環境に合わせて出力されるもの」が、いわゆるWebページ・ホームページなるものである。

この程度の内容がわかっていれば、HTMLはおのずとレイアウトではなく文書構造を記述するためのフォーマットであるとわかるはずなのだが(略)、ともかく某所にて久々に談義することになりそうなのでHTMLについての整理。

HTMLの機能のうち、個人的に何が一番感銘を受けたかと言えば、ハイパーテキストの実現もさることながら、下方互換性の考慮であると言わざるを得ない。

過去、SGMLサブセットとして確立を目指しきれていなかった頃のHTMLは、論理要素さえも物理的処理に即したマーク記法が見て取れた。例えば段落の末尾に段落要素であるP要素を置く初期のHTML記法などは、ただの改行処理を考慮した物理的記述だといえる。

それはHTMLの一つの可能性を示していた。すなわち表示制御言語としてのHTMLの可能性である。しかし、それはHTML 3.0の廃案によってHTMLとして相応しくない機能と判断されたことが伺える。

Webがもつ「如何なるマシンから利用されるか限定不可能である」という性質。それに対応しうる「共通語」の必要性。その共通語として考案されたのがHTMLである。(と私は考えている)

Webの共通語として存在するためには、環境に依存せず文書を利用できなくてはならない。さもなくば、Webは本来持ちえる可能性よりも狭く不便なものになる。

環境に依存せず、文書の内容を人間に伝えるためには、出力手段を文書側で限定しないことで可能となる。つまり、HTMLが見栄えを定義しない理由であろう。

利用している環境下で可能な限り文書を再現するという下方互換性の概念。それに関連したレイアウト情報の(HTMLの提供する直接的な機能からの)排除。私は、HTMLの肝とは、ハイパーテキストを実現するフォーマットであることと同時に、Webの共通語を担うべく考慮された下方互換性を意識した仕様ではないかと考える。

最後に小難しく書いたほうの箇条書き

  1. HTMLは、SGML文法に適合するDTDをもったサブセットである。(要するにDTDによって記述法を限定した公用文書フォーマット)
  2. HTML文書は原理的にはSGML文書である。
  3. HTMLの記述はマークアップによって行われる。
  4. マークアップとは、文書に潜在的に存在する要素(見出し、段落など)と、HTMLが提供するハイパーテキスト要素(アンカー、リンクなど)を、HTMLのDTDが定める、それぞれの意味に対応した要素記号(タグ)によって明示することである。
  5. HTMLはレイアウト、見栄えを定義できない。
  6. HTML文書は、あるアプリケーションで利用可能な限り、マーク記号によって明示された要素を解釈、それに即した出力・整形処理が施される。この、「ある特定環境に合わせて出力されるもの」が、いわゆるWebページ・ホームページなるものである。
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー

処理中...