ADの日記: HTMLの文書構造について
日記 by
AD
HTMLの明示する文書構造はXML的な観点でいえば、非常に不完全である。
HTMLは文書構造が自明であることを明示するための要素しか提供していない。つまり、見出しであるH?要素と定義語であるDT要素程度は用意しているが、厳密に大見出し、小見出しの構造範囲、または包括関係を明示することはない。(DIVでユーザが勝手に明示を行うのはありうるが。)
これは自然言語の文書にも当てはまる特徴である。自然言語の文書は暗示的に文書構造・階層構造を持ち合わせている。しかし、包括関係の明示を行うには至らない。それは自明であるから明示を行う必要がない。
HTMLは文書を電子的に再現するメディアであるから、この定義は妥当であると考えられる。HTMLが章節構造を明示するのに不便であるという話もあるが、自然言語でそれらを明示するのには見出しで行われているものである。また、章節構造が暗示的である(空行などで行われる)場合には、それは最小の節としてのP要素の適合範囲であると考えられる。
HTML文書もそうだが、自然言語の文書はそれほど複雑な構造を持っているだろうか。
HTMLの文書構造について More ログイン