パスワードを忘れた? アカウント作成
623310 journal

ADの日記: HTMLの文書構造について

日記 by AD

HTMLの明示する文書構造はXML的な観点でいえば、非常に不完全である。

HTMLは文書構造が自明であることを明示するための要素しか提供していない。つまり、見出しであるH?要素と定義語であるDT要素程度は用意しているが、厳密に大見出し、小見出しの構造範囲、または包括関係を明示することはない。(DIVでユーザが勝手に明示を行うのはありうるが。)

これは自然言語の文書にも当てはまる特徴である。自然言語の文書は暗示的に文書構造・階層構造を持ち合わせている。しかし、包括関係の明示を行うには至らない。それは自明であるから明示を行う必要がない。

HTMLは文書を電子的に再現するメディアであるから、この定義は妥当であると考えられる。HTMLが章節構造を明示するのに不便であるという話もあるが、自然言語でそれらを明示するのには見出しで行われているものである。また、章節構造が暗示的である(空行などで行われる)場合には、それは最小の節としてのP要素の適合範囲であると考えられる。

HTML文書もそうだが、自然言語の文書はそれほど複雑な構造を持っているだろうか。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

あと、僕は馬鹿なことをするのは嫌いですよ (わざとやるとき以外は)。-- Larry Wall

読み込み中...