DTD - XML-Bausteine
Die Hauptbausteine von XML- und HTML-Dokumenten sind Elemente.
Die Bausteine von XML-Dokumenten
Aus DTD-Sicht bestehen alle XML-Dokumente aus folgenden Bausteinen:
- Elemente
- Attribute
- Entitäten
- PCDATEN
- CDATA
Elemente
Elemente sind die Hauptbausteine von XML- und HTML-Dokumenten.
Beispiele für HTML-Elemente sind „body“ und „table“. Beispiele für XML-Elemente könnten „note“ und „message“ sein. Elemente können Text oder andere Elemente enthalten oder leer sein. Beispiele für leere HTML-Elemente sind „hr“, „br“ und „img“.
Beispiele:
<body>some text</body>
<message>some text</message>
Attribute
Attribute liefern zusätzliche Informationen über Elemente .
Attribute werden immer innerhalb des öffnenden Tags eines Elements platziert. Attribute kommen immer in Name/Wert-Paaren vor. Das folgende „img“-Element enthält zusätzliche Informationen zu einer Quelldatei:
<img src="computer.gif" />
Der Name des Elements ist "img". Der Name des Attributs ist "src". Der Wert des Attributs ist "computer.gif". Da das Element selbst leer ist, wird es mit einem „/“ abgeschlossen.
Entitäten
Einige Zeichen haben in XML eine besondere Bedeutung, wie das Kleiner-als-Zeichen (<), das den Anfang eines XML-Tags definiert.
Die meisten von Ihnen kennen die HTML-Entität: " ". Diese „No-Breaking-Space“-Entität wird in HTML verwendet, um ein zusätzliches Leerzeichen in ein Dokument einzufügen. Entitäten werden erweitert, wenn ein Dokument von einem XML-Parser analysiert wird.
Die folgenden Entitäten sind in XML vordefiniert:
Entity References | Character |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATEN
PCDATA bedeutet geparste Zeichendaten.
Stellen Sie sich Zeichendaten als den Text vor, der sich zwischen dem Start-Tag und dem End-Tag eines XML-Elements befindet.
PCDATA ist Text, der von einem Parser analysiert wird . Der Text wird vom Parser auf Entities und Markup untersucht .
Tags innerhalb des Textes werden als Markup behandelt und Entitäten werden erweitert.
Geparste Zeichendaten sollten jedoch keine &-, <- oder >-Zeichen enthalten; diese müssen durch die & < und > Entitäten bzw.
CDATA
CDATA bedeutet Zeichendaten.
CDATA ist Text, der NICHT von einem Parser geparst wird . Tags innerhalb des Textes werden NICHT als Markup behandelt und Entitäten werden nicht erweitert.