XML -Syntaxregeln
Die Syntaxregeln von XML sind sehr einfach und logisch. Die Regeln sind leicht zu erlernen und einfach anzuwenden.
XML-Dokumente müssen ein Root-Element haben
XML-Dokumente müssen ein Wurzelelement enthalten , das allen anderen Elementen übergeordnet ist:
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
In diesem Beispiel ist <note> das Wurzelelement:
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
Der XML-Prolog
Diese Zeile wird als XML- Prolog bezeichnet :
<?xml version="1.0" encoding="UTF-8"?>
Der XML-Prolog ist optional. Wenn es existiert, muss es im Dokument an erster Stelle stehen.
XML-Dokumente können internationale Zeichen wie das norwegische øæå oder das französische êèé enthalten.
Um Fehler zu vermeiden, sollten Sie die verwendete Kodierung angeben oder Ihre XML-Dateien als UTF-8 speichern.
UTF-8 ist die Standardzeichencodierung für XML-Dokumente.
Die Zeichenkodierung kann in unserem Zeichensatz-Tutorial studiert werden .
UTF-8 ist auch die Standardcodierung für HTML5, CSS, JavaScript, PHP und SQL.
Alle XML-Elemente müssen ein schließendes Tag haben
In XML ist es illegal, das schließende Tag wegzulassen. Alle Elemente müssen ein schließendes Tag haben:
<p>This is a paragraph.</p>
<br />
Hinweis: Der XML-Prolog hat kein schließendes Tag! Dies ist kein Fehler. Der Prolog ist kein Teil des XML-Dokuments.
Bei XML-Tags wird zwischen Groß- und Kleinschreibung unterschieden
Bei XML-Tags wird zwischen Groß- und Kleinschreibung unterschieden. Das Tag <Buchstabe> unterscheidet sich vom Tag <Buchstabe>.
Öffnende und schließende Tags müssen mit demselben Fall geschrieben werden:
<message>This is correct</message>
"Öffnende und schließende Tags" werden oft als "Start- und End-Tags" bezeichnet. Verwenden Sie, was Sie bevorzugen. Es ist genau dasselbe.
XML-Elemente müssen ordnungsgemäß verschachtelt sein
In HTML sehen Sie möglicherweise falsch verschachtelte Elemente:
<b><i>This text is bold and italic</b></i>
In XML müssen alle Elemente richtig ineinander verschachtelt sein:
<b><i>This text is bold and italic</i></b>
Im obigen Beispiel bedeutet „richtig verschachtelt“ einfach, dass das <i>-Element innerhalb des <b>-Elements geöffnet wird, es innerhalb des <b>-Elements geschlossen werden muss.
XML-Attributwerte müssen immer in Anführungszeichen gesetzt werden
XML-Elemente können wie in HTML Attribute in Name/Wert-Paaren haben.
In XML müssen die Attributwerte immer in Anführungszeichen gesetzt werden:
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
Entitätsreferenzen
Einige Zeichen haben in XML eine besondere Bedeutung.
Wenn Sie ein Zeichen wie „<“ in ein XML-Element einfügen, wird ein Fehler generiert, da der Parser es als Beginn eines neuen Elements interpretiert.
Dadurch wird ein XML-Fehler generiert:
<message>salary < 1000</message>
Um diesen Fehler zu vermeiden, ersetzen Sie das Zeichen „<“ durch eine Entitätsreferenz :
<message>salary < 1000</message>
Es gibt 5 vordefinierte Entitätsreferenzen in XML:
< | < | less than |
> | > | greater than |
& | & | ampersand |
' | ' | apostrophe |
" | " | quotation mark |
Nur < und & sind in XML streng verboten, aber es ist eine gute Angewohnheit, > durch > sowie.
Kommentare in XML
Die Syntax zum Schreiben von Kommentaren in XML ähnelt der von HTML:
<!-- This is a comment -->
Zwei Bindestriche in der Mitte eines Kommentars sind nicht zulässig:
<!-- This is an invalid -- comment -->
Leerzeichen werden in XML beibehalten
XML schneidet mehrere Leerzeichen nicht ab (HTML schneidet mehrere Leerzeichen zu einem einzigen Leerzeichen ab):
XML: | Hello Tove |
HTML: | Hello Tove |
XML speichert New Line als LF
Windows-Anwendungen speichern eine neue Zeile als: Wagenrücklauf und Zeilenvorschub (CR+LF).
Unix und Mac OSX verwenden LF.
Alte Mac-Systeme verwenden CR.
XML speichert eine neue Zeile als LF.
Wohlgeformtes XML
XML-Dokumente, die den obigen Syntaxregeln entsprechen, werden als "wohlgeformte" XML-Dokumente bezeichnet.