August 2002 > mehr wissen > XHTML
 
XHTML und HTML
Von Florence Maurice
 
XHTML
HTML ist die Auszeichnungssprache, in der Webseiten geschrieben werden. Was aber bedeutet der neuere Begriff XHTML? XHTML steht für Extensible HyperText Markup Language und ist ein über die Metasprache XML definiertes HTML. Das heißt XHTML entspricht im Gegensatz zu HTML den Vorgaben von XML und wird der Nachfolger von HTML 4.0 sein.

XML selber (Extensible Markup Language) liefert nur Vorgaben, wie Auszeichnungssprachen zu formulieren sind. Weitere über XML definierte Auszeichnungssprachen sind beispielsweise:

  • WML (Wireless Markup Language) zur Erstellung von Internet-Seiten für Handys
  • SVG (Scalable Vector Graphics) zur Beschreibung von zweidimensionalen Vektorgrafiken
  • SMIL (Synchronized Multimedia Integration Language) zur Präsentation von Multimedia-Daten im Internet und noch viele mehr
Aber zurück zu HTML und XHTML. Insgesamt kann man sagen, dass man sich bei XHTML wesentlich strenger an die Vorgaben halten muss. Bei HTML werden Fehler vom Browser, wenn möglich, ignoriert, bei XHTML hingegen wird das Dokument bei Fehlern überhaupt nicht dargestellt.

Die wichtigsten Unterschiede zwischen HTML und XHTML sind Folgende:

XML-Deklaration und Dokumenttypangaben
Zu Beginn eines XHTML-Dokuments steht die XML-Deklaration und danach muss der Dokumenttyp angegeben werden, beispielsweise:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml-strict.dtd">
Ebenso wie auch bei HTML gibt es drei verschiedene Dokumenttypen, neben der eben genannten "strict"-Variante existieren noch "transitional" und "Frameset".

Die XML-Deklaration kann jedoch auch weggelassen werden, was derzeit zu empfehlen ist, da manche Browser das sonst seltsam interpretieren.

Tags in Kleinbuchstaben
In HTML kann man Tags und Attribute sowohl in Groß- als auch in Kleinbuchstaben schreiben, oder sogar beide Schreibungen mischen, z.B. <table> .... </TABLE>. In XHTML müssen hingegen alle Tags und Attribute in Kleinbuchstaben geschrieben werden, d.h. <table> .... </table>.

Kein Tag ohne End-Tag
Zu jedem Tag muss in XHTML das dazugehörige End-Tag stehen. In HTML gibt es einige Fälle, in denen das End-Tag nicht obligatorisch ist wie beispielsweise bei dem Tag zur Kennzeichnung eines Punktes in einer Liste <li>. In XHTML muss hier hingegen das End-Tag stehen, d.h. <li> .... </li>.

Leere Tags
Das Tag zur Kennzeichnung eines Zeilenumbruches heißt in HTML <br> und ist ein leeres Tag. In XHTML müssen solche leeren Tags besonders gekennzeichnet werden: <br />.

Korrekte Schachtelung
Browser sind bei HTML manchmal lax, was die Schachtelung mehrerer Tags ineinander betrifft. So ergeben folgende Tags zur Formatierung eines Textes als kursiv und fett keine Probleme in HTML, obwohl sie überkreuzt sind, <i><b> ......</i></b>. Auch hier ist XHTML strenger und verlangt die korrekte Schachtelung ineinander, d.h. <i><b> ....</b></i>.

Unterstützung bei der Konvertierung
Wenn Sie HTML-Dokumente in wohlgeformte XHTML-Dokumente verwandeln wollen, so können Sie das per Hand machen - oder aber Sie verwenden dazu das überaus praktische Tool "Tidy". Tidy stammt von einem Mitarbeiter des W3-Konsortiums und steht kostenlos zur Verfügung.

Jetzt mag man sich fragen, was für einen Nutzen XHTML gegenüber HTML bringt, wo es doch auf den ersten Blick den Web-Publishern mehr abverlangt. XHTML ist jedoch Teil der XML-Familie, das heißt XHTML ist syntaktisch zu anderen XML-Anwendungen kompatibel und es stehen auch alle XML-Werkzeuge zur Verfügung. Außerdem erlaubt XHTML Erweiterungen durch neue Elemente und Attribute (deswegen heißt es ja auch "Extensible HyperText Markup Language"). Und zu guter Letzt noch ein entscheidender Punkt: In Zukunft werden wohl immer mehr unterschiedliche Geräte zum Surfen im Internet verwendet werden, dies wurde bei der Entwicklung von XHTML berücksichtigt. So wird es möglich sein, Dokumente zu erstellen, die an die verschiedenen Medien angepasst sind.
 

Links

Unterschiede zwischen XHTML und HTML:
http://selfhtml.teamone.de/ html/xhtml/index.htm
Einführung in XML: http://selfhtml.teamone.de/ xml/index.htm

Syntaktischen und semantische Neuerungen von XHTML: XHTML, der Nachfolger von HTML

Das Kommandozeilen-Tool Tidy zur Umwandlung von HTML in XHTML einsetzen - Erste Schritte

W3C (World Wide Web Consortium)
Spezifikation XHTML 1.0 und XHTML 1.1 (englisch): www.w3.org/TR/xhtml1/
www.w3.org/TR/xhtml11/

Deutsche Übersetzungen der Spezifikation
(Achtung, manchmal muss man das englische Original heranziehen, um die deutsche Übersetzung zu verstehen):
www.websitedev.de/xhtml/ xhtml1/
www.8ung.at/w3c-trans-de/ xhtml11/

Autorin
Florence Maurice
Kontakt: florence.maurice@ mediella.de