Sonntag, 12. Februar 2012


Kolumne

Mittwoch, 15. November 2006 | Kolumne

Naked XML: Totgesagte leben länger

(Link zum Artikel: http://www.entwickler.de/business-technology/kolumnen/032299)
  • Teilen
  • kommentieren
  • empfehlen
  • Bookmark and Share

Martin Szugat

XML ist gescheitert, sagt Tim Berners-Lee, der Vater des Web und von XML, in seinem Blogbeitrag Reinventing HTML.

Wer früher stirbt, ist länger tot
Das war es dann also mit Naked XML – k.o. in der zweiten Runde? Nein, denn XML lebt (siehe Naked XML: Der Klebstoff im Internet), auch wenn Tim Berners-Lee die Devise ausgibt: Zurück in die Zukunft. Zurück zu HTML. Damit wird klar: Er meint XHTML. Und tatsächlich, wer achtet schon darauf, ob ein leeres Element einen Schrägstrich aufweist oder ein Attributwert in Anführungszeichen steht. Das ist HTML. Hauptsache der Browser versteht es und der Besucher kann es lesen. Vielleicht auch Google, Yahoo & Co. noch. Aber bitte sonst niemand. Schon gar nicht so ein böser Webcrawler, der Datenklau betreibt.

Nein, Bedarf an wohlgeformtem XHTML hat im Web keiner. Und er, Sir Berners-Lee, bemerkt: „Die Browser beschweren sich nicht [über nicht-wohlgeformtes HTML]“. Wäre ja auch schön blöd, wenn der Browser Ihnen sagen würde: „Das HTML ist nicht wohlgeformt.“ Als Entwickler mögen Sie das noch verstehen, als Anwender werden Sie sich vielleicht nur fragen: „Wohlgeformt sind die Models auf dem Laufsteg, aber was hat das mit der Webseite zu tun?“

Weiter heißt es in dem Text: „[Die Webseitenbetreiber] ernten die Früchte von wohlgeformten Systemen“. Welche „Früchte“? XHTML mag einigen Screen-Scraping-Programmen das Leben erleichtert haben, doch die Entwickler derartiger Seiten und ihre Kunden haben in keiner Weise davon profitiert. Davon kann auch kein Banner ablenken, der besagt, dass diese Seite XHTML-konform ist:

Das mag als Gimmick für einige Blogs ganz nett sein, doch die großen Websites sind entweder XHTML-konform aus verschiedenen Gründen oder sie sind es nicht und niemanden interessiert es. Um die Frage vorweg zu nehmen, nein, auch diese Seite ist nicht konform.

Zum Scheitern verurteilt
Tim Berners-Lee sieht die Sache mit der XHTML-Konformität freilich anders. Er sieht seinen Versuch, die Leute zu einem Umstieg von HTML nach XML zu bewegen, gescheitert – nur weil nicht gleich das ganze World Wide Web bei seiner Idee „HTML auf Basis von XML“ sofort mitmachte. Deswegen müsse man jetzt HTML weiterentwickeln. Wieso „müsse“?

Lieber Tim, verehrtes W3C,

das Web hat das bereits für Sie getan. Beispiel Microformats. Damit lassen sich HTML-Daten semantisch auszeichnen, beispielsweise als Kontakt:

<div class="contact vcard">
  <div class="fn n">
    <span class="given-name">Max</span>
    <span class="family-name">Mustermann</span>
  </div>
  <div class="adr">
    <span class="street-address">Musterstraße 6</span><br/>
    <span class="postal-code">99999</span>
    <span class="locality">Musterstadt</span><br/>
    <span class="country-name">Germany</span>
  </div>
  <br/>
  <span class="tel">
    <span class="type">phone</span>: <span class="value">+49 123 456789</span>
  </span>
  <br/>
  <span class="tel">
  <span class="type">fax</span>: <span class="value">+49 123 456780</span>
  </span>
  <br/>email: <a class="email" href="mailto:max@musterstadt.de">max@musterstadt.de</a>
</div>

Im Browser sieht die virtuelle Visitenkarte dann folgendermaßen aus:

Max Mustermann
Musterstraße 6
99999 Musterstadt
Germany

phone: +49 123 456789
fax: +49 123 456780
email:

Noch besser sieht es in Firefox mit einer Erweiterung namens Tails aus. Das Plugin erkennt Mikroformate innerhalb von Webseiten, zeigt die Daten in einem gesonderten Fenster an und bietet dank einer Sammlung von zusätzlichen Skripten auch die Option an, die Mikroinhalte in diversen Formaten beziehungsweise an verschiedene Programme zu exportieren.

Durch das Hintertürchen
Der Schlüssel zur Semantik ist das class-Attribut. Es belegt ein Element oder vielmehr seinen Inhalt mit einer Bedeutung. Es sagt, dies ist ein Kontakt, dies ist sein voller Name und dies sind der Vorname und der Nachname. Das erinnert stark an XML und tatsächlich sind Mikroformate XML in HTML. Doch Mikroformate sind im Gegensatz zum reinen XML in erster Linie für den Menschen gemacht. Dann erst kommt die Maschine.

Damit die Maschine es einfach hat, sind Mikroformate in XHTML geschrieben. Und damit hätten wir just in dem Moment, in dem der Vater sein Kind für tot erklärt, eine späte Geburt zu vermelden: Das XHTML-Web ist geboren – ein Anwendungsfall für wohlgeformtes HTML ist gefunden.

Die Anwendungsmöglichkeiten von Mikroformaten sind vielfältig: Per Mausklick Kontakte aus dem Business-Netzwerk ins Adressbuch importieren (Beispiel LinkedIn), Termine aus dem öffentlichen Veranstaltungskalender (Beispiel Upcoming.org) in den Terminplaner eintragen oder per Copy & Paste Informationen zwischen dem Desktop und dem Web austauschen (Beispiel Live Clipboard). All das leisten Mikroformate und XHTML macht dem Browser das Parsen leichter.

Doch ein zwingender Grund für XHTML sind auch die Mikroformate nicht, denn – so sind die Webdesigner eben – nicht alle werden sich an das Gebot halten, Mikroformate in XHTML-Seiten einzubetten. Einige werden auch weiterhin bei ihrem HTML bleiben und so werden die Entwickler von Mikroformat-Anwendungen auch in Zukunft HTML nebst XHTML berücksichtigen müssen.

Es soll so bleiben, wie es ist.
Aber irgendetwas muss sich doch ändern. Ja klar, das sagt auch Tim Berners-Lee: „Der Plan ist, eine komplett neue HTML-Arbeitsgruppe zu gründen. Im Unterschied zur vorherigen soll diese sich um inkrementelle Verbesserungen in HTML und parallel in XHTML kümmern.“ Dann kommen noch einige Anmerkungen zu XForms und HTML-Forms und auch hier wird deutlich: Es ändert sich zwar Organisatorisches, aber substanzielle Änderungen sind nicht vorgesehen. Kurzum, es bleibt, wie es ist.

In diesem Sinne, bis in 14 Tagen.

Ihr Martin Szugat

Martin Szugat ist Autor der XML-Corner im dot.net magazin und Sprecher auf der BASTA und der kommenden webinale. Zusammen mit zwei Kollegen hat er für entwickler-press ein Buch über das Social Web geschrieben. Zudem arbeitet er am Bioinformatik-Institut der LMU München an XML und Web Services-Projekten. Über Feedback und Fragen freut er sich unter Martin.Szugat[at]gmx.net oder in seinem Blog unter www.aboutxml.de.

Kommentare

Folgende Links könnten Sie auch interessieren