Sonntag, 12. Februar 2012


Kolumne

Dienstag, 10. Juli 2007 | Kolumne

Naked XML: Das Semantic Web ist tot! Lange lebe das Semantic Web!

(Link zum Artikel: http://www.entwickler.de/entwicklerde/kolumnen/036868)
  • Teilen
  • kommentieren
  • empfehlen
  • Bookmark and Share


Das Semantic Web gilt vielen als Totgeburt. Die Mehrheit der Webdesigner hat sich nie mit XML als Sprache des semantischen Webs anfreunden können (vgl. Totgesagte leben länger), ganz zu schweigen von RDF, dessen Sinn und Zweck vielen Entwicklern ein Rätsel blieb. Leo Sauermann, Semantic-Web-Forscher und Sprecher auf der vergangenen Webinale, möchte dies ändern und versucht, das Semantic Web über die Hintertür auf die Rechner der Anwender und der Entwickler zu bekommen.

NX: Hallo Leo! Du arbeitest beim Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Kaiserslautern als Doktorand an einem Projekt namens „Nepomuk – The Social Semantic Desktop“. Worum geht es in dem Projekt?
LS: Die Grundidee ist es, Menschen zu ermöglichen ihre Dateien nach ihren eigenen Vorstellungen zu organisieren, und da diese Vorstellungen in den Köpfen der Nutzer meist auf der Ebene von Projekten, Terminen, Personen, Themen oder dem Zeitlichen geordnet sind, sollten die Personal Computer genauso funktionieren. Im Semantic Desktop geht es nun darum, die Technologien des Semantic Web zu verwenden, um diese „semantischen“ Strukturen in den Köpfen der Benutzer auch am Desktop zu etablieren. Ziel ist ein Semantisches Netz, das alle Dateien, Kontakte, Termine und Projekte miteinander verbindet. Das gilt für persönliche Daten genauso wie Informationen aus Groupware und anderen kollaborativen Systemen.  Der Social Semantic Desktop soll die semantische Zusammenarbeit zwischen Personen in diesen Umgebungen ermöglichen. Das Projekt wird von Dr. Ansgar Bernardi am DFKI in Kaiserslautern koordiniert. Es sind 16 Partner beteiligt.

NS: Nachdem es im Web nicht geklappt hat, versucht ihr den Desktop zu "semantisieren"?
LS:  Das ist der Plan: die Desktop-Umgebung ist überschaubar. Dateien, E-Mails und andere Daten kann man relativ gut integrieren. Ein weiterer Vorteil ist, dass die Daten immer um die gleichen Themen kreisen: die Aufgaben des Benutzers. Da greifen die Integrationsalgorithmen ganz gut. Der Unterschied von Semantic Web und Semantic Desktop liegt vor allem in der verringerten Komplexität. Ziel ist es aber, einen Kreislauf zu erzeugen. Information wird aus dem Semantic Web in den Desktop integriert. Der Benutzer profitiert von der integrierten Sicht auf Projekte, Termine, Kontakte etc. Und neue Informationen, die eingegeben werden, landen dann wieder im Semantic Web.Damit füllen wir auch das Semantic Web mit Daten. Das Semantisieren des Webs klappt auch ganz gut. RSS kommt ja aus der Semantic-Web-Ecke und das Web 2.0 kann man sich ja gar nicht mehr ohne Newsfeeds vorstellen.

NX: Was lief falsch im Semantic Web?
LS: Das Falsche am Semantic Web ist, dass es momentan zu wenig benutzt wird. Das liegt vor allem daran, dass momentan die meisten Anwender und Entwickler Wissenschaftler wie ich sind, die nach anderen Gesichtspunkten wirtschaften. Für uns ist es bereits ein Erfolg, bewiesen zu haben, dass die Technologie funktioniert. Es braucht jetzt Firmen, die Produkte machen. Ein weiteres Problem am Semantic Web sind die hohen Ziele: es geht darum die Ideen der künstlichen Intelligenz und von Expertensystemen, Datenbanken, XML, HTML, HTTP und noch mehr zu vereinen. Da jeder seinen Forschungsbereich als den wichtigsten sieht, dauert diese Integration entsprechend lang. Die einfachen Technologien wie RDF und XML sind ein guter Einstieg, aber es gibt zu wenige Tutorials, wie man denn nun RDF als zusätzliche Ausgabe neben HTML veröffentlicht.

Im Endeffekt werden alle Web-2.0-Dienste in etwa ein bis zwei Jahren genau das Problem haben, das das Semantic Web seit 1999 löst, nämlich die Frage, wie ich Daten von einem Dienst, etwa Flickr, mit einem anderen Dienst, etwa Google Maps, integriere, ohne die Programmierschnittstellen bemühen zu müssen. Das Semantic Web bietet hier eine Lösung, in einer cleveren Architektur die vollkommen Web-2.0-kompatibel ist. Viele Dienste sind bereits glücklich mit XML, aber irgendwann werden die Schmerzen größer werden, wenn es darum geht, Daten zu integrieren. Dann wird offensichtlich, dass URIs, XML und RDF ihren Sinn haben. Viele Unternehmen erkennen das jetzt und werben Forscher und andere Experten ab, um Produkte zu entwickeln und Probleme zu lösen. Es ist momentan sehr schwer, Experten für Semantic Web anzuheuern.

NX: Welche Rolle spielt XML auf dem Semantic Desktop?
LS: XML ist eine der Säulen, auf die das Semantic Web aufbaut. Der Kern der ganzen Idee ist es ja, XML, das aus Bäumen besteht, auf Graphen zu beschränken. Im Prinzip heißt das: ich lasse Teile des XML-Baumes weg, um eine einfachere Struktur zu haben. Diese kann ich dann sehr effizient in eine Datenbank speichern und dann viel besser abfragen als man das von XPath oder XQuery gewohnt ist.

NX: Worin liegt der Vorteil von RDF gegenüber XML?
LS: Die SPARQL-Abfragesprache des Semantic Web vereint SQL mit XQuery. Das ist sehr hilfreich, wenn man die Daten am Desktop integrieren will. XML bleibt als Austauschformat, etwa wenn wir Daten aus Microsoft Outlook extrahieren. Danach speichern wir aber in eine RDF-Datenbank. Am Ende kann man Abfragen über lokale und Webdaten in einer Anfrage machen, etwas das mit SQL undenkbar ist. Ich kann etwa meine E-Mails mit Daten aus Wikipedia kombinieren, das über Semapedia als RDF-Daten verfügbar ist. RDF sprengt die Dateigrenzen von XML und öffnet das gesamte Web als Datenbank.

NX: Warum hat sich RDF nicht durchgesetzt?
LS: Die Frage lautet eher: Warum hat sich RDF noch nicht durchgesetzt? Die Antwort liegt zum einen darin begründet, dass bereits überall RDF ist, aber es niemand merkt, zum anderen liegt es daran, dass alle Experten bereits mit Produkten oder Projekten beschäftigt sind und wenig Zeit haben, weitere Programmierer auszubilden. Flickr verwendet einen RDF-Standard des W3C zur Geo-Annotation ihrer Fotos, die erste RSS-Version ist RDF, Creative-Commons-Lizenzen werden mit RDF an Dokumente verknüpft, Adobe verwendet RDF als Metadatenformat für PDF und nennt es dann XMPP. Es fehlen eine gute Dokumentation und Best Practices, aber die kommen gerade. Ein weiteres Problem ist die technische Vielfalt, die einen erschlagen kann. Es gibt nicht eine RDF-Syntax, sondern viele. Es gibt nicht eine Möglichkeit, RDF in Webseiten einzubinden, sondern viele. Es gibt mehrere Ontologiesprachen, mehrere Top-Level-Ontologien und und und. Da müssen wir noch ein wenig warten, bis die sinnvollen Dinge mehr eingesetzt werden.

NX: Wie siehst du die Zukunft von XML?
LS: Viele KMUs, mit denen wir zu tun haben oder mit denen Freunde von mir arbeiten, verwenden noch gar kein XML. Die hängen noch an Mainframes oder COBOL-Applikationen aus den 80er Jahren. Für diese Leute ist es ein Riesenschritt, XML und Web Services einzusetzen. Ich finde XML ganz gut so wie es ist. Der neue XSLT-2.0-Standard bietet einige interessante Möglichkeiten, aber ich denke grundsätzlich ändert sich nichts. Für den Austausch in Web Services ist XML immer noch das Ding der Wahl,  ich sehe da keine Alternative. Wenn es um die Integration geht, braucht man definitiv RDF, nur hier kann man URIs für die Datenintegration verwenden.

NX: Was hältst du vom "Lowercase Semantic Web", also von Microformats, Folksonomy usw.?
LS: Das "Lowercase Semantic Web" ist mal ein Hack, um die Sachen heute zum Laufen zu bekommen. Das ist ganz ok, um eine Demo zu machen, aber es fehlt hier die Kraft einer Standardisierungseinrichtung. Die Ergebnisse sind die gleichen wie beim Semantic Web. Also liebe ich alles, was aus dem Web 2.0 und dem „Lowercase Semantic Web“ kommt von ganzem Herzen. Die Richtung stimmt. Im Endeffekt sind aber vieles Buzzwords und Notlösungen.

NX: Ist das Web 3.0 gleich dem Semantic Web?
LS: Die Frage ist halt, was ist Web 3.0. Das DFKI hat einen Artikel für den Telekom Technology Radar mit diesem Titel geschrieben, und damit haben Professor Dengel und andere den Begriff Semantic Web mit Web 2.0 verbunden. Dann gab es noch den New-York-Times-Artikel, der viel mehr gelesen wurde und in die gleiche Bresche schlägt. Das Problem ist: Web 2.0 ist eine eingetragene Marke von Tim O'Reilly, Semantic Web wird mit  Tim Berners-Lee und dem W3C verbunden. Web 3.0 dagegen ist ein dehnbarer Begriff. Mir persönlich gefällt das [sagt es laut und hebt dabei die Hände; Anm. d. Red.] „Semantic Web 2.0“. Das bringt beides gut zusammen: Web-2.0-Services mit RDF als Datenformat, Semantic Web Services sind so einfach zu benutzen wie Web 2.0.

NX: Ich danke dir für das Gespräch und wünsche dir viel Erfolg mit dem Semantic Desktop!

Leo Sauermann
Leo Sauermann

Leo Sauermann ist wissenschaftlicher Mitarbeiter am Knowledge Management Lab des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI) in Kaiserslautern, wo er an den Projekten EPOS und NEPOMUK arbeitet. In seiner Diplomarbeit "Gnowsis" definierte er den Semantic Desktop. Er ist Mitglied der SWEO Gruppe des W3C, forscht, publiziert regelmäßig und organisiert Workshops.

Martin Szugat
Martin Szugat

Martin Szugat war anfangs begeistert von der Idee des Semantic Web, zwischenzeitlich skeptisch und ist mittlerweile wieder optimistisch – vielleicht klappt es ja mit dem Semantic Web im zweiten Anlauf. Mit der Zukunft des Webs beschäftigt sich der langjährige Fachautor auch in seinen Blogs aboutxml.de und blog.sosokompakt.de.

Kommentare

Folgende Links könnten Sie auch interessieren

  • Enterprise 2.0  [18.04.2008]
    [http://entwickler.de/zonen/portale/psecom,id,102,buch,723,.html]
  • Rapid Application Development with Mozilla  [22.04.2005]
    [http://entwickler.de/zonen/portale/psecom,id,102,buch,361,.html]
  • Practical RDF  [17.03.2005]
    [http://entwickler.de/zonen/portale/psecom,id,102,buch,359,.html]
  • Enterprise 2.0  [21.04.2008]
    [http://entwickler.de/zonen/portale/psecom,id,102,buch,722,.html]
  • Java und XML  [05.04.2006]
    [http://entwickler.de/zonen/portale/psecom,id,102,buch,519,.html]