Dienstag, 10. Juli 2007 |
Kolumne
Das Semantic Web gilt vielen als Totgeburt. Die Mehrheit der
Webdesigner hat sich nie mit XML als Sprache des semantischen Webs
anfreunden können (vgl.
Totgesagte leben länger),
ganz zu schweigen von RDF, dessen Sinn und Zweck vielen Entwicklern ein
Rätsel blieb. Leo Sauermann, Semantic-Web-Forscher und Sprecher
auf der vergangenen
Webinale,
möchte dies ändern und versucht, das Semantic Web über
die Hintertür auf die Rechner der Anwender und der Entwickler zu
bekommen.
NX:
Hallo Leo! Du arbeitest beim Deutschen Forschungszentrum für
Künstliche Intelligenz (DFKI) in Kaiserslautern als Doktorand an
einem Projekt namens „Nepomuk – The Social Semantic
Desktop“. Worum geht es in dem Projekt?
LS: Die Grundidee ist es,
Menschen zu ermöglichen ihre Dateien nach ihren eigenen
Vorstellungen zu organisieren, und da diese Vorstellungen in den
Köpfen der Nutzer meist auf der Ebene von Projekten, Terminen,
Personen, Themen oder dem Zeitlichen geordnet sind, sollten die
Personal Computer genauso funktionieren. Im Semantic Desktop geht es
nun darum, die Technologien des Semantic Web zu verwenden, um diese
„semantischen“ Strukturen in den Köpfen der Benutzer
auch am Desktop zu etablieren. Ziel ist ein Semantisches Netz, das alle
Dateien, Kontakte, Termine und Projekte miteinander verbindet. Das gilt
für persönliche Daten genauso wie Informationen aus Groupware
und anderen kollaborativen Systemen. Der Social Semantic Desktop
soll die semantische Zusammenarbeit zwischen Personen in diesen
Umgebungen ermöglichen. Das Projekt wird von Dr. Ansgar Bernardi
am DFKI in Kaiserslautern koordiniert. Es sind 16 Partner beteiligt.
NS: Nachdem es im Web nicht geklappt hat,
versucht ihr den Desktop zu "semantisieren"?
LS: Das ist der Plan:
die Desktop-Umgebung ist überschaubar. Dateien, E-Mails und andere
Daten kann man relativ gut integrieren. Ein weiterer Vorteil ist, dass
die Daten immer um die gleichen Themen kreisen: die Aufgaben des
Benutzers. Da greifen die Integrationsalgorithmen ganz gut. Der
Unterschied von Semantic Web und Semantic Desktop liegt vor allem in
der verringerten Komplexität. Ziel ist es aber, einen Kreislauf zu
erzeugen. Information wird aus dem Semantic Web in den Desktop
integriert. Der Benutzer profitiert von der integrierten Sicht auf
Projekte, Termine, Kontakte etc. Und neue Informationen, die
eingegeben werden, landen dann wieder im Semantic Web.Damit füllen
wir auch das Semantic Web mit Daten. Das Semantisieren des Webs klappt
auch ganz gut. RSS kommt ja aus der Semantic-Web-Ecke und das Web 2.0
kann man sich ja gar nicht mehr ohne Newsfeeds vorstellen.
NX: Was
lief falsch im Semantic Web?
LS: Das Falsche am Semantic
Web ist, dass es momentan zu wenig benutzt wird. Das liegt vor allem
daran, dass momentan die meisten Anwender und Entwickler
Wissenschaftler wie ich sind, die nach anderen Gesichtspunkten
wirtschaften. Für uns ist es bereits ein Erfolg, bewiesen zu
haben, dass die Technologie funktioniert. Es braucht jetzt Firmen, die
Produkte machen. Ein weiteres Problem am Semantic Web sind die hohen
Ziele: es geht darum die Ideen der künstlichen Intelligenz und von
Expertensystemen, Datenbanken, XML, HTML, HTTP und noch mehr zu
vereinen. Da jeder seinen Forschungsbereich als den wichtigsten sieht,
dauert diese Integration entsprechend lang. Die einfachen Technologien
wie RDF und XML sind ein guter Einstieg, aber es gibt zu wenige
Tutorials, wie man denn nun RDF als zusätzliche Ausgabe neben HTML
veröffentlicht.
Im Endeffekt werden alle Web-2.0-Dienste in etwa ein bis zwei Jahren
genau das Problem haben, das das Semantic Web seit 1999 löst,
nämlich die Frage, wie ich Daten von einem Dienst, etwa Flickr,
mit einem anderen Dienst, etwa Google Maps, integriere, ohne die
Programmierschnittstellen bemühen zu müssen. Das Semantic Web
bietet hier eine Lösung, in einer cleveren Architektur die
vollkommen Web-2.0-kompatibel ist. Viele Dienste sind bereits
glücklich mit XML, aber irgendwann werden die Schmerzen
größer werden, wenn es darum geht, Daten zu integrieren.
Dann wird offensichtlich, dass URIs, XML und RDF ihren Sinn haben.
Viele Unternehmen erkennen das jetzt und werben Forscher und andere
Experten ab, um Produkte zu entwickeln und Probleme zu lösen. Es
ist momentan sehr schwer, Experten für Semantic Web anzuheuern.
NX: Welche
Rolle spielt XML auf dem Semantic Desktop?
LS: XML ist eine der
Säulen, auf die das Semantic Web aufbaut. Der Kern der ganzen Idee
ist es ja, XML, das aus Bäumen besteht, auf Graphen zu
beschränken. Im Prinzip heißt das: ich lasse Teile des
XML-Baumes weg, um eine einfachere Struktur zu haben. Diese kann ich
dann sehr effizient in eine Datenbank speichern und dann viel besser
abfragen als man das von XPath oder XQuery gewohnt ist.
NX:
Worin liegt der Vorteil von RDF gegenüber XML?
LS: Die SPARQL-Abfragesprache
des Semantic Web vereint SQL mit XQuery. Das ist sehr hilfreich, wenn
man die Daten am Desktop integrieren will. XML bleibt als
Austauschformat, etwa wenn wir Daten aus Microsoft Outlook extrahieren.
Danach speichern wir aber in eine RDF-Datenbank. Am Ende kann man
Abfragen über lokale und Webdaten in einer Anfrage machen, etwas
das mit SQL undenkbar ist. Ich kann etwa meine E-Mails mit Daten aus
Wikipedia kombinieren, das über Semapedia als RDF-Daten
verfügbar ist. RDF sprengt die Dateigrenzen von XML und
öffnet das gesamte Web als Datenbank.
NX: Warum
hat sich RDF nicht durchgesetzt?
LS: Die Frage lautet eher:
Warum hat sich RDF noch nicht durchgesetzt? Die Antwort liegt zum einen
darin begründet, dass bereits überall RDF ist, aber es
niemand merkt, zum anderen liegt es daran, dass alle Experten bereits
mit Produkten oder Projekten beschäftigt sind und wenig Zeit
haben,
weitere Programmierer auszubilden. Flickr verwendet einen RDF-Standard
des W3C zur Geo-Annotation ihrer Fotos, die erste RSS-Version ist RDF,
Creative-Commons-Lizenzen werden mit RDF an Dokumente verknüpft,
Adobe verwendet RDF als Metadatenformat für PDF und nennt es dann
XMPP. Es fehlen eine gute Dokumentation und Best Practices, aber die
kommen gerade. Ein weiteres Problem ist die technische Vielfalt, die
einen erschlagen kann. Es gibt nicht eine RDF-Syntax, sondern viele. Es
gibt nicht eine Möglichkeit, RDF in Webseiten einzubinden, sondern
viele. Es gibt mehrere Ontologiesprachen, mehrere Top-Level-Ontologien
und und und. Da müssen wir noch ein wenig warten, bis die
sinnvollen Dinge mehr eingesetzt werden.
NX: Wie siehst du die Zukunft von XML?
LS: Viele KMUs, mit denen wir
zu tun haben oder mit denen Freunde von mir arbeiten, verwenden noch
gar kein XML. Die hängen noch an Mainframes oder
COBOL-Applikationen aus den 80er Jahren. Für diese Leute ist es
ein Riesenschritt, XML und Web Services einzusetzen. Ich finde XML ganz
gut so wie es ist. Der neue XSLT-2.0-Standard bietet einige
interessante Möglichkeiten, aber ich denke grundsätzlich
ändert sich nichts. Für den Austausch in Web Services ist XML
immer noch das Ding der Wahl, ich sehe da keine Alternative. Wenn
es
um die Integration geht, braucht man definitiv RDF, nur hier kann man
URIs für die Datenintegration verwenden.
NX:
Was hältst du vom "Lowercase Semantic Web", also von Microformats,
Folksonomy usw.?
LS: Das "Lowercase
Semantic Web" ist mal ein Hack, um die Sachen heute zum Laufen zu
bekommen. Das ist ganz ok, um eine Demo zu machen, aber es fehlt hier
die Kraft einer Standardisierungseinrichtung. Die Ergebnisse sind die
gleichen wie beim Semantic Web. Also liebe ich alles, was aus dem Web
2.0 und dem „Lowercase Semantic Web“ kommt von ganzem
Herzen. Die Richtung stimmt. Im Endeffekt sind aber vieles Buzzwords
und Notlösungen.
NX: Ist
das Web 3.0 gleich dem Semantic Web?
LS: Die Frage ist halt, was
ist Web 3.0. Das DFKI hat einen Artikel für den Telekom Technology
Radar mit diesem Titel geschrieben, und damit haben Professor Dengel
und andere den Begriff Semantic Web mit Web 2.0 verbunden. Dann gab es
noch den New-York-Times-Artikel, der viel mehr gelesen wurde und in die
gleiche Bresche schlägt. Das Problem ist: Web 2.0 ist eine
eingetragene Marke von Tim O'Reilly, Semantic Web wird mit Tim
Berners-Lee und dem W3C verbunden. Web 3.0 dagegen ist ein dehnbarer
Begriff. Mir persönlich gefällt das [sagt es laut und hebt
dabei die Hände; Anm. d. Red.] „Semantic Web 2.0“. Das
bringt beides gut zusammen: Web-2.0-Services mit RDF als Datenformat,
Semantic Web Services sind so einfach zu benutzen wie Web 2.0.
NX: Ich danke dir für das
Gespräch und wünsche dir viel Erfolg mit dem Semantic Desktop!
Leo Sauermann
Leo Sauermann ist
wissenschaftlicher Mitarbeiter am Knowledge Management Lab des
Deutschen Forschungszentrums für Künstliche Intelligenz
(DFKI) in Kaiserslautern, wo er an den Projekten EPOS und NEPOMUK
arbeitet. In seiner Diplomarbeit "Gnowsis" definierte er den Semantic
Desktop. Er ist Mitglied der SWEO Gruppe des W3C, forscht, publiziert
regelmäßig und organisiert Workshops.
Martin Szugat
Martin Szugat war anfangs
begeistert von der Idee des Semantic Web, zwischenzeitlich skeptisch
und ist mittlerweile wieder optimistisch – vielleicht klappt es
ja mit dem Semantic Web im zweiten Anlauf. Mit der Zukunft des Webs
beschäftigt sich der langjährige Fachautor auch in seinen
Blogs aboutxml.de
und blog.sosokompakt.de.