Samstag, 11. Februar 2012 |
| |
Alles drehte sich um Ontologien auf dem 3. Kongress Semantic Web und Wissenstechnologien, der am 19. Oktober 2006 im Zentrum für Graphische Datenverarbeitung (ZGDV) in Darmstadt stattfand. Wie können Daten so strukturiert werden, dass Wissen über Grenzen hinaus fruchtbar gemacht wird und logische Relationen den Wissensaustausch begünstigen? Welche Möglichkeiten gibt es bereits, Daten Kontexte mitzugeben und was ermöglichen diese Metadaten?
Den Reigen eröffnete Hans-Peter Schnurr von der ontoprise GmbH, die semantische Technologien und Lösungen anbietet. Er zeigte auf, wie wir von der Natur für die Bildung von informatischen Ontologien lernen können. Das menschliche Gehirn verarbeitet 2,4 Terabyte pro Sekunde – da hat die künstliche Intelligenz vorerst das Nachsehen. Was im semantischen Netz die Ontologie bewerkstelligen muss, vollführen im Hirn die Synapsen. Da wird abstrahiert und "gejunkt". Das Wissensmanagement im Hirn ist kontextsensitiv angelegt: räumliche, situative Kontexte sind wichtig fürs Merken. 80 Prozent Erfahrungswissen bringen Geschwindigkeit in die menschliche Informationsverarbeitung. Aber auch das menschliche Hirn arbeitet mit Informationsverarbeitungsregeln, auch hier laufen bestimmte "Scans" automatisiert ab und Informationen werden vorbildlich gefiltert.
Was unterscheidet Semantic Web und Web 2.0?
Unterschiede und Gemeinsamkeiten von Semantic Web und Web 2.0 beleuchtete Benjamin Nowack (appmosphere.com) in seinem Vortrag. Fazit: Während das Semantic Web als gezielt formulierte Vision auf eine Initiative des W3C zurückgeht und 1999 mit "Weaving the Web" von Tim Berners-Lee in den Fokus der Aufmerksamkeit rückte, handelt es sich bei Web 2.0 um einen beschreibenden Oberbegriff für evolutionäre Veränderungen im Web, der auf eine Wortschöpfung von Tim O’Reilly mit und den Aufsatz "What is Web 2.0" sowie die gleichnamige Konferenz zurückgeht. Um beide Bewegungen scharen sich Communities, in beiden liegt der Fokus auf der besseren Informationsverarbeitung.
Die Idee des Semantic Web ist datenbezogen und orientiert sich an der Abbildung von Hirnprozessen – das Web ist hier als Wissensbasis gedacht. Das Web 2.0 hingegen ist anwendungsspezifisch, im Mittelpunkt steht die Applikationen. Während das Semantic Web akademisch geprägt ist, gibt sich das Web 2.0 praxisorientiert und interaktiv. Der theoretische Unterbau ergibt sich bei letzterem eher in der Rückschau.
Das Semantic Web setzt auf strukturierte und kontrollierte Informationen, das Konzept ist wenig am Markt orientiert. Ziel ist ein universelles Datenbeschreibungsmodell, das eine automatisierte Informationsverarbeitung ermöglicht und eine hohe Wiederverwendbarkeit gewährleistet. Das Web 2.0 hingegen betrachtet das Web lediglich als Plattform, die unkontrollierte Streuung von Metadaten in Form einer uneingeschränkten Massenindizierung ergibt sich dabei eher als Nebenprodukt – Standards finden hier nur am Rande Berücksichtigung. Es gibt keine explizite Semantik. Die einzelnen Anwendungen sind fast beliebig kombinierbar, da teilstandardisiert, dennoch ist jede einzelne eine Insellösung. Die kollektive Intelligenz versammelt sich im Web 2.0 aufmerksamkeitsstark und marktorientiert zu "Information & Enrichment". Webbasierte Geschäftsideen sind ein Kernpunkt der Bewegung. Dem Semantic Web hingegen mangelt es infolge des hohen Abstraktionsgrades an Entwicklern und Experten, die die Idee in die Praxis überführen.
Semantic Web im akademischen Kontext
Prof. Dr. Georg Lausen von der Altbert-Ludwigs-Universität Freiburg im Breisgau schließlich brachte die Zuhörer mit seinem Vortrag über Anfragen an Ontologien mittels Regeln wieder zurück ans Basiswissen. Er führte in den W3C-Ontologiestandard OWL (Web Ontology Language) und in Description Logics ein, erläuterte, wo die Unterschiede und Gemeinsamkeiten liegen und wie man mittels logischer Regeln Anfragen an Ontologien. Dabei zeigte er verschiedene Ansätze der Integration von OWL und Datalog.
Am Beispiel einer biologischen Forschungsdatenbank stellte Andreas Kupfer von der TU Braunschweig die Erstellung von Ontologien vor und wie sich mittels dieser die semantischen Konzepte einer Datenbank beschreiben lassen. So soll zum Beispiel die Suche über mehrere heterogene Datenbanken hinweg ermöglicht werden. Besonders interessant: Wie bildet man Schemaänderungen der Datenbank auf bestehende Ontologien ab?
Michael Stollberg berichtete aus dem Forschungsfeld der Semantic Service-Oriented Architectures. Er arbeitet beim DERI (Digital Enterprise Research Institute) in Innsbruck im Bereich Semantic Web Services. Dort bastelt man am intelligenten Web Service, der mittels Web Service Modeling Ontology (WSMO), dem Metamodell für die Web Service Modeling Language (WSML), direkt mit anderen WS kommuniziert. Durch die semantische Beschreibung von Web Services mit dem Ziel einer maschinenunterstützten Dateninterpretation (Semantic Web Services) will man die Interoperabilität von Web Services sicherstellen. Die Forscher arbeiten zur Zeit an einem SESA (Semantically Enabled Service-oriented Architectures) benannten Framework mit Referenzimplementierung. Hoffnungsfrohes Fazit von Michael Stollberg: "Die Killerapplikation für das Semantic Web ist das Semantic Web selbst".
Dr. Thorsten Priebe von der Capgemini Consulting Österreich AG präsentierte den im akademischen Kontext entstandenen Forschungsprototypen INWISS zur Integration strukturierter und unstrukturierter Daten. Erprobt wurde hier eine kontextbasierte Portletintegration mit Semantic-Web-Technologien für ähnlichkeitsbasierte Suche auf Metadaten. Durch Einführung eines so genannten "Context Management Layer" und von Context Wires in Anlehnung an das Wire-Konzept des IBM-WebSphere-Portals wurde eine Inter-Portlet-Kommunikation für die Anwendungsintegration in Unternehmensportalen ermöglicht . Dabei wurden Portlets in heterogenen Anwendungen über semantische Metadaten gekoppelt, um nicht strukturierte Prozesse zu unterstützen. Der Hintergedanke: Portlets können unabhängig voneinander entwickelt werden, sind aber dennoch miteinander kombinierbar.
Semantische Netze im Praxiseinsatz
Beispielimplementierungen für Content-Management- und Knowledge-Management-Lösungen stellte Dr. H. Holger Rath von der empolis GmbH vor. Als Beispiellösung präsentierte er eine Kundendienstsoftware für ein Call Center, bei der über Entscheidungsbäume Servicewissen gezielt abgefragt werden kann. Die Anforderung war, den Kundendienst auf den unteren Serviceebenen weitgehend zu "industrialisieren"; hier sind nach Angaben von Rath große Einsparungen möglich, da eine herkömmliche Lösungsfindung in diesen Bereichen 80% der Servicekosten verursacht. Hier können Wissenstechnologien auf Ontolgiebasis gezielt eingesetzt. Rath wies darauf hin, dass die Ontologieerstellung bei Spezialproblemen nicht lohnt, da der Ontologieaufbau genau so viel oder mehr Zeit in Anspruch nimmt wie die Problemlösung durch Spezialisten.
Ontologie meint im Beispielfall spezielles, explizit modelliertes Geschäftswissen, das als Data Dictionary, Wörterbuch, Klassifikation, Thesaurus und Wissensmodell in einem dienen kann. Es wird schrittweise aufgebaut, muss allerdings auch entsprechend gepflegt werden (Ontology Management). Die Ontologie fasst das Unternehmenswissen zusammen, gewährleistet die optimierte Verwendung heterogener Ressourcen (z.B. aus Datenbanken, ERP-, CRM-Systemen, Glossaren etc.) und macht das Wissen auch in anderen Kontexten wiederverwertbar, da es neutral annotiert ist. So ergeben sich Verwendungsmöglichkeiten für Online Shop, Call Center, Web Self-service, Field Service, CRM, Corporate Search, Internet, Intranet und vieles mehr – was den entsprechenden Return on Investment befördert.
Klaus Reichenberger von der intelligent views GmbH demonstrierte ein Beispiel für den Einsatz von semantischen Netzen anhand einer Geschäftslösung für einen Ziegelhersteller. Es ging konkret um die Einführung eines semantischen Wissensmanagements als Skill-Management-Portal. Hier wurde Wissen aus dem HR-Bereich wiederverwendbar gemacht. Reichenberger hob die Bedeutung semantischer Netze für Industrieanwendungen hervor. Hier seien große Potenziale zu erschließen, da durch die thematische Begrenzung geschlossene Systeme aufgebaut werden können. Da ein Firmennetz endlich ist und nicht unbedingt zur Laufzeit aufgebaut werden muss, ist die Einführung einer strukturierten Wissensweitergabe hier verhältnismäßig einfach zu realisieren. Im WWW (der eigentlichen Semantic-Web-Vision) ist diese Standardisierung wesentlich schwieriger zu vorzunehmen und nicht ohne weiteres in der Qualität, die ein Enterprise-Kontext erfordert.
Reichenberger wies darauf hin, dass eine hohe Motivation der User erforderlich sei, um dieses Modell zu ermöglichen. Er verwies auf den Gegensatz zwischen Community-getriebenen Systemen und Geschäftsanwendungen: Bei großen Netzen ist die Qualitätssicherung ein Problem; alle User können unkontrolliert annotieren (Beispiel: Wikipedia), im Unternehmensnetz gibt es "Wissensadministratoren", die als Knowledge Broker das Netz technisch oder Knowledge Leader inhaltlich organisieren. Dies bringt einen gewissen Administrationsaufwand mit sich, der berücksichtigt werden muss, da Firmennetzwerke vor dem Hintergrund des ROI vom Effizienzgedanken getrieben sind. In Community-Netzen spielt Effizienz kaum eine Rolle.
Immer wieder wurde betont, dass ein solches Wissensnetzwerk mehr als "Google Enterprise" sei: hier gehe es um die strukturierte Ablage von Wissen. Das semantische Netz sei nicht nur eine bessere Suchmaschine, sondern es handele sich um einen konzeptuell anderen Ansatz, nämlich den der Ausbildung von Organisationsstrukturen (schon deswegen sei ein solches Projekt lohnend), die Generierung von Mehrwert, die Fokussierung auf Kernkompetenzen und die Analyse.
Eine Suchmaschine arbeitet rein angebotsorientiert, ein semantisches Netz hingegen nachfrageorientiert. So kann Wissen intelligent aktiviert werden. Bei einer normalen Suche weiß das System nichts über den Kontext, er muss erst beschrieben werden. Von der Qualität der Beschreibung hängt der Erfolg und die Qualität des Ergebnisses ab. Ein semantisches Netz geht über relationale Datenbanken hinaus, da es ungebundene Informationen liefert, die beliebig interpretierbar sind.
Reichenberger definierte die Verringerung des Informationsaufwandes und die (Teil-) Automatisierung bei der Ontologiebildung als Zukunftsaufgaben, um die man nicht herumkomme.
Semantic Web für Endanwender
Den Abschluss bildete die Vorstellung des "Semantic Desktop" durch Leo Sauermann, der beim DFKI GmbH Deutsches Forschungszentrum für Künstliche Intelligenz in Kaiserslautern Leiter des Open-Source-Projektes "Gnowsis" ist. Bei Gnowsis dreht sich alles um persönliche Infomodelle und die Metadatenintegration für Einzelpersonen. Ziel des Projektes ist ein persönliches Informationsmanagement mit Ontologie-Abgleich sein. Der Gnowsis Semantic Desktop ist Teil des EU-Projektes Nepomuk. Nepomuk ("The Social Semantic Desktop") wird von der EU bis 2008 mit 11,5 Millionen Euro gefördert. Hier sollen die verschiedenen Ansätze anwendungs- und systemübergreifend kombiniert und eine Standardisierung innerhalb Europas erreicht werden. Sauermann stellte einige der Forschungsprojekte im Rahmen von Nepomuk vor. Zum Teil können die Einzelprojekte schon heute getestet werden und sind bereits miteinander kombinierbar.
Aufbauend auf Semantic-Web-Standards (URI, RDF, RDF/S, HTTP) wird ein integriertes Informationsmanagement kreiert und ein persönliches Informationsmodell ausgebildet (PIMO), sodass eine homogene Sicht auf Daten, die Kategorisierung, Erweiterbarkeit und eine kontext- und sozialorientierte Suche auf Metadaten (eigene und shared) möglich wird. Annotationen (Context Ontologies), Text (Thesauri, Übersetzungen), Dokumentenanalyse und die Analyse des aktuellen Arbeitskontextes des Wissensarbeiters machen eine Kommunikation über Kontexte möglich.
Was bringt die Zukunft?
Der Semantic Web Kongress machte einmal mehr deutlich, wie spannend das Thema Semantic Web ist und dass wir auf diesem Gebiet in den nächsten Jahren noch viel erwarten dürfen. Es wurden sowohl der akademische Hintergrund und die Konzepte anschaulich als auch erste Anwendungsmöglichkeiten – wenn diese in der Praxis auch noch rar sind. Allerdings wurden auch die Probleme aufgezeigt, die zum Beispiel eine Anwendung im Unternehmenskontext nach wie vor schwierig machen: In kommerziellen Anwendungen scheint in vielen Fällen das Problem der Rechteverwaltung noch nicht gelöst. In diese Richtung zielten auch zahlreiche Teilnehmerfragen: Wie stelle ich sicher, dass nur derjenige die Daten zu sehen bekommt, der sie auch sehen soll?
Bis heute gibt es noch keine "Killeranwendung" für das Semantic Web – auf die, so war zu vernehmen, viele der Teilnehmer gehofft hatten. In den Diskussionen wurde zum Teil die Realitätsferne der vorgestellten Forschungsprototypen kritisiert, insbesondere was die Performanz betrifft. Große Datenmengen müssen nicht nur generiert, sondern eben auch sinnvoll verarbeitet werden.
Einige Fragen bleiben nach wie vor offen. Die Idee vom WWW als semantisches Netz ist trotz ihrer unübersehbaren Potenziale überschattet vom Problem des Kontrollmangels und damit der Qualitätssicherung: Wie ist Qualität der Information kontrollierbar, wenn jeder annotiert, wie es beliebt? Auch die Ontologiebildung zur Laufzeit ist nicht frei von Problemen. Fest steht ebenfalls: Wenn nicht Mechanismen gefunden werden, um die Ontologiebildung zumindest zum Teil zu automatisieren, wird die Idee "Semantic Web" in größeren Dimensionen so schnell nicht aufgehen. Vielleicht ist aber auch hier der Weg das Ziel: In der Zwischenzeit entstehen viele nützliche und spannende Nebenprodukte gerade auch für den Bereich der Unternehmensanwendungen.