Datenqualität: Ein Thema rückt ins Zentrum der Aufmerksamkeit

Vernachlässigtes Kapital
Kommentare

Daten sind ein lange vernachlässigtes Kapital. Auf diesen knappen Nenner lässt sich die Situation in vielen Unternehmen bringen, wenn es um den Umgang mit Daten geht. Die Stellungnahme trifft auf Kundendaten ebenso zu wie beispielsweise auf Lieferanten- oder Produktdaten. Worin genau besteht nun aber das Problem der Datenqualität in Unternehmen? 

Nahezu sämtliche Firmendaten liegen in einem modernen Unternehmen elektronisch bzw. digital vor. Man sollte meinen, das vereinfache deren Verwaltung, Aktualisierung und Nutzung. Das ist theoretisch richtig, in der Praxis aber nur selten realisiert. Tatsächlich sind Firmendaten in den unterschiedlichsten Systemen und Formaten gespeichert, die in den seltensten Fällen kompatibel sind. Häufig „versteht“ das ERP-System nicht, was das CRM-System zu sagen hat und die Buchhaltungs-EDV kann nicht mit der Marketingsoftware kommunizieren. So liegen in Unternehmen häufig komplett heterogene Datensätze vor, die in weiten Teilen nicht aktuell sind und viele Dubletten oder falsche Informationen enthalten. Hinzu kommt die Tatsache, dass vorhandene Daten nur über eine relativ kurze Zeit korrekt und aussagekräftig bleiben. Für den Fall von Kundendaten beispielsweise ist eine „Lebenserwartung“ von ungefähr zwei Jahren zu veranschlagen. Ein Unternehmen, das 2007 noch über 500.000 akkurate Kundendatensätze verfügt, besitzt demnach 2011 nur noch 125.000 Kundendatensätze, die sich für Marketing, Kundenbetreuung und Vertriebszwecke eignen. Dieses Verfallsprinzip von Daten gilt prinzipiell für alle Arten von Daten und alle Branchen. Die Probleme beginnen allerdings noch früher. Die Integration und Aktualisierung heterogener Datenquellen ist nur die eine Seite. Die andere ist die Eingabe neuer Daten. Hier kommt es mit Abstand zu den meisten Fehlern. Häufig stehen diejenigen, die neue Daten eingeben, unter erheblichem Zeitdruck. Zudem stehen ihnen in den meisten Fällen nicht genügend Informationen zur Verfügung, um alle Daten korrekt aufzunehmen.

Abhilfe – Speziallösungen für Datenqualität

Eine technische Lösung, die in dieser Situation für Abhilfe sorgen kann, muss also einerseits einen zentralen Platz in der IT-Infrastruktur eines Unternehmens einnehmen, um für die Integration der Daten in heterogenen Datenquellen sorgen zu können. Zum anderen muss sie die Peripherie der Infrastruktur einbeziehen, um diejenigen unterstützen zu können, die neue Daten einpflegen. Solche Lösungen liefern die großen Hersteller von CRM-, ERP- oder Datenbanksoftware keinesfalls mit. Vielmehr müssen Anwender hierfür auf Software von spezialisierten Anbietern wie DataFlux zurückgreifen. Konkrete Beispiele zeigen, wie Speziallösungen beiden Aspekten der Datenqualität gerecht werden können.

Korrekte Datenerfassung – Anwenderbeispiele: DSM und 118118

Um dem Problem der Eingabe falscher Daten Rechnung zu tragen, sind häufig tiefgreifende Änderungen der Geschäfts- und IT-Prozesse erforderlich. Das Problem falscher Dateneingabe kann sehr tief reichen. So ist es häufig eine echte Herausforderung für einen Datenerfasser, womöglich unter Zeitdruck die korrekte Produktnummer bzw. -klassifizierung einzutragen. In einem Fertigungsunternehmen fasst ein SAP-System bei der Dateneingabe unter Umständen mehr als 100 Produkte in einer Kategorie (z.B. unter der Eingabe „Tisch“) zusammen. Diese Klassifizierung ist letztlich viel zu ungenau. 

DSM Nutritional hat über 500 000 Produkte im Angebot. Eine korrekte Produktklassifizierung ist für die Abläufe im Unternehmen von hoher Bedeutung. DSM führte deshalb eine spezielle Lösung zur Verwaltung der Stammdaten ein, um die Produktklassifizierung in den Griff zu bekommen. Der Anwender erhält jetzt innerhalb des SAP-Systems ein Menü mit Optionen, das die Validierung und gegebenenfalls Korrektur der Produktinformationen bereits bei der Dateneingabe erlaubt. Das System funktioniert einheitlich in allen Ländern, in denen DSM aktiv ist.

Ein anderes gutes Beispiel, wie fehlerhafte Daten schon bei der Eingabe vermieden werden können, bietet das größte britische Telefonauskunftunternehmen 118118. Bei 118118 galt es, doppelte Einträge aus der Datenbasis zu entfernen und sicher zu stellen, dass jeder Kunde mit einer zutreffenden Information zu Telefonnummer und Adresse versorgt wird. Hierbei kommt Fuzzy Logic zum Einsatz, d.h. spezielle Algorithmen, die in der Lage sind, nicht nur exakte Übereinstimmungen zu finden, sondern auch Ähnlichkeiten wie zwischen „Blumen Müller, Südstraße“ und „Blumen Müller, Südgasse“. Hat die Software eine derartige potenzielle Dublette gefunden, untersucht sie anhand weiterer Informationen wie der Telefonnummer und Postleitzahl, ob es sich tatsächlich um zwei Datensätze zum selben Geschäft handelt. Falls ja, wird der Prozess zur Beseitigung der Inkonsistenz eingeleitet.

118118 hat auch spezielle Regeln erstellt, die Adress- oder Telefonbucheinträge in Echtzeit standardisieren, noch während ihre Mitarbeiter die Informationen eingeben. Wenn ein Anwender neue Daten eingibt, weist ihn das System auf mögliche Fehler, Dubletten oder Inkonsistenzen hin. Diese kann der Anwender verifizieren und gegebenenfalls seine Eingabe ändern, auf die Anlage eines neuen Datensatzes verzichten oder bestehende Datensätze aktualisieren.

Aufmacherbild: Yellow Two-Way Direction Sign with the Words Public and Private on Blue Background. Concept of Choice von Shutterstock / Urheberrecht: Tashatuvango

[ header = Datenintegration – Schnittstellen im SAP-Umfeld ]

Datenintegration – Schnittstellen im SAP-Umfeld

Dass eine Datenqualitätssoftware sehr komplexe Anforderungen erfüllen können muss, verdeutlicht auch das Beispiel SAP. SAP-Software kommt in sehr vielen Unternehmen zum Einsatz. Die meisten Anwender nutzen dabei mehr als ein SAP-Modul. Bereits die Software eines Anbieters ist somit nicht homogen. SAP bietet zwei Hauptgenerationen seiner Suite aus Geschäftsanwendungen: SAP R/3 und SAP Business Suite. Die in der SAP Business Suite enthaltenen operativen Applikationen umfassen unterschiedliche Module:

  • Customer Relationship Management
  • ERP
  • Product Lifecycle Management
  • Supply Chain Management
  • Supplier Relationship Management

Zu den betrieblichen SAP-Applikationen gehören außerdem:

  • Manufacturing
  • Service and Asset Management
  • Duet, eine Softwarekomponente für den direkten Zugriff aus Microsoft-Office-Applikationen auf SAP-Anwendungen und -Daten 

Zusätzlich bietet SAP die Infrastruktursoftware NetWeaver an. Auf diese setzen sowohl die betrieblichen SAP-Applikationsdienste als auch das vorkonfigurierte Business-Intelligence(BI)-System von SAP, NetWeaver BI auf. NetWeaver besteht aus einer Reihe von Komponenten:

  • NetWeaver Mobile
  • NetWeaver Portal
  • ARIS for NetWeaver
  • NetWeaver Exchange Infrastructure (XI)
  • Auto-ID Infrastructure 
  • NetWeaver Business Intelligence (BI)
  • NetWeaver Master Data Management (MDM)
  • NetWeaver Application Server

Bei der Integration einer Datenqualitätslösung in eine SAP-Umgebung kommt den Komponenten SAP NetWeaver BI und SAP NetWeaver MDM eine wichtige Rolle zu, weil sie über vorkonfigurierte Funktionen zur Datenintegration verfügen. Allerdings nutzt längst nicht jeder SAP-Anwender diese Module. Auf Basis seiner NetWeaver-Plattform entwickelte SAP zudem vorkonfigurierte serviceorientierte Composite Applications, so genannte SAP xApps (sprich Cross Apps). Auch diese müssen mit Schnittstellen unterstützt werden.


Abb. 1: SAP-Umgebung mit DataFlux-Produkten

Für die Integration einer Datenqualitätslösung in eine SAP-Umgebung stehen unterschiedliche Optionen zur Verfügung:

  • Integration mit xApps und den betrieblichen Applikationen von SAP R/3 und SAP Business Suite über SAP NetWeaver XI
  • Integration mit NetWeaver BI
  • Integration mit NetWeaver MDM
  • Aufrufen der Dienste für Datenintegration und Datenqualität als Teil einer Geschäftsprozessmodellierung in ARIS for NetWeaver
[ header = Integration + Fazit ]

Integration mit betrieblichen SAP-Applikationen

Für die operativen SAP-Applikationen kann ein Softwaremodul eingesetzt werden, das die Daten in den Applikationsdatenbanken von SAP R/3 und SAP Business Suite ermittelt und analysiert. Anschließend können die Workflows für Datenbereinigung und Datenintegration erstellt werden, um die Qualität der Daten in diesen Systemen zu verbessern. Für die operativen Applikationen der SAP Business Suite ist der Einsatz vorgefertigter, zertifizierter SAP Business Add-ins ratsam. Diese können einen zentralen Datenintegrationsserver aufrufen. Der Aufruf des Servers kann in Echtzeit mittels XML-Messaging im SOAP-Standard über den SAP NetWeaver XI Enterprise Service Bus erfolgen.

Integration mit SAP NetWeaver MDM

Eine vorgefertigte Validierung und Dublettenprüfung für Namen und Adressen in der Datenqualitätssoftware gewährleistet, dass Kunden-, Lieferanten-, Mitarbeiter- und Partner-Stammdaten in einem Zustand hoher Qualität gehalten werden. Ergänzend kann eine Prüfung von Übereinstimmungen mit Watch-List-Einträgen in SAP MDM integriert werden. So kann die Software gewährleisten, dass Stammdaten über Personen und Organisationen in SAP MDM regelmäßig mit Sicherheitslisten, Verbotslisten und Ähnlichem verglichen werden. Zusätzlich kann die Produktklassifizierung genutzt werden, um Produktstammdaten in SAP MDM korrekt zu klassifizieren.

Integration mit SAP NetWeaver BI

In der Datenqualitätssoftware definierte Arbeitsabläufe können auch dazu dienen, SAP- und nicht-SAP-Daten, die in SAP NetWeaver BI für Berichte und Analysen verwendet werden sollen, zu validieren, zu bereinigen, anzupassen, anzureichern, zu transformieren und zu integrieren. Die Integration kann entweder über die APIs eines bereits vorhandenen Datenintegrationswerkzeugs für SAP NetWeaver BI erfolgen oder über Web Services.

Integration per Geschäftsprozessmodellierung

Datenqualitätslösungen können auch die Möglichkeit bieten, Abläufe als Web Services zu veröffentlichen. Sie lassen sich dann als Aktivitäten in Geschäftsprozessen aufrufen, die in der Geschäftsprozess-Management-Software ARIS for NetWeaver modelliert wurden. Somit können Unternehmen genau definieren, wann sie die Datenbereinigung und/oder Datenintegration als Teil eines Geschäftsprozesses aufrufen wollen. Ein klassisches Beispiel ist, diese Abläufe an das Eintreffen einer Nachricht auf einem Service Bus zu koppeln, d.h. dem Eintreffen einer elektronischen Order eines Kunden, einer Angebotsanfrage eines Versicherungsmaklers etc. An diesem Punkt kann Datenvalidierung als erste Aufgabe im Prozess ausgelöst werden, um zu verhindern, dass fehlerhafte Daten in das Unternehmen gelangen.

Fazit

SAP-Umgebungen sind hier nur stellvertretend für die IT-Lösungen anderer Anbieter behandelt worden. Eine Datenqualitätslösung muss auch mit den Produkten anderer Anbieter (wie SAP oder Siebel) integriert werden können, entweder durch die Unterstützung offener Standards oder die Bereitstellung spezialisierter Schnittstellen. Eine hohe Datenqualität im Unternehmen ist eine keinesfalls triviale Aufgabe. Mit einer entsprechend spezialisierten und hoch entwickelten Software lässt sich Datenqualität allerdings erreichen. Das gilt für den kritischen Prozess der Dateneingabe ebenso wie für die Integration innerhalb der IT-Infrastruktur.

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -