Torte, Balken oder Linie

Datenvisualisierung: Theorie und Praxis
Kommentare

Es existieren die unterschiedlichsten Diagrammarten. Nicht immer muss es das Torten- oder Balkendiagramm sein. Manche Zusammenhänge können mithilfe anderer Diagrammarten besser ausgedrückt werden.

Wir führen in das Thema ein und erläutern die unterschiedlichen Arten von Diagrammen, beispielsweise für die Konfiguration eines Reportgenerators. Zuvor erfahren Sie jedoch etwas über die Theorie der Visualisierung.

Bei einer Vielzahl von Datenbankanwendungen für Online- und Offlineanwendungen sind auch Module zum Erstellen von Berichten zu integrieren. Diese Arbeit wird im Regelfall mithilfe so genannter Berichtsgeneratoren erledigt. Damit können die typischen Diagrammarten (wie insbesondere von Microsoft Excel bekannt) erstellt werden. Die technische Seite ist damit beantwortet, aber was ist mit den inhaltlichen Aspekten? In den seltensten Fällen wird das Pflichtenheft einer zu entwickelnden Software diesbezüglich genaue Auskunft geben. Die Entscheidung und damit auch das Risiko verbleiben zunächst beim Entwickler. Das Thema dieses Artikels ist die Visualisierung von Daten, dabei geht es primär um die inhaltlichen Aspekte; technische Fragestellungen rücken zunächst in den Hintergrund. Praktische Anwendungen ergeben sich beispielsweise bei der Konfiguration von Berichtsgeneratoren zur Auswertung von (Massen-)Daten aus operativen Datenbanksystemen oder Sammlungen von Daten aus Data-Warehouse-Systemen. Diese Berichtsgeneratoren sind in die eigene Applikation aufzunehmen oder aus dieser anzusteuern. Auf der Agenda steht daher das folgende Programm:

• Grundlagen: Es erfolgt eine Einführung in die theoretischen Grundlagen der Visualisierung.
• Vorgehensweise: Eine gute Visualisierung beginnt mit dem Treffen von Auswahlentscheidungen aus den verfügbaren Rohdaten und endet mit einer Interpretation der grafischen Darstellung.
• Diagramme/Diagrammarten: Sie sind das Herzstück einer grafischen Datenrepräsentation. Die Auswahl des richtigen Typs ist essenziell, um die gewollten Aussagen darzustellen.
• Reportgeneratoren: Diese generieren aus den Informationen eines Datenbanksystems – nach entsprechender Konfiguration – automatisch die gewünschten Diagramme.

Grundlagen der Visualisierung

Ursprünglich hatte der Begriff „Visualisation“ laut dem Shorter Oxford English Dictionary die Bedeutung „constructing a visual image in the mind“. Das hat sich inzwischen geändert. Heutzutage hat dieser Begriff eine andere Bedeutung: Es geht um die grafische Repräsentation von Daten. Die Geschichte der Visualisierung durch den Menschen nimmt seinen Anfang vor etwa zehn Millionen Jahren. Sie wurde als Instrument für die Wahrnehmung und Erkennung unserer Umgebung entwickelt und hat sich immer weiter entwickelt. Das menschliche Visualisierungssystem sucht nach bekannten Mustern in seiner Umgebung und versucht, diese wiederzuerkennen. Gelingt es, kann der Sachverhalt direkt zugeordnet und verarbeitet werden. Deswegen spielt eine bestimmte Art der Datenpräsentation eine sehr wichtige Rolle. Werden die Daten nach bestimmten Regeln visualisiert, ist der Betrachter im Regelfall in der Lage, diese Informationen richtig zu interpretieren. Ein Beispiel: Eine von links unten nach rechts oben verlaufende Linie wird sofort als Wachstum erkannt. Man spricht von zwei Phasen der Visualisierung: der Pre-Computer-Phase und der Computer-Phase. In der Pre-Computer-Phase mussten die darzustellenden Daten zuvor manuell ausgewählt werden, eine nachträgliche Anpassung (nach der erfolgten Visualisierung) war nicht mehr möglich. Der Betrachter war von der getroffenen Auswahl des Erstellers der Datenvisualisierung abhängig. Anders gestaltet sich dieser Sachverhalt durch den Einsatz von leistungsfähiger IT-Technologie. Durch Visualisierungstools ist es möglich geworden, zunächst tausende von Datensätzen miteinander zu verknüpfen und zu modifizieren. Man spricht nicht mehr von einem statischen, sondern von einem dynamischen Charakter der Visualisierung, d. h. die visuell dargestellten Daten können vom Benutzer ausgewählt werden:

„A graphic is no longer ‘drawn’ once and for all: it is ‘constructed’ and reconstructed
(manipulated) until all relationships which lie within it have been perceived … a graphic is
never an end in itself: it is a moment in the process of decision making.“ Bertin (1981)

Oftmals wird die Visualisierung als Erweiterung des Denkens genannt, der Computer und der Mensch agieren zusammen, um das Problem zu lösen (Zhang, 1997). Ende der Achtzigerjahre wurden computerbasierte Techniken intensiv bei der Bearbeitung und Auswertung von umfangreichen Datenreihen im Rahmen der wissenschaftlichen Studien zur Erforschung der Konzentration von Ozonwerten in der Atmosphäre eingesetzt. Dieses führte zur Entstehung der Spezialdisziplin Scientific Visualization. Anfang der 1990er Jahre wurde der Begriff Information Visualization entwickelt. Die Datenvisualisierung hat zwei Funktionen (siehe dazu):

1. Datenpräsentation: Darstellung der bekannten Daten durch eine geeignete Präsentationsform
2. Datenexploration/Visual Data Mining: Entdeckung und Darstellung von neuen Informationen durch die Verknüpfung und Transformation von Daten (Kasten: „Visual Data Mining“)

In diesem Zusammenhang ist auch der Prozess des Erkenntnisgewinns zu beachten. Datenbanken enthalten zunächst „nur“ einzelne Zeichen bzw. Daten, wenn auch in geordneter Form. Das Ergebnis kann die Interpretation und der Erkenntnisgewinn (Wissen) in Form einer visuellen Darstellung sein. Dieser Weg in Form von einzelnen Stufen lässt sich auf abstrakter Weise wie folgt beschreiben:

• Zeichen: Hierbei handelt es sich lediglich um die einzelnen Zeichen, zum Beispiel in alphanumerischer Syntax. Die Bedeutung oder Reihenfolge der einzelnen Zeichen spielt an dieser Stelle noch keine Rolle. Die Folge aus „EFAB65“ sind lediglich sechs alphanumerische Zeichen, ohne weiteren Bedeutungszusammenhang.
• Daten: Werden die Zeichen in eine bestimmte Reihenfolge bzw. Syntax gebracht, so handelt es sich um Daten bzw. um einen Datensatz. Eben genannte Zeichenkette könnte syntaktisch für ein zulässiges Kfz-Kennzeichnen (EF AB 63) stehen.
• Information: Daten, welche vor dem Hintergrund eines bestimmten Kontexts interpretiert werden, stellen Informationen dar. Informationen dienen dazu, einen Sachverhalt zu bewerten oder eine Entscheidung zu treffen. Diese Bewertung bzw. Entscheidung beruht jeweils auf dem Erfahrungshintergrund der jeweiligen Person.
• Wissen: Informationen, welche verarbeitet werden und zum Verständnis eines bestimmten Sachverhaltes führen, werden als Wissen bezeichnet. Von besonderer Bedeutung ist die Abstraktion vom Einzelfall. Ziel ist es, zu allgemeingültigen Aussagen zu gelangen.

Visual Data Mining
Data Mining beschäftigt sich mit der Erkennung von Mustern in großen Datenmengen. Visual Data Mining ist eine Kombination von Data Mining und Visualisierungstechniken. Dieser Ansatz verwendet verschiedene Visualisierungstechniken, um eine Schnittstelle zwischen Benutzer und Data-Mining-Systemen zu erstellen. Durch eine Synthese von Visualisierung und Data Mining wird die Effektivität des Prozesses der Wissensextraktion erhöht. Es werden drei Ansätze unterschieden:• Visualisierung der Data-Mining-Ergebnisse
• Visualisierung von Zwischenergebnissen
• Visualisierung von AusgangsdatenData-Mining-Techniken werden nach folgenden Kriterien klassifiziert:

• Nach dem zu visualisierenden Datentyp: ein-, zwei- oder multidimensional, Text und Hypertext, Hierarchien und Graphen
• Nach der verwendeten Visualisierungstechnik: 2-D-Visualisierung, geometrische Transformation, geschachtelte Visualisierung, Pixelvisualisierung, und Icon-basierte Visualisierung
• Nach der verwendeten Technik für Interaktion und Verzerrung: Standard, Zoom, Projektion, Filterung und Verzerrung

Der Prozess der Visualisierung im Überblick

Ein Referenzmodell zur Datenvisualisierung wurde an der Universität Maryland unter der Leitung von Ben Schneiderman entwickelt (siehe dazu). Das Modell zerlegt den Prozess der Transformation von Daten in visuelle Formen in folgende Schritte (Abb. 1):

• Data Transformation (Raw Data → Data Tables): In diesem Schritt werden die Rohdaten, welche in unterschiedlichen Formaten vorliegen (z. B. als Suchergebnisse), in strukturierte Tabellen umgewandelt. Es kann sich hierbei um qualitative oder quantitative Daten handeln. Daten, welche in Tabellenform vorliegen, sind einfacher zu visualisieren als das Ausgangsmaterial.
• Visual Mappig (Data Tables → Visual Structures): Im Unterschied zum ersten Schritt basieren die visuellen Strukturen auf grafischen Eigenschaften und nicht auf mathematischen Relationen. Es existieren mehrere Möglichkeiten des Visual Mappings (z. B. Auswahl aus unterschiedlichen Diagrammarten). Es ist jedoch entscheidend, ein qualitativ passendes und ausdrucksstarkes Mapping zu finden.
• View Transformation (Visual Structures → Views): Dieser Schritt stellt eine Erweiterung des zweiten Schritts dar. Der Zeitaspekt wird zur Extrahierung von Informationen eingesetzt. Der Benutzer kann beispielsweise in die Daten „hineinzoomen“.

Abb. 1: Transformation von Daten zur Vorbereitung der Visualisierung

Abb. 1: Transformation von Daten zur Vorbereitung der Visualisierung

 

Diagramme

Diagramme sind ein sehr gutes und gebräuchliches Instrument der Visualisierung. Die grafische Darstellung ermöglicht eine schnelle Erfassung der Sachverhalte und Akzeptanz. Diagramme können anhand von Absolut-, Relativ- oder Indexwerten aufgebaut werden. Die Besonderheit bei Indexwerten besteht darin, dass der Wert des Basisjahres gleich 100 und die anderen Werte dazu in Relation gesetzt werden. Im Vergleich zur tabellarischen Darstellung hat die visuelle Darstellung eine Reihe von Vorteilen:

• Komplexe Zusammenhänge sind übersichtlicher darstellbar und leichter erkennbar.
• Es besteht die Möglichkeit der Darstellung von Zeitverläufen/ Entwicklungen.
• Die farbliche Gestaltung erlaubt das Hervorheben bestimmter Informationen.

Jedoch sind die Zahlenwerte in Diagrammen nicht genau ablesbar. Weiterhin besteht die Möglichkeit, dass eine visuelle Manipulation der ausgewählten Daten erfolgt. Solche Verzerrungen entstehen beispielsweise, wenn die Daten aus einem bestimmten Zeitraum mit positiven oder negativen Entwicklungen dargestellt werden, der Gesamtzusammenhang jedoch ausgeblendet wird. Die Auswahl des Diagrammtyps bestimmt sich aus der Art der vorliegenden Datenreihe. Der richtige Diagrammtyp ist entscheidend, um die Daten richtig und anschaulich zu präsentieren. Die wichtigsten Bestandteile jedes Diagramms sind (Abb. 2):

• Diagrammtitel
• Achsenbeschriftung: Größenbezeichnung und zugehörige Einheit
• Sichtbar markierte und geeignete Einteilung der Achsen
• Legende zu den Datenreihen
• Geeignete Schriftgröße: etwas kleiner, oder genau so groß wie der Text
• Diagrammlegende
• Nummerierung des Diagramms und der Diagrammlegende bei mehreren Diagrammen
• Quellenangaben zur Kennzeichnung der Datenherkunft

Abb. 2: Bestandteile eines Diagramms

Abb. 2: Bestandteile eines Diagramms

Arten von Diagrammen

Grundsätzlich unterscheidet man die folgenden Diagrammtypen:

• Säulen- bzw. Balkendiagramme
• Kurven- bzw. Liniendiagramme
• Flächendiagramme
• Kreissektoren- bzw. Tortendiagramme

Diese Diagrammtypen sind grundsätzlich alle zur Präsentation von Informationen gleicher Art, jedoch auf unterschiedliche Weise geeignet. Im gewissen Umfang sind sie gegeneinander austauschbar und können auch ineinander transformiert werden. Jedoch hat jedes von ihnen eine Reihe von Besonderheiten, d. h. sie sind je nach gewünschter Aussage besser oder schlechter geeignet. Die wichtigsten Diagrammtypen werden nachfolgend genauer beschrieben.

Säulen- und Balkendiagramme

Säulendiagramme sind gut für die Darstellung von Datenreihen mit einem begrenzten Umfang geeignet. Hier werden Datenwerte im direkten Vergleich dargestellt. Bei der waagerechten Darstellung spricht man von einem Balken- oder Streifendiagramm. Die x-Achse repräsentiert in den meisten Fällen die Zeitangaben. Die y-Achse steht für die abhängige Variable. Auf der y-Achse können alternativ auch mehrere Datenreihen dargestellt werden, dann wird zwischen linker und rechter y-Achse unterschieden. Die Breite der Säulen ist nicht festgelegt und kann in jedem Einzelfall variieren. Eine Besonderheit bei dieser Diagrammart besteht darin, dass die Datenreihen nicht nur nebeneinander oder versetzt hintereinander angeordnet werden können, sondern es ist auch ein Stapeln der Datenreihen möglich. Dabei werden inhaltlich zusammenhängende Daten übereinander abgebildet und kumulieren zu einem Gesamtwert von 100 Prozent. Bei dieser Darstellungsform werden die verschiedenen Balken bzw. Säulen in einem Band vereinigt. Der Vorteil ist, dass viele Informationen auf einem begrenzten Raum darstellbar sind. Ein Beispiel für ein Balkendiagramm findet sich in Abbildung 3. Ein typisches Merkmal, welches Balkendiagrammen oft hinzugefügt wird, ist eine so genannte Trendlinie. Diese drückt eine durchschnittliche Entwicklung aus (Kasten: „Trendlinie“ und Abb. 4).

Abb. 3: Ein Beispiel für ein Balkendiagramm: zwei Datenreihen werden simultan angezeigt

Abb. 3: Ein Beispiel für ein Balkendiagramm: zwei Datenreihen werden simultan angezeigt

 

Abb. 4: Säulendiagramm mit Trendlinie

Abb. 4: Säulendiagramm mit Trendlinie

 

Trendlinie
Die langfristige Entwicklungstendenz einer Zeitreihe heißt Trend. Man benutzt eine Trendfunktion zur Vorhersage und Prognose. Der Trend wird oft durch eine Trendlinie bzw. Trendfunktion dargestellt. Die Treffsicherheit (Qualität) der Prognose hängt von folgenden Faktoren ab:• von der Nähe des Prognosezeitraums zum Beobachtungszeitraum
• von der Anzahl der Beobachtungen, die in die Trendberechnung einfließen
• von der Angemessenheit des Funktionstyps der Trendfunktion
• von der Streuung der Ursprungswerte um die TrendfunktionEs gibt verschiedene Methoden, eine Trendlinie zu ermitteln. Neben der Freihandmethode (manuelle Schätzung, Einzeichnen des Transverlaufs mit der Hand) sind dies die Methode der gleitenden Durchschnitte und die Methode der kleinsten Quadrate. Letztere ermittelt auf mathematischem Weg einen möglichen Trendverlauf.

Kurven- bzw. Liniendiagramme

Kurven- bzw. Liniendiagramme sind gut geeignet, um einen Entwicklungsverlauf abzubilden. Hierbei handelt es sich um eine große Anzahl von Daten aus ununterbrochenen Zeitreihen. Es können mehrere Datenreihen innerhalb eines Diagramms dargestellt werden, dennoch bleibt die Übersicht gewahrt. Bei dieser Diagrammart ist es jedoch nicht möglich, prozentuale Verhältnisse und kumulierte Gesamtmengen darzustellen. Ebenso problematisch ist es, dass nur den einzelnen Datenpunkten konkrete Werte zugeordnet werden, d. h. die Verbindungslinien dienen nur der Veranschaulichung. Eine Interpretation der Zwischenwerte ist im Regelfall sogar unzulässig. Auch bei dieser Diagrammart steht die x-Achse in den meisten Fällen für die unabhängige Variable Zeit und die y-Achse für die jeweilige abhängige Variable. Bei der Darstellung von mehreren Datenreihen ist die Verwendung von zwei y-Achsen möglich. Abbildung 5 zeigt ein Liniendiagramm.

Abb. 5: Ein Beispiel für ein Liniendiagramm

Abb. 5: Ein Beispiel für ein Liniendiagramm

 

Werden in einem Liniendiagramm zeitliche Entwicklungen (zum Beispiel die Veränderungen der Verkaufszahlen) dargestellt, so können zusätzliche Informationen gewonnen werden, wenn eine Zerlegung in die einzelnen Komponenten erfolgt. Es handelt sich dabei um eine Zeitreihenanalyse. Als Zeitreihe wird eine Datenreihe bezeichnet, wenn die erhobenen Werte nach den Erhebungszeitpunkten geordnet sind. Der zeitliche Abstand zwischen zwei Werten ist idealerweise konstant und wird als Periode bezeichnet. Abbildung 6 (linke Hälfte) zeigt ein Beispiel. Diese Zeitreihe weist neben einer grundsätzlichen Entwicklung (Trend) weitere – teilweise wiederkehrende – Elemente auf. Um diese zu bestimmen, ist die Datenreihe in ihre Bestandteile durch Dekomposition zu zerlegen. Das Ergebnis einer solchen Dekomposition für das Beispiel ist ebenfalls in Abbildung 6 (rechte Hälfte) dargestellt. Die Komponenten einer Zeitreihe lauten üblicherweise (aus „Marktforschung“):

• Trendkomponente: Diese beschreibt die grundsätzliche Entwicklung der Daten. Dabei handelt es sich meist auch um diejenige Entwicklung, welche primär interessiert. In unserem Beispiel ist die Trendentwicklung eindeutig linear ansteigend.
• Saisonkomponente: Daneben ist eine so genannte Saisonkomponente zu identifizieren, d. h. auf jedem höherem Niveau kommt es im Zeitablauf immer wieder zu regelmäßigen Schwankungen der Mengen.
• Konjunkturkomponente: Diese verläuft weniger regelmäßig als eine Saisonalität. Auch diese schwankt – in bestimmten Intervallen – um den Trend.
• Restkomponente: Diese erfasst – im Gegensatz zu den anderen Komponenten – die Summe der nicht erklärten Einflüsse und Störungen (Zufall, Interaktionen). Dabei wird für die Werte der Restkomponente oft angenommen, dass diese klein ausfallen und nicht systematisch um den Wert Null streuen. Die Restkomponente wird gelegentlich auch als Störkomponente bzw. Störvariable bezeichnet.

Abb. 6: Zeitreihenanalyse (links: gemessene Werte, rechts dekomponierte Werte), entnommen aus Olbrich, R.; Buhr, C.-C.; Battenfeld, D.: „Marktforschung“, Springer-Verlag, Berlin, Heidelberg, 2012

Abb. 6: Zeitreihenanalyse (links: gemessene Werte, rechts dekomponierte Werte), entnommen aus Olbrich, R.; Buhr, C.-C.; Battenfeld, D.: „Marktforschung“, Springer-Verlag, Berlin, Heidelberg, 2012

 

Die einzelnen Komponenten werden mithilfe der Regressionsanalyse bestimmt. Dabei kann in folgenden Schritten vorgegangen werden:

• Trend- und Konjunkturkomponente lassen sich oft kaum auseinanderhalten und werden daher gemeinsam als so genannte glatte Komponente geschätzt. Dazu wird angenommen, dass die saisonale Komponente und die Restkomponente eine Konstante darstellen.
• Danach wird versucht, die glatte Komponente in eine Trend- und eine Konjunkturkomponente zu zerlegen.
• Sind die Werte der glatten Komponente aus der Entwicklung aller Werte der Zeitreihe abgezogen, kann der saisonale Einfluss geschätzt werden. Der verbleibende Rest wird dem Zufall zugeordnet.

Flächendiagramme

Flächendiagramme (Abb. 7) sind ein Spezialfall der Kurvendiagramme. Die Linien werden übereinander gestapelt und zu einem Gesamtwert addiert. Der Gesamtwert wird durch die oberste Kurve definiert. Bei der prozentuellen Darstellung repräsentiert der Gesamtwert der übereinanderliegenden Flächen 100 Prozent. Diese Diagrammart eignet sich zur kombinierten Darstellung von Entwicklungsverläufen, die aus mehreren Einzelgrößen zusammengesetzt sind.

Abb. 7: Ein Beispiel für ein Flächendiagramm

Abb. 7: Ein Beispiel für ein Flächendiagramm

 

Kreissektoren- bzw. Tortendiagramme

Kreissektorendiagramme, auch als Torten- oder Kuchendiagramme bezeichnet, werden zur Darstellung einer prozentuellen Zusammensetzung einer Gesamtmenge angewendet (Teilwerte). Dabei kann durch einen Kreis nur ein einzelner Sachverhalt visualisiert werden; ggf. sind mehrere Kreissektorendiagramme notwendig. Maximal lassen sich zehn bis zwölf Teileinheiten in einem Kreis übersichtlich darstellen. Es besteht die Möglichkeit, prozentual kleinere Anteile in einem eigenen Kreissektorendiagramm detailliert abzubilden (Abb. 8). Die Kreissektoren werden nach bestimmten Winkelangaben unterteilt. Die Sektorengröße (Winkel) wird anhand folgender Formel errechnet, d. h. die Sektorengröße ist proportional zum Anteil am Gesamtmaß:

Winkel=(360°*Teilwert)/ Gesamtwert

Bei der Darstellung besteht die Option, die Kreissegmente voneinander abgetrennt darzustellen. Ringdiagramme – eine Sonderform von Kreissektorendiagrammen – ermöglichen die Darstellung und den Vergleich von mehreren Datenreihen (Abb. 9).

Abb. 8: Ein Beispiel für ein Kreissektorendiagramm mit Detaildarstellung

Abb. 8: Ein Beispiel für ein Kreissektorendiagramm mit Detaildarstellung

 

Abb. 9: Ein Beispiel für ein Ringdiagramm

Abb. 9: Ein Beispiel für ein Ringdiagramm

 

Spezielle Diagrammarten

Die folgenden Diagrammarten sind weniger geläufig, können jedoch eine interessante Abwechslung für die Visualisierung sein (Abb. 10):

• Netzdiagramm: Diese eignen sich, um Ausprägungen von Datenreihen unter Berücksichtigung von unterschiedlichen Kriterien abzubilden. Die miteinander verglichenen Objekte können dann sehr gut bezüglich des Erfüllungsgrads der einzelnen Kriterien beurteilt werden.
• Hoch-Tief-Diagramm: Dieser Diagrammtyp wird traditionell bei der Darstellung von Aktienkursen angewendet. Mithilfe von Hoch-Tief-Diagrammen werden Wertpaare oder -tripel dargestellt. So lässt sich der Kursverlauf anschaulich präsentieren. Senkrechte Striche präsentieren einzelne Tage, das obere Ende des Strichs steht für den Tageshöchstkurs und das untere Ende des Strichs für den tiefsten beobachteten Wert.
• Boxplott-Diagramm: Ein Boxplot-Diagramm (Box-Whisker-Plot) ist eine spezielle Darstellung der Häufigkeitsverteilung. Ein Boxplot hilft einen Eindruck über die Lage und Verteilung der Daten zu gewinnen.

Abb. 10: Weitere Diagrammarten (a: Netz-, b: Hoch-Tief-, c: Boxplott-Diagramm)

Abb. 10: Weitere Diagrammarten (a: Netz-, b: Hoch-Tief-, c: Boxplott-Diagramm)

 

Reportgeneratoren

Die Anforderungen aus der Praxis an den Softwareentwickler sind klar: Effektiv sollen ansprechende Geschäftsgrafiken mithilfe der Software erstellt werden können, sei es als Unterstützung für eine Präsentation oder als Vorlage bei der Entscheidungsfindung. Der technische Aspekt rückt dabei aus Sicht des Kunden in den Hintergrund. Für die Erledigung derartiger Aufgaben werden im Regelfall so genannte Berichtssysteme und Reportgeneratoren verwendet und in die eigene Anwendung „eingebaut“. Je nach Ausgestaltung, Konfiguration und geplantem Einsatzzweck kann der Empfänger der Daten eine eher passive (als Betrachter der vorstrukturierten und dann automatisch aufbereiteten Informationen) oder eine aktive Rolle (Auswahl der Daten) annehmen. Zu unterscheiden ist nach der Herkunft der Daten: Für aktuelle Berichte wird auf die operativen Datenbanken zugegriffen. Vergleichende Analysen basieren jedoch zunehmend auf Informationen, welche meist aus dem Data Warehouse eines Unternehmens stammen. Ein Data Warehouse enthält eine umfangreiche Datensammlung über längere Zeiträume. Die darin abgelegten Daten stammen aus verschiedenen operativen Datenbeständen und werden speziell für Analysezwecke gespeichert. Moderne Zugriffs- und Auswertungstechnologien (wie OLAP-Systeme) erlauben eine effektive Nutzung.

Für die Abfrage der Daten werden – je nach System – unterschiedliche Technologien angewendet. Klassisch ist es möglich, auf eine Abfragesprache (SQL) zurückzugreifen. Benutzerfreundlicher sind Abfragetools (Abfragegeneratoren), mit deren Hilfe die SQL-Ausdrücke leicht „zusammengeklickt“ werden können. Webbasierte Tools erlauben es ebenfalls, die gewünschten Informationen aus den Daten schnell zu ermittelen. Standardabfragen helfen bei der Auswahl. Derartige Hilfen sind natürlich hinsichtlich ihrer Konfigurierbarkeit begrenzt. Um einen speziellen Informationsbedarf zu stillen, kommt man an eigens formulierten Abfragen nicht vorbei.

Die Ausgabe der erstellten Berichte erfolgt üblicherweise direkt am Bildschirm (HTML). Daneben wird meist ein Export zum Beispiel in das Format PDF angeboten. Ist ein systemunabhängiger Datenaustausch notwendig, sollte man darauf achten, dass beispielsweise XML als Austauschformat unterstützt wird. Zusammenfassend lässt sich sagen, dass heute eine Reihe leistungsfähiger Berichts- und Reportgeneratoren zur Verfügung steht. Einfachere Tools helfen mit Standardauswertungen schnell weiter und können eine Vielzahl von Fragestellungen ohne zusätzliche Konfigurationsarbeit beantworten. Leistungsfähigere Werkzeuge erlauben eine sehr detaillierte Sicht auf die Daten und befriedigen auch die Ansprüche an ein fortgeschrittenes Auswertungskonzept, indem beispielsweise statistische Analysen möglich sind.

Fazit

Die Technik ist in diesem Artikel bewusst in den Hintergrund getreten. Wir haben uns mit der inhaltlichen Perspektive der Diagrammerstellung – zum Beispiel für die Auswahl, Konfiguration und Integration eines Berichtswesens – in die eigene Software beschäftigt. Die Kenntnis grundlegender Zusammenhänge ist notwendig, um die Kunden in diesen Bereichen bestmöglich zu beraten. Dazu muss man sich mit den zu verwaltenden und zu analysierenden Daten auseinandersetzen (Problemverständnis). Grundlegende Kenntnisse der Datenanalyse (Prognoseverfahren, Trendberechnung, Zeitreihenanalyse) sind hilfreich, um die von den Generatoren und Bibliotheken angebotenen Verfahren richtig anzuwenden.

Aufmacherbild: Bar graph and pie chart on tablet pc – Business statistic concept von Shutterstock / Urheberrecht: Sashkin

Unsere Redaktion empfiehlt:

Relevante Beiträge

Meinungen zu diesem Beitrag

X
- Gib Deinen Standort ein -
- or -