Vorhersagen aus Daten treffen: Gar nicht so unwahrscheinlich!

Der Blick in die Glaskugel: Predictive Analytics in Theorie und Praxis
Keine Kommentare

Predictive Analytics ist derzeit eines der wichtigsten Anwendungsgebiete von Big Data. Es handelt sich um eine Teildisziplin von Business Analytics, die da ansetzt, wo OLAP oder Reporting aufhören. Statt nur die bestehende Situation zu analysieren, versucht Predictive Analytics mithilfe von Datenmodellen Vorhersagen über mögliche Ereignisse in der Zukunft zu treffen. Dabei besteht eine enge Verbindung zum Data Mining.

Das Datenaufkommen in Unternehmen und im privaten Bereich ist bereits heute gigantisch. Mobile Geräte wie Smartphones sammeln unaufhörlich Daten über alle möglichen Umweltzustände. Bei Surfen im Internet hinterlässt jeder von uns einen unendlich langen digitalen Trampelpfad. Das Internet der Dinge (IoT) verspricht eine umfassende Vernetzung aller uns umgebender Alltagsgeräte und Produktionswerkzeuge. Gleichwohl muss sich die moderne Wissensgesellschaft die Frage gefallen lassen, ob wir all diese Daten auch wirklich aktiv nutzen oder das verwertbare Wissen dadurch größer geworden ist. Die Beantwortung dieser Frage ist nicht trivial. Korrekt ist, dass die heutigen Möglichkeiten zur Datenauswertung, zur Verdichtung der Daten zu Informationen und somit zur Generierung von Wissen daraus, so groß sind, wie noch nie zuvor. Richtig ist aber auch, dass dieses neue Wissen, das aus den versteckten Zusammenhängen in den Daten besteht, nicht von alleine vor unserem geistigen Auge auftauchen. Wir müssen danach forschen, um es an die Oberfläche zu holen. Wir müssen versuchen, Muster in der Datenwelt zu erkennen. Im letzten Schritt müssen diese Muster dann auch richtig interpretieren werden.

Genau in diese Richtung stößt Predictive Analytics. Dabei handelt es sich um den Versuch, Vorhersagen für das künftige Verhalten von Menschen oder den Eintritt von bestimmten Ereignissen zu treffen. Das ist ein hochspannendes Thema, das das Potenzial hat, die Arbeitsweise in vielen Lebensbereichen nachhaltig zu beeinflussen und zu verändern. Die zugrundeliegenden Methoden werden dabei interdisziplinär entwickelt. Im Zentrum steht das neue Berufsbild des Data Scientist. Benötigt werden umfangreiche Kenntnisse aus den Bereichen Datenauswertung, Datenbanken, mathematischer und statistischer Modelle und natürlich der Softwareentwicklung. Gleichgültig, in welcher konkreten Rolle man sich wiederfindet, ist ein Verständnis der grundsätzlichen Vorgehensweise stets notwendig.

Einen kompakten Einstieg in das Thema möchten wir mit diesem Artikel liefern. Dazu beleuchten wir die theoretischen Hintergründe und schauen, welche Gemeinsamkeiten und Unterschiede sich zu anderen Trendthemen wie Business Intelligence oder Business Analytics ergeben. Dann stellt sich aber auch schnell die Frage: Und was kann man in der Praxis damit anfangen? Wir untersuchen anhand von Beispielen, welche Anwendungen schon heute von Predictive Analytics profitieren können und wo es bereits angewendet wird. Ist das für uns Softwareentwickler interessant? Ja, mehr als das! Zukünftig werden wir datenbasierte Anwendungen mit entsprechenden Methoden ausstatten müssen, vorrangig durch einen Zugriff auf die Cloud. Um das zu meistern, ist es mehr als hilfreich, mit dem Thema vertraut zu sein.

Predictive Analytics: kurz und knapp

Predictive Analytics beschäftigt sich vor allem mit der Vorhersage (engl. prediction) der wahrscheinlichen Zukunft. Ein Beispiel: Die Idee besteht darin, dass dank derartiger Analysen Unternehmen schon vorher wissen, wie Kunden höchstwahrscheinlich reagieren werden. Welche Produkte werden Sie kaufen? Welchen Preis sind sie bereit, dafür zu zahlen? Wann werden Sie ihr Kaufinteresse beim Händler ihrer Wahl kundtun? Mit diesen Informationen kann der Händler besser disponieren. Er kann die richtigen Produkte auf Lager bereithalten. Die Kundenzufriedenheit wächst und Umsätze können gesteigert werden. Treffen die Vorhersagen zu, ist das ein Hilfsmittel, um im Wettbewerb zu bestehen oder sich sogar von der Konkurrenz abzusetzen. Zu anderen Anwendungen von Predictive Analytics kommen wir später.

Wie funktioniert das? Menschen können nicht in die Zukunft schauen! Ist das Hexerei? Eindeutig nicht! Es gibt Methoden, die es ermöglichen, aus den Daten der Vergangenheit zukünftige Trends und Entwicklungen vorherzusagen. Bitte beachten Sie: Bei Predictive Analytics geht es nicht nur darum, die relevanten Daten zu sammeln, sondern vielmehr darum, diese zu analysieren und daraus die richtigen Schlüsse zu ziehen und entsprechend zu entscheiden und zu handeln. Personen, die sich in der Vergangenheit mit Fragen der Marktforschung und der schließenden Statistik beschäftigt haben, werden an dieser Stelle berechtigt einwenden, dass die zugrundliegenden Verfahren der Datenauswertung und der daraus folgenden Analysen nicht neu sind. Das ist richtig. Neu sind jedoch die Möglichkeiten, die entsprechenden Daten auch zur Verfügung zu haben und auf diese zugreifen zu können. Mussten bisher für die Beantwortung einzelner Fragestellungen oft teure Primärerhebungen durchgeführt werden, so haben wir heute viele Daten schon ohne weiteres Zutun zur Hand. Massendatenbanken, Daten von sozialen Plattformen und Daten von IoT-Geräten sind nur einige Beispiele. Diese Daten warten nur auf eine Analyse, eine so genannte Sekundäruntersuchung.

Es ist eine Tatsache, dass Predictive Analytics im Zuge der Digitalisierung immer mehr an Bedeutung gewinnt und damit sogar zu einem Impulsgeber von Innovation wird. Data Mining ist die Basis, auf der Predictive Analytics basiert. Regressionsanalysen, Clustering, neuronale Netze und Assoziationsanalysen sind die klassischen Methoden des Data Minings. Predictive Analytics nutzt darüber hinaus auch statistische Berechnungen, maschinelles Lernen, künstliche Intelligenz (KI), Elemente der Spieltheorie sowie Methoden des Operations Research, wie Optimierungsrechnungen und Simulationsverfahren. Eine ganze Menge Mathematik, Statistik, Linguistik, Text Mining und Textanalytik stecken hinter dem unscheinbaren Begriff Predictive Analytics.

Predictive Analytics als Teilbereich von Business Intelligence

Predictive Analytics als Teilbereich von Business IntelligencePredictive Analytics wird als Teilbereich von Business Intelligence (BI) angesehen. Wo hört BI auf und wo beginnt Predictive Analytics? BI beinhaltet eine Reihe von Architekturen und Technologien, die Rohdaten in aussagekräftige und nützliche Informationen verwandeln. Zusammengefasst umfasst sie Verfahren zur systematischen Sammlung, Auswertung und Darstellung von Daten. Ebenso bieten BI-Werkzeuge eine große Hilfe für die Interpretation von umfangreichen Datensammlungen. Business Analytics beinhaltet Abfragen, Reporting und Online Analytical Processing (bekannt als OLAP). BI liefert hauptsächlich Antworten auf Fragen der folgenden Art:

  • Was ist passiert: „Welche Produkte wurden vorrangig von welchen Kunden gekauft?“
  • Wie oft ist ein bestimmter Zusammenhang eingetreten: „Welche Produkte wurden in der Vergangenheit, beispielsweise vor dem Weihnachtsfest, besonders stark nachgefragt?“

Bei BI geht es also hauptsächlich um die Erstellung und Wartung von Datenlagern. Auf diese Weise können operative und strategischen Entscheidungen besser vorbereitet werden. Die Anwendung von BI stellt oft eine gute Basis dar, um Unternehmensziele schneller zu erreichen. Geschäftsabläufe können auf diese Weise profitabler und Kosten gesenkt, Risiken minimiert und insgesamt die Wertschöpfung verbessert werden. Wichtig ist jedoch, dabei nicht zu vergessen, dass sich die üblichen Methoden der BI zunächst lediglich auf Daten aus der Vergangenheit konzentrieren. Welche Entscheidungen man daraus ableitet, d. h. auf welche Art und Weise man die Daten in die Zukunft fortschreibt oder welche Schlussfolgerungen man daraus ableitet, das wird den Anwendern von BI in der Regel selbst überlassen.

ML Conference 2018

Making Enterprises Intelligent with Machine Learning

with Dr. Sebastian Wieczorek (SAP)

Machine Learning 101++ using Python

with Dr. Pieter Buteneers (Robovision)

Predictive Analytics geht einen entscheidenden Schritt weiter. Der Begriff Predictive Analytics ist auf das Erstellen von Prognosen ausgerichtet und eng mit dem Begriff Advanced Analytics verbunden (Kasten: „Begriffsabgrenzungen“). Darunter versteht man eine automatische Entdeckung von Mustern in strukturierten und unstrukturierten Daten. Es bedeutet, dass man über die Grenzen von BI hinausgeht. Die Frage lautet nicht mehr „Was ist passiert?“, sondern „Was wird passieren?“. Es ist der Versuch, die Zukunft vorherzusagen. Das kann das Verhalten von Individuen oder Gruppen oder das Eintreten von bestimmten Ereignissen betreffen. Anders formuliert geht es um die die Optimierung, die Korrelation und die Prognose der Next Best Action oder der wahrscheinlichsten nächsten Aktion.

Begriffsabgrenzungen
Die Begriffe rund um die modernen und erweiterten Analysetechniken werden nicht immer eindeutig und überschneidungsfrei verwendet. Die folgenden knappen Definitionen sollen bei der Einordnung helfen:

  • Predictive Analytics beschäftigt sich mit der Wahrscheinlichkeit des Eintritts eines möglichen zukünftigen Ereignisses.
  • Prescriptive Analytics geht ein Schritt weiter als Predictive Analytics und liefert Vorschläge, die auf Predictive Analytics basieren. Diese Analyseform liefert zusätzliche Erklärungen, warum ein Ereignis in der Zukunft eintreten wird und Empfehlungen, wie man auf ein solches Ereignis reagieren soll.
  • Descriptive Analytics beschäftigt sich, im Gegensatz zu Prescriptive Analytics, mit der Vergangenheit. Das Ziel ist, aus den vergangenen Ereignissen zu lernen um somit bessere Entscheidungen in der Zukunft zu treffen.
  • Advanced Analytics: Dazu gehören Verfahren wie Predictive Analytics, Data Mining, Big-Data-Analyse und Location Intelligence. Es handelt sich also um einen Überbegriff für verschiedene Analysemethoden, um Informationen aus Daten zu filtern und damit die Basis für Wissen zu legen.

Für Predictive Analytics benötigt man Software. Software, die mit Massendaten umgehen kann. Vieles davon passiert heute in der Cloud. Zur Auswertung der Daten und zur Generierung der Muster werden also Services von KI-Anbietern und anderen Dienstleistern genutzt. Abbildung 1 zeigt eine Klassifizierung von BI-Software anhand der Dimensionen Komplexität und Freiheitsgrade für die Anwender. Sichtbar wird unmittelbar, dass Standard-Reporting-Tools einfach anzuwenden sind, jedoch kaum Gestaltungsmöglichkeiten bieten, um die Analysen einer speziellen Fragestellung anzupassen. Den größten Spielraum eröffnen spezielle Tools für Advanced und Predictive Analytics. Ihre Komplexität ist aber auch um ein Vielfaches höher. Die Anwender müssen die Zusammenhänge verstehen, um mithilfe dieser Tools neues Wissen zu Tage zu fördern.

Predictive Analytics in der Praxis

Bevor wir der Technik und den Verfahren auf den Grund gehen, sehen wir uns weitere Anwendungsgebiete von Predictive Analytics an. Neben dem Beispiel aus der Einleitung, d. h. der Vorhersage des künftigen Kaufverhaltens von Kunden, findet der Ansatz bereits heute wie folgt Anwendung [vgl. 4]:

  • Betrugserkennung: Das Spektrum ist breit und reicht von der Identifikation einer doppelt gestellten oder fehlerhaften Rechnung bis hin zu Manipulationen in Bilanzen. Speziell entwickelte Algorithmen zielen darauf ab, diese Unregelmäßigkeiten automatisch zu erkennen.
  • Identifikation von unzufriedenen Kunden: Es geht darum, die Abwanderung von Kunden mit einer angepassten Preisfestsetzung oder neuen Angebotspaketen gezielt zu verhindern. Ein Beispiel: Ein Kunde, der häufig im Callcenter eines Mobilfunkanbieters anruft, wird als „gefährdet“ identifiziert. Mit speziellen und für ihn zugeschnittenen Angeboten wird versucht seine „Abwanderung“ zu verhindern.
  • Vorhersage des Wartungszeitpunktes von Geräten und Maschinen: Dieser Anwendungsfall ist auch unter dem Stichwort Predictive Maintenance bekannt. Das Motto lautet: „[D]ie ausfallbedingte Instandsetzung durch eine vorbeugende Instandhaltung zu ersetzten“. Spezielle Algorithmen versuchen ständig durch die Einbeziehung historischer Daten das Verhalten der betreffenden Maschinen zu analysieren und zu überwachen. Der bestmögliche Zeitpunkt für die nächste Inspektion wird berechnet und dieser Termin soll möglichst vor dem wahrscheinlichen Ausfall der Maschine liegen. Die Wahl des Termins sollte aber auch intelligenter ausfallen als diesen lediglich durch Zeitablauf oder Produktionsmenge zu bestimmen. Hintergrund: Sowohl ein Maschinenausfall als auch eine zu frühe Wartung kosten unnötig Zeit und verursachen damit vermeidbare Kosten.
  • Verringerung des Ausschusses: Wir sprechen hier von Predictive Quality. Das Ziel besteht darin, fehlerhafte Produkte frühzeitig zu identifizieren und aus dem Produktionsprozess herauszunehmen. Hier geht es um ein vorausschauendes Qualitätsmanagement.
  • Identifikation des Upselling-Potenzials: Aus dem bisherigen Verhalten eines Kunden wird durch den Einsatz von Algorithmen das individuelle Potenzial für den Verkauf weiterer Produkte an diesen Kunden berechnet. Damit gelangt man zu Antworten auf die folgenden Fragen: Bei welchen Kunden lohnt sich ein Anruf? Welche Kunden reagieren wahrscheinlich besser auf Briefe und bei wem ist man mit einer E-Mail erfolgreicher?

Eine weitere interessante Anwendung von Predictive Analytics sind Smart-Apps (Kasten: „Smart Apps mit Predictive Analytics“).

Smart-Apps mit Predictive Analytics

Was sind Smart-Apps? Smart-Apps zeigen dem Nutzer Informationen passend zum Kontext an. Grundsätzlich existieren zwei Möglichkeiten, eine App smart zu machen:

  • Die grafische Anpassung der Benutzeroberfläche an den Nutzerkontext, z. B. große und eindeutige Symbole für Kinder. In diesem Fall ist die Benutzeroberfläche vom Entwickler vorgegeben und bleibt statisch.
  • Die inhaltliche Anpassung der App: Die Möglichkeiten der App verändern sich von Nutzer zu Nutzer. So bietet die App beispielsweise unterschiedliche situationsbedingte Bedienfolgen.

In beiden Fällen ist die Benutzerfreundlichkeit ein zentrales Ziel. Mithilfe von Predictive Analytics versucht man eine noch weitergehende Anpassung vorzunehmen, also das Verhalten des Nutzers vorherzusagen und damit die Nutzerfreundlichkeit zu verbessern. Ein Beispiel: Melanie Müller kauft regelmäßig am Freitagabend mithilfe einer Reise-App ein Ticket zweiter Klasse von Hamburg nach Berlin. Ein Vorschlag für eine smartere App mit Vorhersagefunktion lautet: Die App überprüft anhand der Geolocation, ob sich Melanie Müller am Freitagabend wieder in der Nähe des Hamburger Hauptbahnhofs befindet. Falls ja, wird der Kundin eine längere Interaktion in der App mit mehreren Buchungsschritten erspart und die App bietet sofort eine Option für den Kauf des Bahntickets von Hamburg nach Berlin mit einem Klick an. So wird der Ticketkauf nutzerindividuell gestaltet. Die Faktoren Wochentag, Uhrzeit und Geolocation sind Auslöser für den konkreten „smarten“ Vorschlag.

Die Nutzung in der Praxis

Natürlich stellt sich die Frage, wie oft und in welchem Ausmaß Predictive und Advanced Analytics bereits heute tatsächlich in der Praxis eingesetzt werden. Die BARC-Anwendungsstudie liefert folgende in Abbildung 2 dargestellten Ergebnisse.

Abb. 2: Heutige Nutzung von Predictive und Advanced Analytics [3]

Abb. 2: Heutige Nutzung von Predictive und Advanced Analytics

Das Ergebnis kommentieren wir wie folgt: Wir sind noch am Anfang. Laut der Studie sind es nur 10 Unternehmen bzw. 5 Prozent der 210 befragten Unternehmen, die Advanced und Predictive Analytics häufig nutzen. Fast 45 Prozent der befragten Unternehmen planen kurz- bzw. langfristig die Nutzung derartiger fortgeschrittener Analysen. Interessanterweise schätzen fast alle befragten Unternehmen Predictive und Advanced Analytics für die Zukunft als sehr wichtig ein und wollen demnächst Schritte in diese Richtung gehen. Die Einsatzbereiche liegen vor allen in folgenden Bereichen: Finanzen, Controlling, IT und Management. Weitere denkbare Einsatzfelder sind Marketing, Vertrieb, Forschung und Entwicklung, Logistik, Produktion, Beschaffungs- und Personalwesen. Im nachfolgenden Abschnitt geben wir einen kurzen Einblick in die Technologie von Predictive und Advanced Analytics.

Die Rolle von Big Data

Man hat schon oft von Big Data gehört. Jeder spricht darüber, jedoch ist die Einordnung und Bedeutung oft nicht klar. Und was hat Big Data mit Predictive Analytics zu tun? Alles der Reihe nach! Der Begriff Big Data steht für zwei Aspekte: Zum einen geht es um die immer schneller wachsenden Berge diverser Daten und zum anderen handelt es sich um IT-Lösungen und Systeme, die den Unternehmen Hilfe bieten, um diese Datenflut zu bewältigen. Aufgrund der zunehmenden Komplexität der Datenstrukturen gelangen die klassischen Business-Intelligence-Strukturen an ihre Grenzen und Unternehmen stehen vor neuen Herausforderungen. Zum ersten Mal wurde der Begriff im Jahr 2001 von Douglas Laney eingeführt. Laney selbst definiert Big Data als „Daten mit großem Volumen, großer Vielfalt an Datenformaten und einer großen Geschwindigkeit der Datenentstehung.“ Big Data ist damit mehrdimensional zu verstehen und bezieht sich eben nicht nur auf die vielfach angenommene Menge der zu verarbeitenden Daten. Wir können Big Data daher anhand der folgenden fünf Dimensionen beschreiben (Abb. 3):

  1. Datenmenge: Nicht nur die Datenmenge, die von außen in das Unternehmen einfließt, wächst, sondern auch die Menge an selbst erzeugten Daten. Als Big Data werden somit diejenigen Datensätze bezeichnet, deren Größe die Fähigkeiten der typischen Datenbanksoftware übersteigt.1. Datenmenge: Nicht nur die Datenmenge, die von außen in das Unternehmen einfließt, wächst, sondern auch die Menge an selbst erzeugten Daten. Als Big Data werden somit diejenigen Datensätze bezeichnet, deren Größe die Fähigkeiten der typischen Datenbanksoftware übersteigt.
  2. Datenvielfalt: Die Daten stammen heutzutage aus unterschiedlichsten Quellen. Somit sind auch die Datenstrukturen und die Formate sehr vielfältig. Es gibt verschiedene Sprachen, es sind Text- und Bilddateien, es sind Daten von unterschiedlichen Eingabesystemen und Applikationen. Dabei mischen sich zunehmend strukturierte und unstrukturierte Daten.
  3. Geschwindigkeit: Für die Unternehmen spielt es eine große Rolle, wie schnell die Daten ausgewertet werden können. Die Auswertung in Echtzeit hilft, sich strategische Wettbewerbsvorteile zu verschaffen.
  4. Datenquellen: Die Datenherkunft ist ebenso ein wichtiger Aspekt von Big Data. Es wird geprüft, welche Daten im Unternehmen bereits vorhanden sind und welche davon bereits aktiv genutzt werden. Die Nichtnutzung vorhandener Daten kann eine Ressourcenverschwendung bedeuten.
  5. Komplexität: Eine enorme Rechnerleistung ist erforderlich, um polystrukturierte Daten zu analysieren.

Wie ersichtlich ist, stellt Big Data eine enorme Herausforderung für Unternehmen dar. In diesem Sinne ist Big Data Aufgabe und Chance gleichermaßen und stellt die Grundlage für die Anwendung fortgeschrittener Analysemethoden dar, wie wir sie hier beschreiben. Big Data wird in den unterschiedlichsten Bereichen eingesetzt. Ein Beispiel gefällig? Die Google-Grippe-Trends sind ein Projekt, das im Jahr 2008 von Google gestartet wurde und leider heutzutage nicht mehr unterstützt wird. Die Idee war, dass von der Grippe betroffene Personen oft nach entsprechenden Begriffen und Symptomen im Internet suchen. Dadurch konnte Google die vorliegende Grippeverteilung schätzen. Neben dem Suchbegriff wurden auch der Zeitpunkt und der Ort der Suchanfrage berücksichtigt. So konnte tagesaktuell eine Trendkarte für die Ausbreitung der Grippe für mehr als 25 Länder erstellt werden. Solche Informationen waren schneller verfügbar als Daten aus institutionellen Beobachtungsprogrammen, Maßnahmen zur Prävention und Bekämpfung der Grippe konnten schon frühzeitig eingesetzt werden. Heute findet man im Internet keine aktuellen Daten mehr, sondern nur Werte aus der Vergangenheit.

Predictive Analytics und ähnliche Analysemethoden können direkt auf Big Data aufsetzen, d. h. die vorliegende Datenvielfalt in Menge und Struktur bildet die Ausgangsbasis für weitergehende Datenanalysen. Nicht immer kann man beide Ansätze, also Big Data und Predictive Analytics, genau voneinander abgrenzen. Die Übergänge sind fließend, wobei der Schwerpunkt der Predictive Analytics auf der Interpretation der Daten für die Zukunft liegt.

Die technische Umsetzung von Predictive Analytics

Es existiert eine Reihe von Softwareprodukten aus denen Unternehmen bei der Umsetzung von Analysen auf Basis von Predictive Analytics wählen können. Diese lassen sich in die folgenden vier Klassen unterteilen:

  • Anwendungsspezifische Lösungen: Es handelt sich hauptsächlich um vorgefertigten Masken, vordefinierten Modelle sowie um Prozesse zur Nutzung out of the box. Neben den für den Anwendungsfall notwendigen Algorithmen und Verfahren sind es auch fachbereichsspezifische Benutzeroberflächen. Auf dem Softwaremarkt werden diverse Werkzeuge mit vordefinierten Vorlagen, Inhalten und entsprechenden Benutzeroberflächen angeboten. Die anwendungsspezifischen Lösungen stoßen jedoch an ihre Grenzen, wenn die Anzahl von Kennwerten zu hoch ausfällt oder wenn neue fallspezifische Variablen erzeugt werden müssen. In diesem Fall entsteht ein Bedarf zur Weiterentwicklung und Erweiterung dieser Tools.
  • BI-Werkzeuge mit Advanced-Analytics-Funktionen: Hier werden Anweisungen mithilfe von Formeleditors und Algorithmenbibliotheken eingesetzt. Ebenso werden Statistiksprachen und -modelle integriert. BI-Werkzeuge werden also um die Methoden der Predictive Analytics erweitert.
  • Data-Mining-Software: Es werden Entwicklungsumgebungen zur Erstellung individueller Data-Mining-Modelle verwendet. Ebenso kommen Algorithmenbibliotheken und Statistiksprachen zum Einsatz.
  • Generische Entwicklungsumgebungen: In diesem Fall werden generische Entwicklungsumgebungen zur Entwicklung individueller Anwendungen genutzt. Es handelt sich um die Integration oder die Ansteuerung von Statistikmodulen. Dieser Ansatz bietet zweifelsfrei die meisten Optionen, ist jedoch auch sehr aufwendig und verlangt umfassende Kenntnisse der dahinterstehenden Methoden.

Die Umsetzung von Predictive Analytics mithilfe von Erweiterungen von BI-Software und Data-Mining-Werkzeugen ist heute die am weitesten genutzte Technologie. Jedes zweite Unternehmen nutzt diese Variante.

Tools für Predictive Analytics

Laut einer Aufstellung von Predictive Analytics Today heißen die Top-20-Predictive-Analytics-Softwaretools RapidMiner Studio, KNIME Analytics Platform, IBM Predictive Analytics, SAP Predictive Analytics, Dataiku DSS, SAS Predictive Analytics, Oracle Data Mining, Angoss Predictive Analytics, Microsoft R, Minitab, Microsoft Azure Machine Learning, TIBCO Spotfire, STATISTICA, Anaconda, Google Cloud Prediction API, AdvancedMiner, DataRobot, Alteryx Analytics, ABM und HP Haven Predictive Analytics. Ein paar Informationen zu ausgewählten Tools haben wir in Tabelle 1 zusammengestellt.

Name Beschreibung
RapidMiner Studio Eine Umgebung für maschinelles Lernen und Data Mining, sie beinhaltet mehr als 500 Operatoren für alle Aufgaben der Wissensentdeckung in Datenbanken. RapidMiner wurde in Java geschrieben und kann auf allen gängigen Betriebssysteme verwendet werden.
KNIME Analytics Platform KNIME ist die Abkürzung für „Konstanz Information Miner“. Es handelt sich um eine freie Software für die interaktive Datenanalyse. Sie ist modular aufgebaut (Pipelining-Konzept) und ermöglicht daher die Integration zahlreicher Verfahren des maschinellen Lernens und des Data Minings.
IBM Predictive Analytics Ein von der IBM entwickeltes Tool, das aus dem IBM SPSS Modeller und IBM SPSS Statistics besteht. IBM SPSS Modeller ist die Plattform für vorausschauende Analysen, die Vorhersageinformationen für Entscheidungen bereitstellt. IBM SPSS Statistics übernimmt die ganze Palette der Aufgaben von Planung über Datenerfassung und -analyse bis hin zu Berichterstellung und Implementierung.
SAP Predictive Analytics Ein von SAP entwickeltes Tool für Predictive Analytics. SAP Predictive Analytics umfasst die Automatisierung der Datenaufbereitung, Erstellung von Prognosemodellen, Nutzung der erweiterten Visualisierungsfunktionen und den Einsatz von Predictive Scoring für eine Vielzahl unterschiedlicher Zielsysteme.

Tabelle 1: Überblick über Predictive Analytics Tools

Fazit

Daten, Daten und nochmals Daten. Daten sind das Kapital wissensbasierter Unternehmen. Sie bilden die Basis für gute unternehmerische Entscheidungen und können zu einem Wettbewerbsinstrument werden. Fortgeschrittene Analysen wie Predictive Analytics versuchen die Zukunft vorauszusagen. Die Basis dafür ist die sorgfältige Analyse bisherigen Verhaltens. Dabei darf man nicht vergessen, dass dieser Ansatz nur dann funktioniert, wenn auch tatsächlich Muster in den Datenstrukturen enthalten sind. Bei vielen Naturphänomenen und Verhaltensweisen von Individuen und Gruppen ist das mit Sicherheit der Fall. Unser Verhalten ist daher oft besser vorherzusagen als wir glauben. Dennoch ist der letzte Schritt stets der gesunde Menschenverstand, denn jede Vorhersage ist und bleibt eine statistische Analyse.

Predictive Analytics arbeitet stets mit vielfältigen Daten aus unterschiedlichen Quellen. Oft kommen dabei auch personenbezogene Daten zum Einsatz. Nicht immer sind die ermittelten Zusammenhänge für alle Augen bestimmt. Unternehmen, die in Predictive Analytics einsteigen, dürfen dabei den Datenschutz niemals außer Acht lassen. Nicht alles, was geht, ist erlaubt und schon gar nicht ethisch vertretbar.

[smartblockm id=150695]

Unsere Redaktion empfiehlt:

Relevante Beiträge

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu:
X
- Gib Deinen Standort ein -
- or -