Die Technologie hinter Bundesliga Match Facts xGoals

Machine Learning auf AWS bringt Datenanalysen ins Fußballspiel
Keine Kommentare

Das kennt jeder Fußballbegeisterte: Ein Spieler schießt „das Traumtor“ und Publikum sowie Kommentatoren diskutieren sofort, wie schwierig es war, den Treffer zu erzielen. Bisher ließ sich diese Frage aufgrund des Gesehenen nur ungefähr beantworten. Dabei berücksichtigten die Betrachter vielleicht noch zu einem gewissen Grad die Zahl der Verteidiger um den Torschützen, die Position des Torhüters oder den Schusswinkel. Mit den Analysen von xGoals (kurz für „Expected Goals“), eines der Bundesliga Match Facts powered by AWS, lässt sich nun der Grund für das Staunen in Zahlen ausdrücken. xGoals zeigt dem Fußballfan exakt, wie hoch die Wahrscheinlichkeit ist, aus einer spezifischen Situation heraus ein Tor zu erzielen – für jede potenzielle Schussposition auf dem Spielfeld.

In jeder Begegnung der 1. und 2. Bundesliga sammelt die Deutsche Fußball Liga (DFL) über 3,6 Millionen Datenpunkte, um das Geschehen auf dem Spielfeld eingehend zu analysieren. Erklärtes Ziel ist es, die innovativste Sportliga der Welt zu sein. Deshalb soll die Berichterstattung für über 500 Millionen Bundesligafans und weltweit über 70 Medienpartner weiterentwickelt werden. Die DFL nutzt Technologien von Amazon Web Services (AWS), um dem Zuschauer auf Machine Learning (ML) basierende Echtzeitstatistiken zu präsentieren.

Im Mai 2020 wurden die ersten beiden Bundesliga Match Facts „xGoals“ und „Realformation“ erstmalig im Live-TV ausgestrahlt. xGoals verwendet für den Aufbau, die Entwicklung und den Einsatz von ML-Modellen den vollständig verwalteten Dienst Amazon SageMaker. xGoals bewertet objektiv die Chancen für einen Torerfolg und zeigt beispielsweise auf, ob ein Pass zu einem besser positionierten Mitspieler eine vielversprechendere Einschussmöglichkeit eröffnet hätte.

xGoals: Torwahrscheinlichkeiten quantifizieren

Das Angebot feierte seine Premiere am 26. Mai 2020 im vorentscheidenden Spiel um die deutsche Meisterschaft zwischen Borussia Dortmund und dem FC Bayern München. Hier gelang Joshua Kimmich ein außergewöhnlicher Abschluss. Unter Berücksichtigung der Entfernung und des Winkels zum Tor, der Anzahl der den Schützen umgebenden Spieler sowie anderer Faktoren lag die Wahrscheinlichkeit für einen Treffer bei lediglich 6 Prozent.

Das ML-Modell von xGoals erzeugt einen Wahrscheinlichkeitswert für den Torerfolg, der zwischen 0 und 1 liegt. Dieser wird dann in Prozent angegeben: Für das Verwandeln eines Elfmeters liegt der xGoals-Wert bei 0,77 und die Torwahrscheinlichkeit damit bei 77 Prozent.

Am Ende jeder Partie werden in einer Übersicht die xGoals-Werte – und damit eine objektive Statistik der Torchancen – gezeigt. Zwischen Dortmund und Bayern wäre demnach – ohne den erfolgreich verwandelten Torschuss von Kimmich – ein Unentschieden am wahrscheinlichsten gewesen. Solche aufschlussreichen Zusatzinformationen binden die Fans an den Fernsehsender und helfen ihnen, das Potenzial des einzelnen Profis oder der Mannschaft im Spiel sowie über die ganze Saison hinweg zu bewerten.

Angesichts der sich sehr schnell verändernden Situationen beim Torschuss ist ein xGoals-Wert von über 70 Prozent nur verhältnismäßig schwer zu erreichen. Denn Fußballer wechseln permanent die Position und müssen Entscheidungen in Sekundenbruchteilen treffen. Da sie dabei nur über relativ eingeschränkte Informationen über das Gesamtgeschehen auf dem Fußballfeld verfügen, vertrauen sie zumeist auf ihre Intuition. Und selbst wenn ein Stürmer sich in unmittelbarer Nähe zum Tor befindet, können sich die Erfolgsaussichten stark unterscheiden. Um eine Voraussage zu treffen, ist eine datenbasierte, holistische Betrachtung der Ereignisse auf dem Spielfeld nötig – einschließlich der Positionen anderer Akteure. Nur wenn möglichst alle relevanten Informationen in das xGoals-ML-Modell einfließen, lassen sich akkurate Prognosen erstellen.

Die Daten geben die Vorlage

Für die Produktion der Bundesliga Match Facts laufen vor, während und nach dem Spiel verschiedene komplexe Prozesse ab. Zahlreiche Akteure beteiligen sich an der Erhebung und Verarbeitung von Informationen, erstellen Grafiken oder andere Inhalte – etwa TV-Feeds – oder kommentieren live. In jedem Stadion verfolgen bis zu 20 Kameras die Position des Balles und der Spieler. Ein Redaktionsteam verarbeitet zusätzliche Videodaten und wählt die geeigneten Kameraeinstellungen sowie Ausschnitte. Außerdem bestimmt es, wann die Bundesliga Match Facts eingeblendet werden.

Fast alle Spielszenen vom Elfmeter bis zum Torschuss werden live dokumentiert und an die DFL-Systeme für die Fernüberprüfung übermittelt. Menschliche Betrachter kategorisieren das Geschehen und fügen situationsspezifische Informationen hinzu. Dazu gehören zum Beispiel Annotationen von Spielern und Teams oder die jeweilige Schussart – etwa Blocken oder Zuspiel.

Schließlich werden sämtliche Rohdaten in das Bundesliga-Match-Facts-System auf AWS eingespeist, um die xGoals-Werte zu berechnen und anschließend weltweit an kooperierende Medienpartner und Fernsehsender für die Live-Übertragung zu verteilen. Eine Echtzeitverteilung dieser Inhalte spielt gerade in Zeiten von Geisterspielen eine wichtige Rolle bei der Zuschauerbindung. Denn leere Ränge beeinflussen die persönliche Erfahrung des Fans beim Verfolgen eines Spiels.

Der Machine Learning Entwicklungsprozess: Vom Code zum Produktivbetrieb

Die Führungsspitze der DFL, Entwickler sowie das Management arbeiteten Hand in Hand mit dem AWS Professional Services Team zusammen, um ein cloudbasiertes, auf ML beruhendes Zuschauerangebot zu verwirklichen.

AWS-Data-Science-Berater haben dabei die Aufgabe, durch die effektive Verwendung von ML die Realisierung von Geschäftszielen zu beschleunigen. Nach einer initialen Bestandsaufnahme sowie Erhebung und Evaluation gewünschter Ergebnisse folgt die genauere Analyse der betriebswirtschaftlichen und technischen Machbarkeit. Berater von AWS Professional Services ergänzen mit ihren spezialisierten Fähigkeiten und industriespezifischer Erfahrung die bestehenden Kunden-Teams. Sie entwickeln Proof of Concepts (POCs), Minimum Viable Products (MVPs) und führen ML-Lösungen zusammen mit dem Kunden in den Produktivbetrieb über. Gleichzeitig wird der geschäftliche Wert einer Lösung durch firmeninternes kontinuierliches Lernen und das Teilen von Wissen nachhaltig und direkt erhöht.

So führte die DFL-Tochterfirma Sportec Solutions für xGoals interne Testdurchläufe und ein erstes Prototyping durch. Eine fest etablierte Forschungsgemeinschaft im Sports-Analytics-Bereich arbeitet außerdem unermüdlich daran, Ansätze zur Steigerung der Leistungsfähigkeit und Genauigkeit von xGoals-Berechnungen weiter zu verfeinern. Die Kombination aus externem und firmeninternem Fachwissen, skalierbarer Technologien und bewährter Praktiken beschleunigt dabei Innovationen.

Grundlage für das Trainieren von ML-basierten xGoals-Modellen sind Positions- und Ereignisdaten früherer Fußball-Bundesligasaisons. Abhängig von Bedingungen auf dem Spielfeld werden je nach Spielsituation xGoals-Werte abgeleitet. Zur Evaluation der Datenqualität und für erste Tests werden explorative Datenanalysen durchgeführt. Informationen werden in Amazon SageMaker Notebooks visualisiert, transformiert und validiert. Der nächste und naheliegende Schritt ist das Überführen der ML-Workloads vom Forschungs- und Analysestadium in die tatsächliche Entwicklungsphase.

Das Erstellen von ML-Modellen für den produktiven Einsatz erfordert einen interdisziplinären Entwicklungsansatz, der unter anderem Elemente aus Data Engineering, Data Science und Softwareentwicklung vereint. Produktivumgebungen verlangen zudem ein Fehler-Management sowie Failover-Prozesse und Wiederherstellungspläne. ML Systementwicklung und -betrieb (MLOps) beinhaltet auch die Refaktorisierung und Optimierung von Code, Automatisierung, das Aufsetzen zugrundeliegender Cloud-Infrastruktur, Einhaltung von Sicherheits- und DevOps-Standards, Ende-zu-Ende-Tests, Monitoring und umfassendes System-Design. Ziel ist es stets, so viele Systemkomponenten wie möglich zu automatisieren und den Bedarf für manuelle Interventionen und Wartungsarbeit zu minimieren.

Im zweiten Teil des Beitrags werden die einzelnen Technologien hinter Bundesliga Match Facts behandelt. Dabei geht es um grundlegende Überlegungen, wie sich xGoals in einem gradlinigen und einheitlichen cloudbasierten Entwicklungsprozess betriebsbereit machen lässt.

Unsere Redaktion empfiehlt:

Relevante Beiträge

Abonnieren
Benachrichtige mich bei
guest
0 Comments
Inline Feedbacks
View all comments
X
- Gib Deinen Standort ein -
- or -