Ein Spiel der Daten Wie Algorithmen den Fußball verändern

Author: Ortrun Huber

Published at: 14-11-2022 10:19 AM

Künstliche Intelligenz und IT-Spezialisten unterstützen Fußballtrainer weltweit bei der Analyse ihrer Teams. Anhand Millionen von Daten, die während eines Spiels gesammelt werden, soll die Leistungsfähigkeit eines Kaders optimal gesteuert werden. Zugleich hilft Datenanalyse dabei, die Torjäger von morgen zu identifizieren und das Publikum mit authentischem Zahlen- und Videomaterial zu versorgen. Aber wer gewinnt am Ende das Spiel: der Algorithmus oder die Mannschaft?

1. Fußball-Bundesliga: FC Schalke 04 - Werder Bremen, Spielszene gezoomt  | Bild: picture-alliance / Norbert Schmidt

Von Baseball lernen: Der Ursprung der Daten-Sammelwut

Baseballspieler Ramón Laureano von den Oakland Athletics im Spiel gegen die Chicago White Sox. | Bild: picture alliance / ASSOCIATED PRESS | Godofredo A. Vásquez

Bereits seit den 1970er-Jahren werden im US-amerikanischen Baseball Daten gesammelt, um das Spiel zu optimieren.

Die Idee, wichtige Ereignisse im Verlauf eines Spiels aufzulisten, um so die Leistung einer Mannschaft zu analysieren, geht auf den US-amerikanischen Autor und Baseball-Fan Bill James zurück. In den 1970er-Jahre begann James Baseballspiele anhand statistischer Daten zu untersuchen, um festzustellen, warum Teams gewinnen oder verlieren. Seine Methode, die emprirische Analyse von Baseball, nannte er SABRmetrics, benannt nach der 1971 gegründeten Society for American Baseball Research. Eine größere Öffentlichkeit lernte SABRmetrics durch die "Bill James Abstracts" zu seinem statistischen Material kennen, die er in den 1980er-Jahre veröffentlichte.

Baseball eignet sich für Datenanalyse besonders gut, denn die meisten Spielsituationen sind statisch und damit gut "zählbar". Anfang der 2000er-Jahre verhalf der US-amerikanische Baseball-Scout und spätere Sportmanager Billy Beane seiner Mannschaft, den Oakland Athletics, zu ungeahnten Erfolgen, als er bei der Spielersuche und -bewertung auf SABRmetrics setzte. Mit geringem finanziellen Aufwand verpflichtete er unbekannte Nachwuchsspieler, die erfolgsversprechende Leistungsdaten aufwiesen, und führte seinen wenig finanzkräftigen Verein so viermal in Folge in die Playoffs. Populär wurde Beanes Methode durch das 2003 erschienene Buch "Moneyball" (und dessen Verfilmung), das viele Baseballclubs beeinflusste. Auch Trainer und Vereinsmanager anderer Sportarten wie Basketballl, Eishockey oder American Football übernahmen in den USA schließlich Beanes Analyse-Konzept.

Deutsche Fußball-Nationalmannschaft: Mit Datenanalyse zum Weltmeister-Titel

WM-Titel 2014 für die deutsche Fußball-Nationalmannschaft | Bild: picture alliance / Pressefoto ULMER / Markus Ulmer

Grenzenloser Jubel: Bei der Fußball-WM 2014 in Brasilien gewann die deutsche Nationalelf den Titel, auch dank digitaler Trainingsanalyse.

Mit der Zeit schwappte die Idee, mit großen Datenmengen den Profisport zu optimieren, nach Europa und auch in die deutsche Fußballwelt. 2014 verkündete der Walldorfer Software-Konzern SAP, die Partnerschaft mit dem Deutschen Fußballbund im Hinblick auf die Verbesserung der "sportlichen Leistungen der deutschen Nationalmannschaft" zu erweitern.

Im Vorfeld des deutschen Fußball-WM-Erfolgs in Brasilien stellte der Software-Konzern dem Team um Bundestrainer Joachim Löw neben einer digitalen Plattform zur Trainingsanalyse und Turniervorbereitung auch eine 7.000 Spiele umfassende Datenbank mit Spielen der gegnerischen Mannschaften zur Verfügung. Bauchgefühl und Sachverstand des Trainerteams konnten so mit statistischen Informationen ergänzt werden.  

Big Data: Was Algorithmen über Fußballspieler verraten

Fußballfeld mit Datenpunkten | Bild: Colourbox

In der Bundesliga werden pro Spiel rund 3,6 Millionen Datenpunkten gesammelt und ausgewertet.

Mittlerweile gehören mobiles Tracking, Videoanalysen und die Sammlung sowie Auswertung von Daten nach spezifischen Kriterien im Profifußball zum Standard. Auf der Suche nach nachvollziehbaren und vor allem messbaren Erfolgsfaktoren werden immer neue Kennzahlen entwickelt. Grundlage für die Analyse bilden dabei drei Kategorien: biometrische Daten, Ereignisdaten und Positionsdaten.

  • Sensoren in den Trikots oder am Körper liefern im Training biometrische Daten, beispielweise Puls, Atemfrequenz oder Laufleistung der Akteuere. Damit lassen sich Trainingsverläufe individuell auf jeden Spieler hin optimieren, die Messungen dienen aber auch der Verletzungsprävention. Auch wenn biometrische Daten Hinweise auf die Fitness der Fußballer geben, sind sie am Ende jedoch nicht aussagekräftig genug in Hinblick auf den (Tor-)Erfolg eines Spieler.
  • Als Ereignisdaten wird die Zahl der Kopfbälle, Eckbälle, Torschüsse, Tore, Zweikämpfe oder die Länge des Ballbesitzes bezeichnet. Sie sind zwar statistisch interessant und fließen beispielsweise in die Berichterstattung und in die Tabellen der Fan-Apps ein. Sportwissenschaftler sind sich inzwischen allerdings einig, dass Ereignisdaten nur wenig über den tatsächlichen Erfolg eines Spielers oder einer Mannschaft aussagen.
  • Positons- bzw. Trackingdaten dokumentieren die Position jedes Spielers und des Balls in jedem Moment einer Fußballpartie, woraus jede Bewegung des Spielers berechnet werden kann. So können sie Hinweise darauf geben, warum ein Spieler beispielweise bei einem bestimmten Pass unter Druck stand oder ob ein Spieler sich in einer konkreten Spielsituation für die bestmögliche Aktion entschieden hat. Damit dies gelingt, müssen die Spieler eindeutig identifiziert werden. Hochauflösende Kameras helfen, jede Aktion und Bewegung der Spieler festzuhalten, damit der Algorithmus anhand Tausender von Bildern lernt, einzelne Akteure auf dem Platz zu erkennen.

Gesagt: Wenn aus Informationen Wissen wird

Fußballexperte Christoph Biermann | Bild: picture alliance / augenklick/firo Sportphoto / Jürgen Fromme

"Denn die Zukunft im Fußball wird nicht einfach denen gehören, die über die Daten verfügen, sondern jenen, die aus Informationen die besten Schlüsse ziehen."

Fußballexperte Christoph Biermann, Autor des Buches 'Matchplan - Die neue Fußball-Matrix'

Nach dem Tracking ist vor der Analyse:  Mit Künstlicher Intelligenz zum Fußball-Sieg

Marcel SABITZER (Bayern Muenchen) im Zweikampf gegen Kevin AKPOGUMA (1899 Hoffenheim,li) und Stefan POSCH (1899 Hoffenheim).  | Bild: picture alliance / SvenSimon | Frank Hoermann

Unter Druck: Marcel Sabitzer (FC Bayern München) versucht sich gegen Kevin Akpoguma (l.) und Stefan Posch (beide 1899 Hoffenheim) durchzusetzen.

Die Herausforderung bei der Analyse von Big Data liegt nicht nur in der schieren Größe der Datenmasse, sondern auch darin, dass die Daten strukturiert oder unstrukturiert und in unterschiedlichen Formaten wie Bildern, Texten, als Audio oder Video vorliegen. Allein bei einem Bundesligaspiel fallen über drei Millionen Positionsdaten an: Informationen, die möglichst schnell, am besten in Echtzeit, analysiert und ausgeliefert werden sollen.

Je schneller die Analyse gelingt, desto größer ist ihr Wert. Kein Profifußballverein der Bundeliga, der mittlerweile nicht über Datenspezialisten verfügt, die das gelieferte Material interpretieren. Unterstützt werden sie von Sportwissenschaftlern im Rahmen von Forschungsvorhaben wie beispielsweise der Multimodal Analysis for Sports Analytics (MM4SPA). Das vom Bundesministerium für Bildung und Forschung geförderte Projekt, an dem das Institut für Trainingswissenschaft und Sportinformatik der Sporthochschule Köln und das Forschungszentrum L3S der Leibniz Universität Hannover beteiligt sind, beschäftigt sich mit der Analyse von Positions- und Videodaten. Konkret soll MM4SPA mithilfe Künstlicher Intelligenz neue Auswertungsmethoden entwickeln und damit Sportanalysten bei der Aufbereitung von Fragen zu Team- und Einzeltaktiken unterstützen. Ein Beispiel ist das Sportanalyse-Framework "floodlight", das das Laden, Integrieren und Verarbeiten von Tracking- und Ereignisdaten, Codes und anderen spielbezogenen Informationen von großen Datenanbietern vereinfacht. Trainer und ihre Teams könne mithilfe dieser Informationen nicht nur das Spiel ihre Mannschaft analysieren und optimieren, sondern auch bei der Spielersuche auf jene Talente und Leistungsfaktoren achten, die ihr Mannschaft besonders benötigt.       

Fußball-Daten-Glossar: Von xGoals bis Angriffszonen

Bei der Deutsche Fußball Liga (DFL) kümmern sich diverse Tochterunternehmen um das Geschäft mit den digitalen Inhalten. Seit 2013 erhebt die DFL bei allen Spielen der ersten und zweiten Bundesliga eigene Trackingdaten, die jedem Verein der DFL zugänglich gemacht werden. Ein Datenaustausch innerhalb der nationalen Ligen, der im europäischen Vergleich einzigartig ist.

2020 baute die DLF mit Unterstützung eines großen Cloud-Dienstleisters eine Datenplattform auf, die auf zehntausenden aktuellen und historischen Bundesliagspiele basiert und daraus unter anderem statistische Parameter, die sogenannten "Match Facts", generiert. So erhalten nicht nur Trainer, Spieler und Vereine der ersten und zweite Liga während der Partien Zugriff auf digitale Informationen und Statistiken, sondern auch Medien und digitale Plattformen für die Berichterstattung. Wir erklären euch eine Auswahl der Bundesliga Match Facts:

Expected Goals (xGoals)
Der Wert der xGoals beschreibt, wie wahrscheinlich ein Torschuss tatsächlich auch zum Tor führt - ein wichtiger Messwert für die Effizienz eines Spielers oder einer Mannschaft. Um die Torwahrscheinlichkeit zu berechnen, werden unter anderem die Distanz und der Winkel des Spielers zum Tor einbezogen sowie die Zahl der Gegenspieler in der Nähe des Schützen. Zudem werden 40.000 Torschüsse aus dem historischen Videoarchiv der DFL in die Ermittlung des xGoals-Wert einbezogen.

Leistung unter Gegnerdruck
Dieser Match Fact beschreibt, wie sich Spieler, die vom Gegner angegriffen werden, erfolgreich bewähren - sei es durch einen Pass, ein Dribbling oder auch einen Schuss aufs Tor. Wichtig ist dabei vor allem die Quote gelöster Spielsituationen. 

Pass-Profil
Wohin wird der Ball am häufigsten gepasst? Wie viele Pässe kommen an? Das Pass-Profil protokolliert, wie der Ball läuft, wie schwierig ein Pass war und wer den Ball eher lang oder kurz zuspielt.

Realformation

Wo befinden sich 22 Spieler während der 90 Minuten einer Fußballpartie auf dem Platz? Anhand von rund 3,6 Millionen Datenpunkten pro Spiel lassen sich in Echtzeit Spielverläufe und damit auch das taktische Verhalten einzelner Spieler oder einer Mannschaft nachvollziehen.

Angriffszonen
Kommt ein Team häufiger über rechts oder links? Dieser Parameter beschreibt in Prozent, wie häufig eine Mannschaft wo im letzte Drittel des Spielfeldes vor dem gegnerischen Tor angreift.

Klopp, Nagelsmann und Co.: Die Tricks der Laptop-Trainer  

Fußballtrainer Julian Nagelsmann  | Bild: picture alliance / Eibner-Pressefoto | Krieger

Fußballtrainer Julian Nagelsmann tüftelt eine Taktik am Laptop aus.

Mehmet Scholl hat's erfunden. Der ehemalige Bayern-Spieler prägte 2015 in einem Spiegel-Interview den Begriff des "Laptop-Trainers" - und das war damals nicht als Kompliment gemeint. Zu viel Taktik, zu wenig Verständnis für Spielerpersönlichkeiten und "den Blick für das Wesentliche". Nun, wenige Jahre später, verzichtet kein Bundesligaclub mehr auf die Expertise von Datenanalysten, die Mannschaften und Spieler, von Algorithmen unterstützt, am Computer beobachten und deren Spielweise auf taktische Kniffe hin abklopfen.

Europäische Spitzentrainer wie Pep Guardiola, Julian Nagelsmann und Jürgen Klopp motivieren ihre Teams zu Spitzenleistungen, weil sie die Dynamik ihrer Mannschaft und die individuellen Spielerpersönlichkeiten mit Analysen der Spiel(er)daten zusammenführen. "Es zählen nicht Bauchgefühl und Genie eines großen Trainers allein", unterstreicht auch Fußballexperte Christoph Biermann in seinem Buch "Matchplan".

Seit die FIFA zur Fußball-WM 2018 in Russland den Einsatz von Laptops und Headsets auf der Trainerbank erlaubt hat, spielt die Digitalisierung der Coachingzone eine immer größere Rolle - zumal Analysedaten mittlerweile nahezu in Echtzeit auf den Laptops der Datenexperten auf der Bank ankommen. "Der Laptop ist ein fester Bestandteil des Traineralltags, übrigens nicht nur im Bereich Spielanalyse, sondern auch in den Bereichen Medizin oder auch Trainingssteuerung", bestätigt Sportwissenschaftler Daniel Memmert, geschäftsführender Leiter des Instituts für Trainingswissenschaft und Sportinformatik der Sporthochschule Köln. Da er online sei, verfüge der Trainer während des Spiels heute über wesentlich mehr Informationen als früher. "Wenn man die richtigen Schlüsse aus den Daten zieht, dann kann man natürlich während des Spiels ganz andere - quasi objektivere - Entscheidungen treffen."

Sportwissenschaftler Daniel Memmert im Interview: "Wir sind erst am Anfang."

Da auf dem Fußballplatz meist wenige Tore fallen, hat der Zufall eine große Chance. Egal, ob bei der Fußball-WM in Katar oder in der Bundesliga - etwa die Hälfte aller Tore im Fußball entstehen zufällig. Warum der Zufall im Fußball so wichtig ist, konnte 2021 ein Forscher-Team am Institut für Trainingswissenschaft und Sportinformatik an der Sporthochschule Köln zeigen. Institutsleiter Prof. Daniel Memmert erklärt, wie man dem Zufall auf die Schliche kommt.

Trotz aufwändiger Datenanalyse kann man im Fußball laut aktueller Studienlage nur die Hälfte des Geschehens auf dem Platz beeinflussen, denn 50 Prozent der Tore fallen aus purem Zufall. Lohnt sich denn da überhaupt der Aufwand der Datenanalyse im Fußball?

Memmert: Tatsächlich kann man feststellen, dass der Einfluss des Zufalls in den letzten zehn Jahren abnimmt. Das konnten wir in einer größeren Studie, in der wir fast 10.000 Tore in der britischen Premier League nach verschiedenen Zufallsfaktoren analysiert haben, zeigen. Aktuell sind es nur noch 42 Prozent der Tore, die durch Zufallseinflüsse bestimmt werden. Und tatsächlich liegt es genau an dem Mehr an Daten, an mehr Analysen, an besseren Matchplänen, dass der Einfluss des Zufalls abgenommen hat.

Wie kann das sein?

Memmert: Die Mannschaften wissen ein bisschen besser übereinander Bescheid, etwa über die Strategien des Gegners und können ihre Matchbälle professioneller aufbereiten. Dennoch ist viel Zufall nach wie vor im Spiel. Aber ich glaube, dass wir ihn in den nächsten Jahren noch stärker in die Knie zwingen können, weil es weitere Analysen gibt, weitere Parameter, mit denen wir das Spiel besser verstehen und dadurch auch die Trainer besser auf den nächsten Gegner vorbereiten können. 

Was ist eigentlich ein „zufälliges“ Tor?

Memmert: Sportwissenschaftler haben sich mal auf Faktoren geeinigt, die schwer zu trainieren sind, und diese als "Zufall" klassifiziert. Da gibt es beispielsweise Bälle, die aus sehr weiter Distanz ins Netz gehen. Oder wir würden es als Zufall klassifizieren, wenn Tore durch die Beteiligung gegnerischer Abwehrspieler zustande kommen. Oder wenn der Ball den Pfosten oder die Latte berührt, bevor ein Spieler ihn über die Linie drückt - all das sind sogenannte Zufallstore.

Welche der von Fußballdaten-Analysten untersuchten Parameter ist entscheidend - was macht einen Spieler zu einem „Spitzenspieler“? 

Memmert: Das ist genau die Frage, über die sich die Wissenschaft Gedanken macht – und übrigens auch viele Klubs, viele Manager und Spielerberater. Was ist so ein taktischer Leistungsindikator, der wirklich auch einen Effekt auf das Ergebnis eines Spiels hat? Wir wissen mittlerweile, dass es nicht die „einfachen“ Indikatoren sind, wie zum Beispiel Ballbesitz oder wie viel Pässe ankommen oder auch nicht, wie viel ein Spieler läuft. Das alles ist es nicht. Aber was ist es dann? Es sind komplexere taktische Leistungsindikatoren, um ein Beispiel zu nennen: die Raumkontrolle. Wir wissen aus sehr großen Validierungsstudien, dass der Raum, den ein Spieler in der Nähe des gegnerischen Tors kontrollieren kann, eine Größe ist - wenn man diese über die ganze Mannschaft aufaddiert -, die zwischen Sieg und Niederlage entscheiden kann. Wir reden da immer über wenige Prozentpunkte, die den Unterschied machen, das ist klar. Aber das ist ein Faktor, der eindeutig einen Einfluss auf das Spiel hat.

Werden wir denn - bei der immer umfangreicheren Datenanalyse im Fußball - irgendwann keine Trainer mehr brauchen?

Memmert: Der Trainer ist der Kopf des Ganzen, bei dem alles zusammenläuft. Und der Trainer sucht sich seine Experten und lässt sich beraten. Der Trainer selbst muss kein Experte sein im Bereich Spielanalyse, Ernährung, Sportpsychologie oder Trainingssteuerung. Aber tatsächlich gibt es mittlerweile in vielen Vereinen im Trainerteam, das bislang aus Trainer, Co-Trainer und Torwart-Trainer bestand, einen zweiten Co-Trainer mit dem Schwerpunkt „Spielanalyse“. Dieses Team wird also erweitert, und Spielanalyse ist da ein ganz wichtiger Faktor. Aber am Ende muss der Trainer die Entscheidungen fällen. Welche da die richtigen sind, ist natürlich häufig Interpretationssache. Auch dazu haben wir bereits viele Studien gemacht, die zeigen, dass verschiedene Spezialisten, die sich dasselbe Spiel anschauen, ganz unterschiedliche Interpretation daraus ziehen.
Wir sind also erst am Anfang, um so etwas wie einen „goldenen Standard“ zu entwickeln, was denn genau in einem Spiel an Informationen steckt, welche Faktoren bei beiden Mannschaften vorhanden sind und wie man diese nutzt, um einen Vorteil zu ziehen. Daten sind dabei im Fußball mittlerweile sehr wichtig geworden. Ohne Daten kann keine Mannschaft über einen längeren Zeitraum hinweg erfolgreich arbeiten.