Statistik ist im Fußball nicht mehr wegzudenken. Doch was bedeuten Ballbesitz, Passerfolg und co. eigentlich und wie werden sie gemessen?
Inhaltsübersicht:
- Allgemein
- Ballbesitz
- Passerfolg
- Zweikämpfe
- Schüsse & Torschüsse
- Laufleistung, intensive Läufe & Sprints
- Pressingintensität (PPDA)
- Expected Goals (xG)
- Mehr zu Daten und Zahlen im Fußball
Allgemein
Bei Statistiken im Fußball ist zu beachten, dass jedes Spiel seine eigene Geschichte schreibt. Absolute Werte sind daher schwer zu vergleichen. Eine Mannschaft hat in einem Spiel viel mehr Pässe gespielt als in einem anderen. Waren sie also im zweiten Spiel schlechter? Die Daten bieten dazu keine Antwort. Der Gegner spielt eine entscheidende Rolle. Immer.
Bei relativen Werten (wie etwa Prozentangaben) ist das da schon einfacher. Auch wenn die tatsächlich gespielten Pässe von Spiel zu Spiel oft sehr schwanken, so kann die Passerfolgsquote teilweise recht stabil bleiben.
Ein entscheidender Faktor bei der Datenanalyse ist Metriken zu verstehen, dazu gehört auch deren Erfassung. Analysten haben das geflügelte Wort: „Shit in, shit out.“ Grob übersetzt bedeutet das, dass gute Datenqualität und korrekte Anwendung der Metriken unabdingbar sind. Statistiken erscheinen oft eindeutiger, als es die Datenlage eigentlich zulässt. Das ist wichtig zu verstehen. Ein gesamtheitlicher Blick ist elementar.
Abschließend bleibt noch der Hinweis darauf, dass mit Daten im Fußball heute viel Geld verdient wird. Entsprechend hüllen die Anbieter sich in Schweigen, wenn es um Details zur Erhebung oder Berechnung geht.
Ballbesitz
Als Bayern München 2020 die Champions League gewann, hatten sie im Finale über 60% Ballbesitz. Als sie dieses Finale 10 Jahre zuvor verloren, auch. Oft wird Ballbesitz mit Spielkontrolle gleichgesetzt. Das ist aber falsch. Der Ballbesitz gibt den Anteil an, den ein Team den Ball in den eigenen Reihen hatte. Nicht mehr und nicht weniger.
Die unterschiedlichen Datenanbieter berechnen den Ballbesitz unterschiedlich. Einige stoppen die Zeit von der ersten bis zur letzten ununterbrochenen Ballberührung, einige zählen sämtliche Ballaktionen, einige nehmen die reine Anzahl der erfolgreichen Pässe. Das Ergebnis ist jeweils der Prozentwert einer Mannschaft im Vergleich zum Ganzen. Interessant zu bemerken ist, dass die unterschiedlichen Messmethoden sich im Endresultat oft nur marginal unterscheiden.
Bewertung: Ballbesitzanteile bieten keinerlei Voraussagekraft auf Sieg oder Niederlage. Mehr Ballbesitz korreliert allerdings mit höheren Tabellenplätzen. Ob das Ursache oder Wirkung ist, da sind sich die Analysten jedoch nicht ganz einig. Die Ballbesitzstatistik bietet aber Hinweise zum Narrativ eines Spiels und der Spielweise einer Mannschaft. Teams die sich eher aufs Kurzpassspiel fokussieren, haben hohe Werte, Umschaltteams ziemlich niedrige.
Interessant im Zusammenhang zum Ballbesitz, sind immer auch die Passerfolgszahlen. Wenig Ballbesitz, hoher Passerfolg und wenige Schüsse etwa könnte ein Hinweis darauf sein, dass das Umschaltspiel nicht wirklich funktionierte. Solchen Daten lassen etwa auf viele Sicherheitspässe schließen, und dass der Ball ist schnell wieder weg ist, wäre zu untersuchen. ein schönes Beispiel dafür, dass diese Metriken im Kontext zueinander bereits eine Geschichte erzählen können.
Passerfolg
Borussia Dortmund spielte in der Saison 2019/2020 die meisten Pässe pro Spiel (665,1) davon 86,9% erfolgreich. Beides Ligaspitze. Schalke erreichte 77,7% bei 419,2 Pässen pro Spiel.
Im Vergleich zu den anderen Metriken dieser Liste ist Passerfolg relativ leicht zu messen. Findet ein Zuspiel den Mitspieler oder nicht? Aber auch hier gibt es natürlich Komplikationen. Manchmal ist etwa nicht ganz klar, was ein Zuspiel eigentlich ist. Aber im Großen und Ganzen passt das eigentlich.
Spannend ist in dem Zusammenhang zu wissen wie viele Pässe insgesamt gespielt wurden (der Ballbesitz gibt hier oft Hinweise) und wo die Pässe gespielt wurden. Die Zahlen zu Pässen und Passerfolg im letzten Spielfelddrittel beispielsweise, sind deutlich spezifischer und dadurch auch aussagekräftiger. Zumindest was das Angriffsverhalten angeht.
Bewertung: Für die Analyse der Passerfolgswerte sind zwei Erkenntnisse entscheidend. Erstens, je mehr Pässe ich insgesamt spiele, desto weniger fallen einzelne Fehlpässe ins Gewicht. Ein Fehlpass bei 10 Pässen sind 10%, ein Fehlpass bei 50 Pässen nur 2%. Zweitens, Fehlpässe in der eigenen Hälfte sind deutlich seltener als am gegnerischen Strafraum. Eine niedrige Zahl muss also nicht bedeuten, dass das Team hohe Passspiel Defizite aufweist, sondern kann auch zeigen, dass der Ball schnell Richtung Tor gelangte.
Zweikämpfe
In der Saison 2019/2020 führte Schalke unter David Wagner durchschnittlich 217 Zweikämpfe pro Spiel, nur Gladbach hatte mehr. 49,81% davon waren erfolgreich. Typischerweise liegt die Quote der gewonnen Zweikämpfe irgendwo zwischen 45% und 55%, höhere/niedrigere Werte sind eher die Ausnahme.
Objektiv zu beurteilen was ein Zweikampf ist, ist komplexer als es auf den ersten Blick scheint. Für valide Zahlen, muss die Auswertung aber stabil und eindeutig sein. Weil das im Einzelfall etwas kontraintuitiv ist, wird diese Statistik eher vorsichtig genutzt. Die Zahl mag klarer wirken als die Erhebung eigentlich zulässt. Ab wann nämlich ein Zweikampf genau beginnt und ab wann er vorbei ist, ist nicht so allgemeingültig definiert.
Wenn ein ballführender Spieler vor einem Verteidiger zurückweicht, ist das dann ein Zweikampf? Und wenn ja, wer von beiden hat gewonnen? Der mit Ball oder der, der erreicht hat, dass der Angriff abgebrochen werden musste? Und wie sieht das aus, wenn zwei Verteidiger einem Angreifer den Ball wegnehmen. Hat dann einer der Verteidiger den Zweikampf verloren? Und wenn der Ball ins Aus gedrängt wird? Und wo genau ist die Grenze zwischen Fehlpass und Zweikampf? Auf solche und viele weitere Fragen hat jeder Datenanbieter eigene Antworten definiert, welche aber Betriebsgeheimnis sind.
Auf internationalen Medien findet sich oft eine Metrik für „Dribbles“. Dies sind sehr spezielle Zweikämpfe, in denen ein ballführender Spieler an einem Verteidiger vorbei ziehen kann, oder eben nicht. Versuche für ein solches Dribbling gibt es im Spiel selten mehr als 50.
Bewertung: Die Zahl bietet keinerlei Vorhersagekraft auf Sieg oder Niederlage. Auch Einsatzfreude lässt sich daran eigentlich nicht wirklich ablesen. Die Datenlage ist schwammig und die Werte liegen fast immer sehr nah beieinander. Es hat einen Grund warum ihr auf Halbfeldflanke sehr selten von Zweikampfquoten lest…
Schüsse & Torschüsse
Ein Torschuss, ist ein Schuss der ins Tor gegangen wäre, wäre er nicht daran gehindert worden. Jedes Tor ist ein Torschuss. Umgekehrt aber natürlich nicht. Und dann wird noch unterschieden zwischen Schüssen aufs Tor und anderen Schüssen. Und abgeblockten Schüssen auch noch.
Leider ist das alles etwas schwammig. Und unterschiedliche Datenanbieter haben auch unterschiedliche Definitionen für all das und kommen entsprechend zu unterschiedlichen Ergebnissen.
Bewertung: Bei der Torschussmetrik sind Interpretation und Kontext entscheidend. Viele Torschüsse können starke Offensivbemühung zeigen. Bei vielen Schüssen neben das Tor, sollte der Grund genauer untersucht werden (Abschluss aus schlechter Situation oder schlechter Abschluss?). Und natürlich die Frage nach dem Verhältnis zwischen (Tor-)Schüssen und den tatsächlich erzielten Toren.
Der Total Shot Ratio (TSR) ist eine spannende Erweiterung der Torschussmetrik. Berechnet wird der TSR mit eigenen Schüssen geteilt durch die Summe aus eigenen Schüssen und denen des Gegners. So ergibt sich ein Indikator für die Chancenverteilung. Der Mittelwert liegt bei 0,5. Je höher der Wert, desto deutlicher das Übergewicht.
Laufleistung, intensive Läufe & Sprints
Wie viel eine Mannschaft läuft, hängt von einer Vielzahl an Faktoren ab. Das Spielsystem ist einer. Die Einsatzfreude ein anderer. Ballbesitzteams laufen in der Regel weniger (sie lassen ja Ball und Gegner laufen). Mehr zu laufen bietet dabei wenig Anhaltspunkte, wie schnell gelaufen wird dagegen schon eher.
Darum wird unterschieden zwischen der Laufdistanz insgesamt (meist in Kilometern), sowie der Anzahl an intensiven Läufen und Sprints. Die letzten beiden werden nach der Geschwindigkeit unterschieden. Vereinfacht gesagt haben Datenanbieter Schwellenwerte definiert, sobald diese überschritten werden, gilt die Bewegung als intensiver Lauf oder eben als Sprint. Wenn der Spieler wieder langsamer wird, gilt der Lauf bzw. Sprint als abgeschlossen.
Wie genau das gezählt und berechnet wird, ist wieder Betriebsgeheimnis. Gemessen werden die Bewegungen der einzelnen Spieler ständig. Wie genau diese Messungen sind, welche Fehlertoleranzen es gibt, ist nicht bekannt.
Bewertung: In Analysen geht es oft um Einsatz der Spieler. Hypothese: Ein unmotiviertes Team sprintet wenig. Und ein Team, dem es nur darum geht gelegentlich Nadelstiche zu setzen, vermutlich auch. Entsprechend würde ich Teams mit hohen Werten bei intensiven Läufen und Sprints pauschal eine hohe Einsatzfreude unterstellen. Das sollte in den gesamtheitlichen Blick einfließen.
Pressingintensität (PPDA)
Das Pressing einer Mannschaft ist in den letzten Jahren sehr in den Mittelpunkt jeder taktischen Betrachtung gerückt. Die Ausgestaltung des Pressings ist ein entscheidender Faktor. Das zu quantifizieren ist allerdings gar nicht einfach.
Die Metrik zum Messen der Pressingintensität setzt die gegnerischen Pässe ins Verhältnis zu Defensivaktionen (Passes Allowed Per Defensive Action, PPDA). Je kleiner der Wert, desto intensiver das Pressing. Je höher der Wert, desto passiver das Pressing. Zu den Defensivaktionen zählen Tacklings, abgefangene Bälle, Fouls etc.
Bewertung: Ein Team, das sehr früh attackiert, wird typischerweise einen sehr niedrigen Wert haben. Ein Team, das tief steht und auf den Gegner wartet, einen recht hohen. Das wäre zumindest die Erwartungshaltung. Weichen die Zahlen davon ab, gibt es sicherlich einen Grund oder ein Problem.
Expected Goals (xG)
Der xG vergleicht eine Abschlusssituation mit historischen Daten und trifft darauf basierend eine Vorhersage, zu welchem Prozentsatz ein Tor erwartbar wäre. Eine Torwahrscheinlichkeit also. Auf Grund von erwartbaren Toren (und erwartbaren Gegentoren, xGA) können die erwartbaren Punkte (xPTS) berechnet werden.
Im Vergleich zu den anderen Metriken in dieser Liste, fließen hier also Informationen in eine Bewertung ein, die nicht nur in dem gegebenen Spiel beobachtet werden können. Dadurch bekommt das Thema Datenqualität ein deutlich höheres Gewicht. Im Kern steht hier die Frage, wie unterschiedliche Situationen verglichen werden können.
Um das zu messen wird das Feld in kleine Zellen aufgeteilt und die Schüsse für jede dieser Zellen gezählt. Und da fängt der Spaß an. Wie klein muss so eine Zelle sein um wirklich vergleichbar zu sein? Und wie bestimme ich diese Zellen, wo doch Spielfelder unterschiedlich breit und lang sind? Und wenn ich aufgezeichnete Abschlüsse vergleiche, wie genau sind die dokumentiert und was sind die Fehlertoleranzen? Und woher kommen diese Aufzeichnungen, kann ich unterschiedliche Wettbewerbe wirklich vergleichen? Und unterschiedliche Zeiten? Spieler? Und was ist mit dem Unterschied zwischen Kopf und Fuß? Und der Anzahl der Gegner zwischen Ball und Tor?
All diese und noch viel mehr Fragen haben zu sehr unterschiedlichen Modellen geführt, die alle unter dem gleichen Namen laufen: xG. Entsprechend unterscheiden sich die Ergebnisse zum Teil drastisch. Details sind natürlich Betriebsgeheimnis.
Bewertung: Wenn der xG-Wert und die Anzahl der tatsächlich erzielten Tore auseinander liegt, ist das ein interessantes Signal, dem es nachzuforschen gilt. Nicht immer kommt sowas einer Over- oder Underperformance gleich, manchmal kann es aber ein Hinweis darauf sein. Bereits in der Hinrunde 2019/20 war auf Halbfeldflanke zu lesen, dass Schalke zwar stark punktet, aber viel von Spielglück profitiert. Das Torverhältnis war +8, der xG hatte -6 vorhergesagt. In der Rückrunde war es dann vorbei mit dem Spielglück.
Mehr zu Daten und Zahlen im Fußball
Eine kleine Auswahl an Büchern rund um das Thema Zahlen und Daten im Fußball…
- Fußballmatrix & Matchplan, beide Christoph Biermann
- Soccernomics, Simon Kuper & Stefan Szymanski
- The Numbers Game, Christ Anderson & David Sally
Und interessant ist natürlich auch noch, wo es solche Daten zu sehen gibt. Hier ein paar Links zu den Seiten, bei denen wir meist vorbei schauen.
- Between the Posts: Match Plots
- Understat
- Whoscored
Wir freuen uns immer über Hinweise zu anderen Seiten oder Büchern. Wenn ihr also was habt, immer her damit.
Kommentare sammeln wir HIER.