Joseph Buchdahl hat unzählige informative Materialien zur Messung des Zufälligkeit bei Fußballwetten sowie zur Effizienz der Quoten und warum diese so schwer zu besiegen sind, veröffentlicht. In seinem neuesten Artikel taucht er noch einmal in dieses Thema ein und betrachtet die Aspekte der Zufälligkeit und Effizienz aus einer anderen Perspektive.
Ich kann mir gut vorstellen, dass Leser bereits zur Genüge gehört haben, dass das Wetten auf Fußballspiele aufgrund der Zufälligkeit und Effizienz eine schwer zu knackende Nuss ist. Das dachte ich auch. Doch in diesen Zeiten der Ausgangssperre und ohne Fußball, in denen es nicht viel zu tun gab, mit dem das Aufschieben eines neuen Buches gerechtfertigt werden könnte, habe ich mir einige alte Ideen noch einmal angesehen.
- Lesen Sie: Erneute Betrachtung des Zufalls beim Wetten
Herausgekommen ist dieser Artikel. Diese Ideen sind nicht neu, sie werden lediglich in einem anderen Licht präsentiert. Ich hoffe, dass es Ihnen weiterhilft.
Wie sieht Effizienz aus?
Bereits seit Jahren diskutiere ich mit jenen, die mir sagen, dass es im Fußball keinen Zufall gibt. Wie ist es möglich, wenn Manchester United größere Chancen hat, Cambridge United zu besiegen? Sie haben Recht. Hier reden wir allerdings nicht über Fußball, sondern über Fußballwetten.
Grundsätzlich haben Quoten ein Handicap, wenn es darum geht, die unterschiedlichen Fähigkeiten der Mannschaften zu berücksichtigen. Bessere Mannschaften haben kürzere Quoten. Sobald genügend Menschen mit Geld ihre Meinung zu den Gewinnchancen eines Teams geäußert haben, sind die Quoten in der Regel sehr nah daran, wie sie wirklich aussehen würden, wenn sie bekannt wären. Dies geschieht über den Prozess der Quotenfindung. Dabei ist es ganz egal, ob dies über die kollektive Intelligenz oder das Wissen der Sharps passiert.
Pinnacle-Quoten zu schlagen, ist - zumindest in der englischen Fußballliga - nichts für schwache Nerven.
Der Job der Buchmacher besteht darin, so nah wie möglich an die wahren Quoten heranzukommen. Damit sichern sie sich bestmöglich gegen Risiken ab, um langfristig ihre Market-Maker-Provisionen zu erreichen. Die Aufgabe der Wettenden besteht darin, ihre Fehler ausfindig zu machen.
Eine Möglichkeit, um zu überprüfen, ob der Buchmacher nah an den echten Quoten ist, ist herauszufinden, ob das Wetten auf alle Quoten unsere Kosten decken würde, bevor deren Marge Anwendung findet. Wenn außerdem die Variabilität in den Auszahlungen von kleinen Wetten genauso verteilt ist wie beim Werfen einer Münze und wenn diese Auszahlungen zurück zum Mittelwert gehen, dann sind dies weitere Anzeichen dafür, dass deren Quoten effizient sind und die Performance-Variationen eher ein Rauschen als vielmehr ein Signal darstellen.
Sehen wir uns einige Daten an. Für die vergangenen drei abgeschlossenen Saisons (2016/17 bis 2018/19) des professionellen englischen Ligafußballs habe ich die Schlussquoten von Pinnacle mit den abgezogenen Margen (die fairen Quoten) verwendet und damit einen Mannschaftspunktestand für jedes Team berechnet. Die einfache Scoring-Regel, die ich bereits in der Vergangenheit verwendet habe, ist wie folgt definiert.
Wenn ein Team gewinnt, wird ein Punkt von 1 – 1/Quoten vergeben
Wenn ein Team nicht gewinnt, wird ein Punkt von 1 – 1/Quoten vergeben
Daher bewegen sich die Mannschaftspunktezahlen für Einzelspiele zwischen einem theoretischen Maximum von +1 und Minimum von -1.
Für die vier Ligen über die drei Saisons (6.108 Spiele und 12.216 Punkte) beträgt die durchschnittliche Punktezahl 0,0030 mit einer Standardabweichung von 0,4557. Damit sieht dies sehr nach einer erwarteten durchschnittlichen Punktzahl von 0 aus, wenn die fairen Quoten durchschnittlich perfekt wären.
Eine zufällige Punkteverteilung?
Wie sieht es bei der Verteilung der Punkteproben aus? Nachdem ich die Daten pro Mannschaft und Spiel sortiert hatte, habe ich eine Reihe von 6-Spiel-Punktezahlen für jedes Team berechnet. Natürlich gibt es keine Punktzahlen für die ersten fünf Spiele einer Saison.
Die durchschnittliche 6-Spiel-Punktezahl lag bei 0,0032, mit einer Standardabweichung von 0,1866. Deren Verteilung wird in der blauen Linie in der Grafik unten dargestellt. Die orangefarbene Linie zeigt die theoretische normale Verteilung der Punktzahlen, wenn diese zufällig erstellt worden wären. Hier geht es darum, den Unterschied zwischen dieser Verteilung und der auf aktuellen Ergebnissen basierenden Verteilung der Punktzahlen zu finden.
Die Standardabweichung ist außerdem fast genau so groß wie jene, die aus den ersten Prinzipien mit dem Standardfehler des Mittelwertes prognostiziert wurde,
wobei σ die Standardabweichung in den Punktzahlen für die gesamte Gruppe darstellt und n die Probengröße ist, in diesem Fall 6.
Damit weist diese Zahl einen bedeutenden Unterschied zur beobachteten Zahl von 0,1866 auf. Wir können erneut die Standardfehlerformel verwenden, um die erwartete Standardabweichung in dieser Standardfehlerzahl, mit anderen Worten den Standardfehler des Standardfehlers, zu ermitteln. Mit 10.836 6-Spiel-Proben wird dies wie folgt berechnet.
Daher ist 0,1860 nur ein Drittel der Standardabweichung von 0,1866, und befindet sich damit innerhalb der Grenzen der statistischen Signifikanz. Der Unterschied zwischen Beobachtung und erwarteter Zufälligkeit besteht nur aufgrund des Zufalls.
Dies bedeutet, dass die Quoten von Pinnacle ein exzellentes Maß der Wahrheit sind, und dass weiterhin die große Mehrheit der Auszahlungen, zumindest über 6 Spiele, eine Frage von Glück oder Pech sein werden.
Für diese - für viele ungenießbare Wahrheit - werde ich viel kritisiert. Die größte Kritik bezieht sich auf den Ausdruck „im Durchschnitt". Auch wenn die Fußballquoten von Pinnacle im Durchschnitt effizient sind, wetten Wettende doch nicht auf Durchschnitte. Das stimmt sicherlich, doch der schwierigste Teil besteht darin, die spezifischen Fehler der Buchmacher systematisch zu finden. Die Beweise zeigen, dass die große Mehrheit diese zufällig findet.
Ich habe dies für Proben mit 12 und 24 Spielen wiederholt. Die Punkteverteilungen werden unten angezeigt. Sie folgen den zufällig vergebenen normalen Verteilungen noch genauer als den 6-Spiel-Punktzahlen.
Durchschnittliche 12- und 24-Spiel-Punktzahlen lagen bei jeweils 0,0037 und 0.0049 (der kleine Unterschied zwischen allen drei ist wahrscheinlich auf Glück und unterschiedliche Gruppengrößen der beitragenden Spiele zurückzuführen). Standardabweichungen lagen bei jeweils 0,1301 und 0,0916, verglichen mit den mit dem Standardfehler berechneten 0,1315 und 0,0930. Diese Unterschiede von den Erwartungen liegen jeweils bei etwa 1 Standardabweichung. Auch hier wird davon ausgegangen, dass diese alleinig durch Glück hervorgerufen werden.
Zurück zum Mittelwert
Wenn Abweichungen in durchschnittlichen Punktzahlen für 6 Spiele systematisch wären, dann könnten wir eventuell Vorhersagen treffen. Für Mannschaften, die gut in Form sind und über 6 Spiele positive durchschnittliche Punktzahlen aufweisen, könnten wir zum Beispiel vorhersagen, dass auch in den nächsten sechs Spielen positive durchschnittliche Punktzahlen erwartet werden können. Leider ist das allerdings nicht der Fall. Bei Sechs-Spiel-Proben ist ein fast perfekter Rückgang zum Mittelwert zu beobachten.
- Lesen Sie: Regression zum Mittelwert bei Sportwetten
Bitte beachten Sie jedoch, dass ich damit nicht sagen will, dass in sechs Spielen stärkere Mannschaften in den nächsten sechs Spielen schwächer werden. Ganz im Gegenteil: Stärkere Teams bleiben häufig auch stärkere Teams. Schauen Sie sich nur Liverpool in dieser Saison an. Ich möchte damit sagen, dass die erzielten Punkte, die sie für ihre Leistung erhalten, die auf dem Wettmarkt als Handicap eingesetzt werden, um ihre Fähigkeiten zu berücksichtigen, zum Mittelwert zurückgehen.
Die nachfolgende Grafik zeigt, dass es im Durchschnitt praktisch unmöglich ist, auf der Basis der ersten sechs Spiele den durchschnittlichen Punktestands eines Teams für Spiele 7 bis 12 vorherzusagen. Auch wenn es für die Fußballmannschaften Glückssträhnen gibt, ist dies bei den auf die Handicap-Resultate Wettenden nicht der Fall.
Die Fähigkeiten der Buchmacher, Quoten zu erstellen, sowie die Kompetenz der Wettenden, jegliche möglicherweise bestehenden Fehler auszuspielen, bedeutet, dass bei Marktschluss all die zu erkennenden Variationen der Wettspielstände das Ergebnis aleatorischer Unsicherheit ist: des Glücks.
Eine Scoring-Regel?
Letzten Monat habe ich die Verwendung des Rank Probability Score (RPS) als Scoring-Regel diskutiert, mit der die Effizienz des Fußballwettmarkts von Pinnacle besser gemessen werden kann. Wir könnten uns die in diesem Artikel verwendete Scoring-Regel auf ähnliche Art und Weise vorstellen.
Wenn die Quoten von Pinnacle hundertprozentig effizient wären, dann würde die durchschnittliche Gruppenpunktezahl bei genau 0 liegen. Natürlich werden wir, wie bei RPS, niemals wissen, wie viel der Abweichung ein Resultat der aleatorischen Unsicherheit (Zufälligkeit der Ergebnisse) ist und wie viel das Resultat der epistemischen Unsicherheit (Fehler im Quotenerstellungsmodell des Buchmachers) ist. Auf die Art und Weise, wie ich die Marge von den Pinnacle-Quoten abgezogen habe, habe ich möglicherweise einen zweiten epistemischen Fehler eingefügt. Da ich nicht genau weiß, wie diese Marge berechnet wird, musste ich den abzuziehenden Betrag abschätzen.
Trotzdem ist die Nähe der durchschnittlichen Gruppenpunktzahl zu 0 sowie die Nähe der Verteilungen der durchschnittlichen Punktzahlen der Spielproben an einer zufälligen Verteilung ist ein starker Beweis für die Effizienz der Fußballwettquoten von Pinnacle.
Und was ist mit dem Hot-Hand-Phänomen?
Bei dieser ganzen Diskussion bleibt jedoch nach wie vor ein Problem. Vor zwei Jahren stellte ich ein Wettsystem vor, das versucht, aufgrund des Hot-Hand-Phänomens auftretende Ineffizienzen der Fußballwettquoten von Pinnacle auszunutzen.
Die grundlegende Annahme bestand darin, dass Wettende möglicherweise an Glückssträhnen glauben. Daher könnten sie auf Mannschaften wetten, die sich in einer Siegesserie befinden, mit zu den wahren Ergebniswahrscheinlichkeiten im Verhältnis niedrigeren Quoten. Dagegen würden kalte Teams unterwettet, mit höheren Quoten und potenziell entstehenden lukrativen Möglichkeiten.
Der Unterschied zwischen Wetteinsätzen auf relativ kältere Teams versus relativ heißere Teams über 6-Spiel-Sequenzen war nur wenig signifikant (p-Wert = 0,02 für die analysierte Spielgruppe). Für die kältesten versus heißesten Teams war dies viel stärker (p-Wert = 0,001) und aus einer Probe von mehr als 5.000 Einsätzen (Durchschnittsquote 3,9) hätte von den Pinnacle-Schlussquoten ein tatsächlicher Gewinn von 2,7 % erzielt werden können. Doch wenn die Analyse den Markt als hundertprozentig effizient darstellt: War all das nur ein glücklicher Zufall?
Die Aufgabe der Buchmacher besteht darin, so nah wie möglich an die wahren Quoten heranzukommen... Die Aufgabe der Wettenden besteht darin, ihre Fehler ausfindig zu machen.
Es ist möglich. Diese 2,7 % Gewinn könnten in 7 von 100 Fällen durch Zufall erreicht werden, statistisch gesehen gibt es dafür also kaum eine Garantie. Wenn Sie sich dennoch die durchschnittlichen 6-Spiel-Punktzahlverteilungen noch einmal anschauen, dann sehen Sie, dass es weniger große negative Punktzahlen gibt, als man diese durch Zufall erwarten würde. 438 von ihnen liegen unter -0,3, verglichen mit 563 zufällig generierten.
Möglicherweise kann dies damit erklärt werden, dass sich die Quoten von aufeinanderfolgend verlierenden Teams, die von Wettenden unterwettet werden, stärker erhöhen als sie sollten. Das bedeutet, dass sie bei jedem Verlust einen relativ kleineren negativen Punktestand erhalten. Hätten Sie auf diese 438 Mannschaften mit einem durchschnittlichen 6-Spiel-Punktestand von weniger als -0,30 in ihrem 7. Spiel gewettet, hätten Sie einen Gewinn von 11,6% (Durchschnittsquote 3,22, p-Wert = 0,06) erzielt.
Tatsächlich waren 438 Punkte von weniger als -0,3 ein sehr gutes Ergebnis. Bei diesen Quoten brachte die Simulation der Ergebnisse, basierend auf ihren implizierten Wahrscheinlichkeiten eine erwartete Zahl von 513 hervor, mit nur 2,5 %, die in einer Monte Carlo Simulation weniger als 438 aufzeigten. Diese erwartete Zahl von 513 können wir dann mit der erwarteten Zahl unter Annahme einer perfekt normalen Verteilung und einem durchschnittlichen Gruppenpunktestand von 0 vergleichen. Heraus kommt dabei 584. Nur 3,5% der Simulationsdurchläufe zeigten mehr als 584 durchschnittliche 6-Spiel-Punktzahlen von weniger als -0,3. Statistiker würden dies als schwach signifikant beschreiben. Vielleicht ist die Verteilung der 6-Spiel-Punkte eben doch kein Zufall.
Natürlich sollte die gleiche Überlegung auch für heiße Teams gelten. Durch aufeinanderfolgende Gewinne sollten sich ihre Quoten im Verhältnis zu den wahren Ergebniswahrscheinlichkeiten erhöhen. Das bedeutet, dass es auch hier weniger große positive Punktzahlen als erwartet geben sollte. Das sehen wir jedoch nicht in dieser Datenprobe.
Im Hinblick auf Zufälligkeit und Effizienz bei Fußballwetten gibt es noch immer viel zu lernen
Wenn es überhaupt nicht zufällige Aspekte in der Verteilung der Fußballwettpunkte gibt, dann beweist diese Analyse, dass sie schwer zu finden sind. Zwischen einem zufälligen Rauschen und einem potenziell verwertbaren systematischen Signal besteht in der Tat ein schmaler Grat, der sich nur nach langer und wiederholter Spielpraxis den talentiertesten und fleißigsten Wettenden erschließt.
Herausgekommen ist dieser Artikel. Diese Ideen sind nicht neu, sie werden lediglich in einem anderen Licht präsentiert. Ich hoffe, dass es Ihnen weiterhilft.
Generell ist deutlich, dass die Quoten von Pinnacle sehr effizient sind (auch wenn nur im Durchschnitt). Systematische Ineffizienzen - wozu womöglich das Hot-Hand-Phänomen gehört - sind schwer fassbar. Weiterhin ist Pinnacle sehr erfolgreich darin, diese Ineffizienzen aufrecht zu erhalten, und diese bleiben größtenteils in ihren Margen. Pinnacle-Quoten zu schlagen, ist - zumindest in der englischen Fußballliga - nichts für schwache Nerven.