Jul 4, 2019
Jul 4, 2019

Teil zwei: Positionieren sich Buchmacher auf den Point-Spread-Märkten?

Auf welche Art von Daten schauen wir?

Ein genauerer Blick auf die Spreads

Systematisch oder zufällig?

Teil zwei: Positionieren sich Buchmacher auf den Point-Spread-Märkten?

In Teil eins dieses Artikels haben wir uns die Frage gestellt, ob Buchmacher sich aufgrund der Überbewertung der Favoriten durch den Wettmarkt auf Point-Spread-Märkten positionieren könnten. In Teil zwei werden wir versuchen, diese Frage anhand von NBA-Wettdaten aus der letzten Zeit zu beantworten. Lesen Sie weiter, um mehr zu erfahren.

Positionieren sich Buchmacher auf den Point-Spread-Märkten? Im ersten Teil dieses zweiteiligen Artikels habe ich ein Gedankenexperiment, das erklären würde, warum sie dies eventuell tun, und beweiskräftige Thesen des Ökonomen Steven Levitt vorgestellt, die nahelegen, dass Buchmacher NFL-Handicap-Quoten manipulieren, um von der Vorliebe der Wettenden für Favoritensiege – und damit auch für Handicap-Wetten auf Favoriten – zu profitieren.

Eine solche systematische Voreingenommenheit kann durch intuitives Vertrauen erklärt werden: Je größer das Vertrauen eines Wettenden ist, dass ein bestimmtes Team gewinnt (also je mehr er dieses als Favoriten ansieht), um so wahrscheinlicher ist es, dass er auch an einen Handicap-Sieg dieses Teams glaubt.

Levitt fand heraus, dass nicht nur 60 % der Wettenden in NFL-Point-Spread-Märkten am liebsten auf die Favoriten wetten, sondern dass diese Favoriten in 48 % den jeweiligen Spread nicht abdecken. Für einen Buchmacher mit einer theoretischen Marge von 2,5 % würde eine solche Verteilung der Geschehnisse eine Profitsteigerung auf 3,3 % ausmachen. 

Nun möchte ich untersuchen,. ob eine ähnliche Voreingenommenheit auch in Point-Spread-Daten aus der letzten Zeit auf dem NBA-Wettmarkt zu finden ist.

Auf welche Art von Daten schauen wir? 

Für diese Analyse habe ich einen Datensatz aus Ergebnissen und Quoten aus den letzten 12 Spielzeiten zugrunde gelegt, der uns von Sportsbook Reviews zur Verfügung gestellt wurde. Der Zeitraum der Analyse erstreckt sich vom 30. Oktober 2007 bis zum 5. Mai 2019 und umfasst 15.508 NBA-Matches. Die verwendeten Spread-Werte waren diejenigen bei Schließung des Marktes.

Indem wir verschiedene Handicap-Schwellenwerte gewählt haben, um den Test durchzuführen, nachdem wir die Daten grafisch dargestellt hatten, sind wir das Risiko eingegangen, willkürlich Werte zu wählen, die unsere Hypothese stützen, anstatt die Daten an die Hypothese anzupassen.

Es wurden keine wirklichen Quoten zur Verfügung gestellt, aber es darf angenommen werden, dass die Spreads durchschnittlich 50-50-Spezialwetten darstellten (z. B. 1,95/1,95 oder 1,91/1,91 bzw. in US-Format 105/-105 oder -110/-110, nach Anwendung der Marge). Wenn diese Annahme stimmt, sind für die folgende Analyse keine wirklichen Quoten erforderlich. 

Sportsbook Reviews berichtet, dass vor 2015 Spread-Werte von 5Dimes, Betonline, Bookmaker, Heritage, Pinnacle und Sportsbook.com kamen, danach von Westgate Superbook mit Aufschlägen bei 5Dimes und Bookmaker. Genauere Informationen darüber, welche einzelnen Spreads von welchem speziellen Buchmacher kamen, wurden nicht zur Verfügung gestellt. 

15.311 der 15.508 Matches hatten bei Marktschließung einen Handicap-Favoriten (wobei das Handicap für eines der Teams ≤ -0,5 war). In 254 dieser Spiele deckte der Favorit (und damit natürlich auch der Außenseiter) den Point-Spread genau ab. In den übrigen 15.057 Spielen deckten 7.541 oder 50,08 % der Favoriten den Spread ab – und ebenso 7.516 oder 49,92 % der Außenseiter. Die Differenz zur Erwartung von 50-50 hat einen Chi-Quadrat-Test-P-Wert von 84 %. Mit anderen Worten: Es gibt keine statistisch signifikante Differenz zu einer systematischen Voreingenommenheit. So viel zu den 48 %.

Ein genauerer Blick auf die Spreads

Dieses Ergebnis unterscheidet sich stark von dem von Levitts NFL-Analyse. Aber lassen Sie uns unsere Suche nach einer Voreingenommenheit noch nicht aufgeben. Denken wir daran: Die Erklärung des intuitiven Vertrauens legt nahe, dass, je höher das Moneyline-Vertrauen in den Favoriten ist, desto wahrscheinlich es ist, dass ein Wettender auch auf dem Spread-Markt auf den Favoriten setzt, was Buchmacher dazu ermuntert, ihre Spreads für höhere Handicaps zu manipulieren.

Im Diagramm unten sehen Sie den kumulativen Prozentwert von Favoriten, die den Spread abdecken, in Spielen, die nach Punkte-Handicap geordnet sind, und zuerst die höchsten Handicaps. Wie wir sehen, ist die X-Achsen-Skala nicht linear, da es weit weniger hohe Handicaps gibt als niedrige. 

in-article-points-spread-in-article-1.jpg

Wenn wir die höchsten Handicaps ignorieren (bei denen die geringe Probengröße die Varianz beträchtlich erhöht), zeigen die Daten eine klare Evidenz einer Point-Spread-Voreingenommenheit, auch wenn diese verschwindet, wenn wir Handicaps von Null bei gleich bewerteten Teams erreichen. Zum Beispiel wurden von den 1.303 Matches mit einem Schlusshandicap von ≥ 12 nur 47,0 % von den Favoriten abgedeckt. In den 2.600 Matches mit einem Schlusshandicap von ≥ 10 deckten nur 48,3 % der Favoriten den Spread ab. Und für die 4.701 Matches mit einem Schlusshandicap von ≥ 8 ergab sich ein Wert von 49,4 %.

Systematisch oder zufällig?

Die Frage ist nun, ob diese Voreingenommenheit von Bedeutung und statistisch signifikant oder nur ein zufälliges Ergebnis aufgrund einer kleinen Probengröße ist. Bei den Handicap-Höhen ≥ 12 bestätigt ein T-Test, dass die Wahrscheinlichkeit, dass 47 % der Favoriten den Thread nur zufällig abdecken (ausgehend von einer Erwartung von 50 %), bei lediglich 0,3 % beträgt.

Dies würde im Normalfall als statistisch signifikant betrachtet (p-Werte < 5 % oder von 1 % gelten normalerweise als kritische Schwellenwerte für die statistische Signifikanz), und wir würden die Null-Hypothese ausschließen, dass es keine Voreingenommenheit gibt ؘ– zugunsten einer anderen, die besagt, dass nicht zufällig eine Art von Voreingenommenheit in den Handicaps existiert. Wie in Teil eins beschrieben ist der am meisten einleuchtende Grund, dass Buchmacher ihre Spreads manipulieren, um die Wettenden auszunutzen.

Aber dabei gibt es leider drei Fallen. Die erste ist, dass der mit dem 10-Punkte-Handicap assoziierte p-Wert von 1,7 % statistisch weniger signifikant ist, während derjenige für das 8-Punkte-Handicap (25,2 %) statistisch überhaupt nicht signifikant ist.

Die zweite ist, das die Anwendung des T-Tests in diesem Fall eventuell gar nicht angebracht ist, da wir mit Datenzählungen arbeiten (die Anzahl der Abdeckung von Spreads durch Favoriten), die keiner bekannten Datenverteilung entsprechen. Stattdessen können wir den zwar robusten, aber weniger leistungsstarken nichtparametrischen verteilungsfreien Chi-Quadrat-Test durchführen. Der Chi-Quadrat-p-Wert für den 12-Punkte-Handicap-Schwellenwert beträgt z. B. 3,3 %.

Je größer das Vertrauen eines Wettenden ist, dass ein bestimmtes Team gewinnt (also je mehr er dieses als Favoriten ansieht), um so wahrscheinlicher ist es, dass er auch an einen Handicap-Sieg dieses Teams glaubt.

Letztlich ist überhaupt nicht klar, wie hoch das Handicap sein muss, das wir betrachten, wenn wir nach einer Voreingenommenheit suchen. Indem wir verschiedene Handicap-Schwellenwerte gewählt haben, um den Test durchzuführen, nachdem wir die Daten grafisch dargestellt hatten, sind wir das Risiko eingegangen, willkürlich Werte zu wählen, die unsere Hypothese stützen, anstatt die Daten an die Hypothese anzupassen. Ein solches Data-Mining ist nie eine gute Idee. Wettende, die auf diesem Wege profitable Systeme „entdecken“ möchten, tun dies auf eigene Gefahr.

Im Extremfall könnten wir einen p-Wert für jeden Punkt in der Reihenfolge von Punkt-Handicap-Werten berechnen. Hier wären das 15.310 Werte. Das könnte zum Problem der Alphafehler-Kumulierung führen, was bedeutet, dass wir gleichzeitig einen Reihe statistischer Tests durchführen, von denen jeder das Potenzial hätte, zu einer bedeutenden Schlussfolgerung zu führen. Wenn z. B. ein Test mit einem kritischen p-Wert (Schwellenwert für die statistische Signifikanz) auf 5-%-Ebene durchgeführt wird und die Null-Hypothese – dass kein Grund außer dem Zufall erkennbar ist – wahr ist, beträgt die Chance, dass die Nullhypothese fälschlicherweise abgelehnt wird, nur 5 %.

Wenn allerdings 100 Tests durchgeführt werden, bei denen alle entsprechenden Null-Hypothesen wahr sind und die Tests statistisch unabhängig voneinander sind, beträgt die Wahrscheinlichkeit mindestens einer fehlerhaften Ablehnung 99,4 %. Dann können wir kein großes Vertrauen in unsere Hypothesentests haben, außer wenn wir eine Korrektur einbauen.

Eine häufig verwendete Methode dafür ist die Bonferroni-Korrektur. Um eine Bonferroni-Korrektur anzuwenden, müssen wir einfach den kritischen p-Wert durch die Anzahl der durchgeführten Vergleiche dividieren. Wenn also beispielsweise der kritische Wert für einen einzelnen Test 5 % betrüge, würde dieser Wert bei 10 gleichzeitigen Tests auf 0,5 % reduziert. Wenn keiner der 10 p-Werte unter diesen eher anspruchsvollen Schwellenwert fällt, können wir die Null-Hypothese nicht ausschließen, dass alles, was wir sehen, nur zufällig passiert ist. 

Das nächste Diagramm zeigt die Entwicklung des p-Wertes im t-Test und im Chi-Quadrat-Test für aufeinanderfolgende kumulative Match-Stichproben in der Rangliste der Punkte-Handicaps. Die y-Achse ist logarithmisch. Auch der kritische p-Wert nach der Bonferroni-Korrektur wird gezeigt – unter der Annahme, dass der kritische Wert für einen Test 5 % betrug und 15.310 gleichzeitige Tests durchgeführt wurden.

in-article-points-spread-in-article-2.jpg

Die nichtparametrischen Chi-Quadrat-Tests zeigen systematisch mehr konservative p-Werte und sind wahrscheinlich die relevanteren, auf die geachtet werden sollte. Selbst für die p-Werte in den t-Tests gab es keine einzelne Zahl, die den korrekten kritischen Wert erreichte, der uns erlauben könnte, den Zufall als einzigen Grund für das, was wir sehen, auszuschließen.

Genau genommen wird bei der Bonferroni-Korrektur angenommen, dass alle gleichzeitigen Tests voneinander unabhängig sind. In einer Rangliste von Punkte-Handicaps, in der wir progressiv versuchen herauszufinden, ob aufeinanderfolgende immer größere Stichproben von Favoriten den Spread zusammen in weniger als 50 % aller Fälle abdecken, ist dies offensichtlich nicht der Fall. Deshalb ist unser korrigierter kritischer Schwellenwert wahrscheinlich viel zu konservativ. Ich habe diese Methode dennoch grafisch dargestellt, um potenzielle Fallgruben zu zeigen, die darin liegen, eine statistische Signifikanz anzunehmen, obwohl diese wahrscheinlich nicht existiert. 

Was lernen wir aus dieser Analyse?

Aus qualitativer Sicht würde ich dieser Ergebnisse wie folgt zusammenfassen. Ja, es scheint eine Point-Spread-Voreingenommenheit für die Favoriten im NBA-Wettmarkt zu geben, aber diese existiert nur bei den höchsten Handicap-Werten. Wenn es eine statistische Signifikanz für diese Voreingenommenheit gibt, die einen anderen ursächlichen Grund dafür angibt als den Zufall, z. B. eine Spread-Manipulation durch den Buchmacher, ist diese wahrscheinlich schwach.

Wenn Buchmacher den Spread auf die Weise manipulieren, in der Levitt es für die NFL nahelegt, ist diese Manipulation im Umfang sehr begrenzt. Eine intuitive Voreingenommenheit könnte die Erklärung dafür sein, dass Wettende übermäßig häufig auf das höchste Handicap wetten, aber wenn sie dies tun, kann der Buchmacher das nur in sehr minimalem Maß ausnutzen. Wenn versucht wird, es durch eine weitere Verschiebung der Spreads stärker auszunutzen, ist die Reaktion der Wettenden wahrscheinlich nicht linear, was sämtliche Hoffnungen des Buchmachers auf zusätzlichen Profit zunichte macht.

Wenn Sie, quasi als „Querdenker“, in diesen 12 Spielzeiten immer auf die Außenseiter gewettet hätten, hätte sich Ihr Ertrag anhand der Handicap-Ranglisten und mit angenommenen Quoten von 1,95 (-105) und einer Marge des Buchmachers von 2,5 % wie hier gezeigt entwickelt.

in-article-points-spread-in-article3.jpg

Ja, es wäre möglicherweise profitabel gewesen, der Querdenker zu sein und darauf zu wetten, dass die größten Außenseiter den Spread abdecken. Dennoch wäre der Ertrag gering gewesen, und es bleibt die Frage, ob er wirklich statistisch signifikant und auch in Zukunft dauerhaft ist. Sehr ähnlich wie beim Favourite-Longshot-Bias in Wettmärkten mit festen Quoten ist die potenzielle Profitabilität wohl auf die Wetten gegen die deutlichsten Favoriten begrenzt, während ein Großteil des Marktes sich innerhalb der Risikotoleranzen bewegt, die sich aus der Marge des Buchmachers ergeben.

Höchstwahrscheinlich gibt es generell keinen Unterschied zwischen Favoriten und Außenseitern im Hinblick auf die Gesamtheit der Spread-Werte: Sie decken den Spread in gleicher Weise ab. Während für die deutlichsten Favoriten Nischen der Ineffizienz existieren, scheinen durchschnittliche Handicap-Quoten in der NBA sehr repräsentativ für die wahren Wahrscheinlichkeiten zu sein, dass die Teams diese Spreads abdecken.

Wenn eine mehr allgemeine Voreingenommenheit zu dem Zeitpunkt existiert hat, an dem Levitt die NFL-Märkte analysiert hat, scheint diese weitgehend verschwunden zu sein. Sobald Ineffizienzen öffentlich bekannt sind, sind sie normalerweise nicht mehr lange „haltbar“.

Wettressourcen – Für bessere Wetten

Die Wettressourcen von Pinnacle sind eine der umfangreichsten Sammlungen von Expertenratschlägen zum Thema Wetten im Internet. Sie richten sich an alle Erfahrungslevel mit dem Ziel, den Wettenden wertvolles Wissen zu vermitteln.