Sep 19, 2017
Sep 19, 2017

Die Fallstricke von Sportwettsystemen: Korrelation kontra Kausalität

Sportwettsysteme: Was ist Regressionsanalyse?

Verwendung eines Systems für Wettprognosen

Die Fallstricke der Regressionsanalyse

Die Fallstricke von Sportwettsystemen: Korrelation kontra Kausalität

Ein Wettsystem ist von großer Bedeutung, wenn es darum geht, beim Wetten langfristige Gewinne zu gewährleisten. Jedoch verwechseln Wettende häufig Geldverwaltungs- und Wettsysteme sowie Korrelation und Kausalität bei den Ergebnissen. Was ist ein Wettsystem und wie erkennt man den Unterschied zwischen Korrelation und Kausalität? Lesen Sie weiter, um mehr zu erfahren.

Was ist ein Wettsystem?

Im Gegensatz zu einer Einsatz- oder Geldverwaltungsstrategie, die eine Methode zur Zuweisung einer bestimmten Einsatzhöhe zu Ihren Wetten darstellt, ist ein Sportwettsystem eine strukturierte Prognosemethodik, die auf der quantitativen Analyse historischer Daten basiert, um die Gewinnspanne des Buchmachers zu übertreffen und einen positiven Erwartungswert zu erreichen.

Wettende verwechseln häufig Geldverwaltungs- und Wettsysteme – Suchen Sie bei Google nach „Wettsystem“ und Sie werden vor allem Strategien wie Martingale, Labouchere oder Fibonacci finden – doch in Wahrheit sind das zwei sehr unterschiedliche Dinge.

Die Geldverwaltung verändert einfach die Art der Risiken in Verbindung mit Ihren Wetten. Sie kann eine verlierende Prognosemethode jedoch nicht langfristig in eine gewinnende verwandeln. Ein Wettsystem hingegen versucht, die „wahren“ Wahrscheinlichkeiten der in einer Sportveranstaltung geschehenden Ereignisse zu ergründen.

Sportwettsysteme: Regressionsanalyse

Die meistgenutzte Methode zur Gestaltung eines Sportwettsystems ist die statistische Regressionsanalyse. Dieser Begriff mag auf Leser, die sich nicht besonders gut mit statistischen Fachbegriffen auskennen, einschüchternd wirken, doch im Grunde handelt es sich dabei einfach um eine Methode zur Einschätzung der Beziehung zwischen Variablen.

Zwar ist die Regressionsanalyse ein hilfreiches Instrument zur Gestaltung eines Wettsystems, ihre Schwäche ist jedoch ihre Unfähigkeit, zwischen Korrelation und Kausalität zu unterscheiden.

Die einfachste ist eine einfache lineare Regression, bei der nur zwei Variablen berücksichtigt werden, wie zum Beispiel die Anzahl an Toren, die ein Team erzielt (die erklärende oder unabhängige Variable), und seine Sieghäufigkeit (die erklärte oder abhängige Variable). 

In meinem ersten Buch Fixed Odds Sports Betting: Statistical Forecasting & Risk Management habe ich ein einfaches Regressionsmodell auf Grundlage der relativen Torüberlegenheit von zwei Teams in ihren vorherigen sechs Spielen besprochen.

Unter Verwendung einer großen Probengröße (in diesem Fall acht Saisons von 1993 bis 2001) ist es möglich, einen Graph zu erstellen, der die berechneten Spielwertungen (die Tordifferenz der Heimmannschaft aus den letzten sechs Spielen minus die Tordifferenz der Auswärtsmannschaft aus den letzten sechs Spielen) mit der Häufigkeit jedes Spielergebnisses korreliert. Die Verteilung der Spielwertung (unabhängige Variable) im Vergleich zur Heimsieghäufigkeit (abhängige Variable) wird im Folgenden dargestellt.

correlation-and-causation-inarticle.jpg

Zwar sind die einzelnen Datenpunkte im Graphen etwas verstreut, es ist jedoch ein eindeutiger linearer Trend zu erkennen, der die beiden Variablen in Beziehung zueinander setzt: Je besser die Heimmannschaft im Vergleich zur Auswärtsmannschaft in Bezug auf die Tordifferenz in den letzten sechs Spielen, desto wahrscheinlicher ist es, dass die Heimmannschaft das Spiel gewinnt.

Die im Graphen eingezeichnete Regressionslinie beschreibt im Grunde ein idealisiertes Verhältnis zwischen relativer Torüberlegenheit und der Heimsieghäufigkeit, bei dem Nebengeräusche sowie Glück und Pech entfernt wurden.

Die oben genannte Linie kann man durch eine Gleichung beschreiben. Da es sich um ein einfaches lineares Regressionsmodell handelt, lautet sie y = mx +c, wobei y die abhängige Variable (die Gewinnwahrscheinlichkeit), x die unabhängige Variable (die Spielwertung), m die Steigung der Trendlinie (und ein Maß für die Stärke des Zusammenhangs) und c die Konstante oder der Punkt, an dem die Linie auf die Y-Achse trifft (d.h. x = 0), ist. In diesem Beispiel ergibt sich die Gleichung durch:

Heimsiegwahrscheinlichkeit % = (1,56 x Spielwertung) + 46,5

Wenn die Spielwertung Null ist (was bedeutet, dass die Heim- und die Auswärtsmannschaft bezüglich der Tordifferenz ungefähr gleich stark sind), liegt die Gewinnwahrscheinlichkeit bei 46,5 %. Das scheint vernünftig zu sein, da 46 % aller Fußballspiele mit einem Heimsieg enden. Wenn das Heimteam in den letzten sechs Spielen eine um 10 Tore bessere Nettotordifferenz hat als das Auswärtsteam, zeigt das Regressionsmodell, dass die Gewinnwahrscheinlichkeit auf 62 % ansteigt. Bei einer 20-Tore-Überlegenheit steigt dieser Wert auf 78 %. 

Unsere Regressionsanalyse kann uns zeigen, welcher Anteil der Variabilität in der Gewinnhäufigkeit sich durch dieses Wettsystemmodell erklären lässt. In diesem Fall waren es 86 %. Das lässt sich anhand der Anpassungsgüte der Trendlinie im Verhältnis zu den Daten erkennen. Sie zeigt uns, dass es eine starke Korrelation zwischen den beiden Variablen gibt.

Verwendung eines Systems für Wettprognosen

Um unser Regressionsmodell in ein voll funktionsfähiges Wettsystem zu verwandeln, müssen wir nun Prognosen zu zukünftigen Spielen treffen, um Wetten mit einem positiven Erwartungswert zu erkennen.

Die Geldverwaltung verändert einfach die Art der Risiken in Verbindung mit Ihren Wetten. Sie kann eine verlierende Prognosemethode jedoch nicht langfristig in eine gewinnende verwandeln.

Wie bei den meisten Modellmethoden ist die Standardannahme, dass die Vergangenheit der Schlüssel zur Zukunft ist. Wenn vorherige Spiele mit einer Spielwertung von +10 in 62 % der Fälle mit einem Heimsieg endeten, ist die Annahme, dass die Wahrscheinlichkeit bei 62 % liegt, dass eine Heimmannschaft mit einer 10-Tore-Überlegenheit gegenüber dem Gegner das Spiel gewinnt. 

Diese Wahrscheinlichkeiten können wir nun einfach in „wahre“ Quoten übersetzen und so einen positiven Erwartungswert bei einem Buchmacher finden, der höhere Quoten anbietet. Durch die Verwendung dieses Modells auf die Saison 2001/02 der English Football League ist es mir gelungen, bei 526 Wetten auf die besten verfügbaren Wettquoten auf einen Heimsieg eine Umsatzrendite von +2,1 % zu erzielen. Hätte ich in jener Saison hingegen blind auf alle Heimsiege gewettet, hätte sich ein Verlust von -3,7 % ergeben.

Korrelation kontra Kausalität 

Die knapp über 500 Wetten in einer Saison sind keine Garantie, dass die Rentabilität jede Saison reproduziert werden kann. Diese Anzahl mag ausreichend groß erscheinen, um ein Wettsystem mit Sicherheit bewerten zu können, doch regelmäßige Leser unserer Wettressourcen wissen, dass das nicht der Fall ist.

Pinnacles Artikel über das Gesetz der kleinen Zahlen erinnert uns daran, dass selbst Probengrößen von 1.000 Wetten illusorische Rentabilitätsmuster zeigen können, die tatsächlich jedoch auf keiner Kausalität sondern ausschließlich auf dem Zufall beruhen. Leider hat dieses Wettsystem in den fünf darauffolgenden Saisons Verluste eingebracht.

Zwar war dieses einfache Torüberlegenheits-Regressionsmodel sehr hilfreich, um herauszufinden, welche Heimmannschaften am wahrscheinlichsten gewinnen würden, es konnte jedoch nicht gewährleisten, auch Teams zu finden, deren Gewinnwahrscheinlichkeit höher war als die durch die Quoten der Buchmacher implizierte Wahrscheinlichkeit.

Leider interpretieren viele Sportwettende beim Untersuchen ihres Wettverlaufs Präzision, Exaktheit und Validität falsch und verwechseln dabei Korrelation und Kausalität.

Mein Modell mag bei der Prognose hilfreich sein, doch es scheint weder besser zu sein als die von den Buchmachern zur Festlegung der Quoten verwendeten Modelle noch als die von anderen Wettenden genutzten Modelle, die zur Bildung und Veränderung dieser Quoten geführt haben.

Wenn mein Modell einfach die Ergebnisse der Modelle der Buchmacher nachbildete, so ist die Rentabilität nicht von Dauer und spiegelt lediglich die Launen des Zufalls wider. Es scheint, als basierte es auf keiner validen Korrelation. Die Prognosen meines Modells haben diese Gewinne nicht „verursacht“, denn sie waren nicht exakter als die anderer Modelle.

Präzision kontra Exaktheit

Ein lineares Regressionsmodell mit zwei Variablen ist selbstverständlich bei weitem nicht das ausgefeilteste Wettsystem, um einen positiven Erwartungswert zu finden. Eine multiple Regression, bei der weitere unabhängige oder erklärende Variablen eingeführt werden, ist ein Mittel, um die Präzision der Prognose zu erhöhen. Die Analysten sollten jedoch darauf achten, dass darunter nicht die Exaktheit leidet.

Bei einem präzisen Modell liegen die Messungen nahe beieinander, wie beispielsweise durch die Trendlinie in meinem einfachen linearen Regressionsmodell oben dargestellt. Präzision garantiert jedoch keine Exaktheit. Die Exaktheit ist ein Maß, wie nah man dem „wahren“ Wert kommt. Bei der Präzision kommt es zu zufälligen Fehlern und bei der Exaktheit zu systematischen (auch Bias genannt). 

Damit ein Wettsystem valid ist, also wirklich seinen Sinn erfüllt (d.h. es findet dauerhaft einen profitablen Erwartungswert), muss es sowohl präzise als auch exakt sein. Die Validität setzt sowohl Berechenbarkeit als auch Dauerhaftigkeit voraus. D.h. ein System ist nur valid, wenn es uns zeigt, ob das, was wir für die Ursache halten, wirklich die wahre Ursache ist, und wenn unsere Maße konstant auf dieselbe Schlussfolgerung hindeuten.

Leider interpretieren viele Sportwettende beim Untersuchen ihres Wettverlaufs Präzision, Exaktheit und Validität falsch und verwechseln dabei Korrelation und Kausalität. Ihr Fehler liegt darin, zu glauben, dass die Gewinne, die sie gemacht haben, durch ihr Wettsystem „verursacht“ wurden, wobei sie häufig schlicht und einfach Glück hatten.

Die Fallstricke der Regressionsanalyse

Zwar ist die Regressionsanalyse ein hilfreiches Instrument zur Gestaltung eines Wettsystems, ihre Schwäche ist jedoch ihre Unfähigkeit, zwischen Korrelation und Kausalität zu unterscheiden. Die Regressionsanalyse ist effektiv, wenn es darum geht eine Verbindung zwischen Variablen zu erkennen, beispielsweise erzielte und kassierte Tore und die Wahrscheinlichkeit, Spiele zu gewinnen, sie ist jedoch nicht in der Lage, festzustellen, ob eine Variable die andere verursacht.

Die Regressionsanalyse könnte uns möglicherweise zeigen, dass, wenn Barcelona verliert, Lionel Messi kein Tor erzielt. Daraus können wir allerdings nicht schließen, dass Barcelona verliert, weil Lionel Messi kein Tor erzielt.

Wenn wir in unserem Wettsystem keine Kausalität und Validität schaffen, müssen wir uns bewusst sein, dass es möglicherweise nicht besser ist als die Prognosemodelle, die alle anderen auch verwenden. In einem Wettbewerb der relativen Fähigkeiten wie Sportwetten werden wir nicht dafür bezahlt, dass wir lediglich die Zukunft voraussagen, sondern müssen dies besser tun als alle anderen.

Wettressourcen – Für bessere Wetten

Die Wettressourcen von Pinnacle sind eine der umfangreichsten Sammlungen von Expertenratschlägen zum Thema Wetten im Internet. Sie richten sich an alle Erfahrungslevel mit dem Ziel, den Wettenden wertvolles Wissen zu vermitteln.