Nov 1, 2018
Nov 1, 2018

Die Hot Hand: jetzt noch heißer

Bezifferung von Stichprobenfehlern

Hot-Hand-Würfe im NBA-All-Star Weekend Three-Point Shootout

Der Hot-Hand-Trugschluss: Intuition vs. Analyse

Die Hot Hand: jetzt noch heißer

Es gibt im Sport einen allgemeinen Glauben an das Momentum, die so genannte „Hot Hand“, obwohl Untersuchungen dieses Konzept widerlegen. Sollten Wettende das Konzept der Hot Hand verwerfen? Dieser Artikel zeigt, dass das ein Fehler sein könnte.

1985, in dem Jahr, als Michael Jordan zum „Rookie of the year“ der NBA gewählt wurde, erschien im Journal of Cognitive Psychology ein Artikel, in dem die allgemein vertretene Annahme widerlegt werden sollte, dass Basketball-Spieler phasenweise eine bessere Wurfleistung erbringen, als aufgrund des Zufalls erwartet werden könnte.

Vor allem schlossen die Autoren des Artikels (Gilovich, Vallone und Tversky – im Folgenden „GVT“), dass der weithin vorherrschende Glaube an das Momentum bei den Würfen von Basketballern eine „kognitive Täuschung“ sei. Dieses Phänomen wurde als Hot-Hand-Trugschluss bezeichnet und zeigt Parallelen zum mehr allgemeinen Glücksspieler-Trugschluss. Die offensichtliche Täuschung wurde als menschliches Verlangen erklärt, nach Mustern und Sinnhaftem in zufälligen Abfolgen zu suchen.

Der Glaube an Glücks- und Pechsträhnen oder an die Hot Hand im Sport ist sicherlich nicht auf den Basketball begrenzt. Begriffe wie „in Form“ „gut drauf“, „in ihrem Element“ oder „Glückssträhne“ haben in vielen Sportarten als Redewendungen in Kommentaren und Analysen die Jahrzehnte überdauert.

Und dies trotz der Ergebnisse von GVT und zahlloser folgender Artikel, die den Hot Hand-Trugschluss erklären. Bis heute verwenden Kommentatoren in fast jeder Sportübertragung Begriffe, die ein Momentum in der Leistung, also quasi eine Abweichung vom Zufall nahelegen.

Warum haben Sportfans und -kommentatoren diese Idee vom Momentum im Sport mehr als 30 Jahre weitergetragen? Neuere Forschungen zeigen, dass unsere Intuition hinsichtlich des Vorhandenseins eines Momentums wahrscheinlich die ganze Zeit über korrekt war.

In ihrem Artikel „Surprised by the Gambler's and Hot Hand Fallacies? A Truth in the Law of Small Numbers“ („Überrascht vom Glücksspieler- und Hot-Hand-Trugschluss? Eine Wahrheit im Gesetz der kleinen Zahl“) zeigen Miller und Sanjurjo, dass die Basketballer in der Untersuchung von GVT in Wirklichkeit doch eine Hot Hand hatten und der Hot-Hand-Trugschluss also seinerseits ein Trugschluss ist. Der Grund für die somit fehlerhaften Ergebnisse der Untersuchung von GVT aus dem Jahr 1985 liegt in einem simplen, aber wichtigen Stichprobenfehler. Dieser lässt sich am besten anhand eines Beispiels erklären.

Nehmen wir an, Sie werfen fünfmal eine Münze in die Luft. Sie möchten nun die Ergebnisse jedes Wurfs, der direkt auf „zweimal hintereinander Kopf“ folgt, untersuchen und aufzeichnen. Was ist der erwartete Anteil des Ergebnisses „Kopf“ nach fünf Würfen? 50 %? Weniger oder mehr als 50 %?

Man könnte annehmen, so wie GVT es taten, dass die Wahrscheinlichkeit bei 50 % liegt, da die Münze zwei Seiten hat. Aber sie liegt niedriger. Wenn Sie fünfmal eine Münze in die Luft werfen, gibt es 32 mögliche Ergebnisse, die alle gleich wahrscheinlich sind. Diese sind unten in Spalte 2 zu sehen.

hot-hand-1.png

In 16 der 32 möglichen Sequenzen gibt es mindestens zweimal hintereinander Kopf vor Wurf Nr. 5. Die 16 Sequenzen teilen sich folgendermaßen auf: In 8 gibt es 0 % Kopf, 3 haben 50 % Kopf, 1 hat 67 % Kopf und 4 haben 100 % Kopf. Wenn wir voraussetzen, dass jede dieser 16 Sequenzen gleich wahrscheinlich ist, beträgt die erwartete Wahrscheinlichkeit, dass nach „zweimal hintereinander Kopf“ noch einmal Kopf kommt, nur 38,5 %.

hot-hand-2.png

Dieses Ergebnis scheint der Intuition zu widersprechen und hat zu Fehlern im Artikel von GVT und folgenden Untersuchungen zur Hot Hand geführt. Um den Fehler visuell zu verstehen, betrachten wir nun ein einfacheres Szenario: Wir möchten die Wahrscheinlichkeit kennen, mit der Kopf auf „einmal Kopf“ folgt. Das Diagramm unten stellt diese Erwartung bei 500 Würfen einer Münze dar, gewonnen aus 5.000 Simulationen.

hot-hand-3.png

Bezifferung des Stichprobenfehlers

Der Fehler kann als vertikaler Abstand zwischen der orangen Linie und der wahren bedingungslosen Erwartung, 50%, beziffert werden. Wenn die Münze nur zehnmal geworfen wird, beträgt die Wahrscheinlichkeit, dass auf „einmal Kopf“ nochmals Kopf folgt, 44,5 %. Somit beträgt der Fehler 5,5 Prozentpunkte.

Nun ist es aber im Sport unüblich, dass von einer „Hot Hand“ geredet wird, wenn nur ein Tor erzielt oder nur ein Punkt gewonnen wurde. Das Diagramm unten stellt den Fehler für die Wahrscheinlichkeit eines Erfolgs nach einer Serie von „k“ aufeinanderfolgenden gleichen Erfolgen bei einer tatsächlichen Wahrscheinlichkeit von 50 % dar. Auch hier habe ich 5.000 Simulationen durchgeführt.

hot-hand-4.png

Wir können sehen, dass der Fehler sich mit der Dauer der aufeinanderfolgenden Erfolge erhöht und mit der Anzahl der Versuche abnimmt. In ihrer Untersuchung entwickelten GVT ein kontrolliertes Basketball-Wurfexperiment, in dem sie 25 College-Spieler je 100 Würfe durchführen ließen und die Treffer nach einer Serie von „k“ Treffern oder Nicht-Treffern aufzeichneten (k = 1,2,3).

Die Abwurfstelle wurde für jeden Spieler so gewählt, dass mit einer 50%-igen Erfolgsrate zu rechnen war. GVT verglichen direkt die Prozentwerte der Treffer nach einer Serie von Treffern mit den Treffern nach einer ebenso langen Serie von Fehlwürfen. Ihre Hypothese war, dass die Wahrscheinlichkeit eines Treffers nach „k“ Treffern gleich der Wahrscheinlichkeit eines Treffers nach „k“ Fehlwürfen sei.

Wir wissen allerdings schon aus dem oben Dargelegten, dass eine gleiche Höhe der Prozentwerte nicht erwartet werden kann. Wenn wir annehmen, dass die wahre Wahrscheinlichkeit, dass ein Spieler bei allen 100 Würfen trifft, bei 50 % liegt, dann beträgt die Wahrscheinlichkeit eines Treffers nach einer Serie von 3 Treffern ca. 46 %. Entsprechend der Symmetrie beträgt die Wahrscheinlichkeit eines Treffers nach einer Reihe von drei Fehlwürfen ca. 54 %.

Die Größe des Fehlers ist so beträchtlich, dass, wenn er ausgeglichen wird, die Schlussfolgerungen von GVT hinsichtlich der fehlenden Hot Hand umgekehrt werden können. Denn die große Mehrheit der Spieler hatte eben doch die Hot Hand. Im Sportkontext beträgt die Wahrscheinlichkeit eines bestimmten Erfolges niemals konstant 50 %. In der NBA beträgt z. B. die prozentuale Erfolgsquote bei Freiwürfen ca. 75 %. Um zu verstehen, wie der Fehler mit der Erfolgswahrscheinlichkeit variiert, zeigt das Diagramm unten den geschätzten Fehler für eine Erfolgswahrscheinlichkeit von 75 % in 5.000 Simulationen.


hot-hand-5.png

Wenn wir die beiden Diagramme vergleichen, können wir sehen, dass der Fehler abnimmt, je mehr die Erfolgswahrscheinlichkeit steigt. Beispielsweise liegt die Wahrscheinlichkeit eines Treffers nach 5 aufeinanderfolgenden Treffern in 100 Versuchen, wenn die bedingungslose Wahrscheinlichkeit 50 % bzw. 75% beträgt, bei 38 % bzw. bei 72 %. Dies entspricht einem Fehler von 12 % (50 % minus 38 %) bzw. 3% (75 % minus 72 %).

Hot-Hand-Würfe im NBA All-Star Weekend Three-Point Shootout

Als Nächstes untersuche ich, ob die Teilnehmer an den letzten vier NBA All-Star Weekend Three-Point Shootouts (2015 bis 2018) Hot-Hand-Würfe zeigten. Der Wettbewerb bietet sich für die Hot-Hand-Analyse an, da die Bedingungen und die Abwurfstellen identisch sind und es keine Abwehr gibt, die sich dem Spieler in den Weg stellt. In diesem Format versuchen die Spieler pro Runde 25 Drei-Punkt-Würfe von 5 festgelegten Positionen auf der Linie.

In den letzten vier Jahren beteiligten sich 46 Spieler, gaben dabei insgesamt 1150 Würfe ab und trafen in 54% der Fälle. Die Tabelle unten zeigt die prozentualen Erfolge jedes Spielers nach einem Treffer, einem Fehlwurf, zwei Treffern und zwei Fehlwürfen.

Statistiken zum NBA-Drei-Punkte-Wurf-Wettbewerb

hot-hand-6.png

Die prozentualen Erfolge liegen nach einem bzw. zwei Treffen über dem Durchschnitt und nach einem bzw. zwei Fehlwürfen unter dem Durchschnitt.

Spalte 11 zeigt die berechnete Differenz in den prozentualen Erfolgen nach einem Treffer bzw. einem Fehlwurf (Treffer in % nach einem Treffer minus Treffer in % nach einem Fehlwurf). GVT wollten aus dieser Differenz ihre Schlüsse hinsichtlich der Hot Hand ziehen.

Und wenn wir die nackten Zahlen aus allen vier Wettbewerben zusammennehmen, so wie GVT es taten, sehen wir 24 Spieler mit einer positiven und 21 mit einer negativen Bilanz, und die Spieler waren nach einem Treffer um durchschnittlich 10 Prozentpunkte erfolgreicher. Allerdings kennen wir ja nun den Stichprobenfehler und müssen ihn einbeziehen.

Wenn wir ganz elementar annehmen, dass jeder Spieler eine Erfolgserwartung von 54 % hat (also den Durchschnittswert zugrunde legen), beträgt die Wahrscheinlichkeit eines Treffers nach einem Treffer ca. 52 %. Der Symmetrie entsprechend liegt dann die Wahrscheinlichkeit eines Treffers nach einem Fehlwurf bei ca. 56 %. Somit können wir 4 % zu den Werten in Spalte 11 addieren, um den Stichprobenfehler zu bereinigen.

Nach dieser Anpassung können wir nun die Statistik dahingehend interpretieren, dass ein positiver Prozentwert bedeutet, dass ein Spieler nach einem Treffer erfolgreicher war als nach einem Fehlwurf. Nach der Anpassung hatten 32 Spieler eine positive und 14 eine negative Bilanz. Im Durchschnitt lag der Erfolg eines Spielers nach einem Treffer um 14 % höher. Dies sieht nach einem starken Argument für die Hot Hand aus. 

Wenn wir die entsprechenden Anpassungen für Spalte 12 vornehmen (Treffer in % nach zwei Treffern minus Treffer in % nach zwei Fehlwürfen), haben 30 Spieler die Hot Hand (also eine positive Bilanz) gegenüber 19 bei unbereinigtem Fehler. Der durchschnittliche prozentuale Anstieg an Treffern nach zwei Treffern beträgt 29 %, was wieder nach einem starken Argument für die Hot Hand in den letzten NBA-Drei-Punkt-Wurf-Wettbewerben aussieht.

Intuition vs Analyse

Die These vom Hot-Hand-Trugschluss hat zwar mehr als 30 Jahre überdauert, aber in dieser Zeit gab es auch immer das Vertrauen der Sportfans und Kommentatoren, dass der Hot-Hand-Trugschluss selbst ein Trugschluss sein könnte und dass das Leistungs-Momentum existiert. Begriffe wie „Glückssträhne“, „in Form“ und „gut drauf’ haben das Vokabular in der Sportberichterstattung niemals verlassen, was nahelegt, dass Intuition und Instinkt genauso wichtig sind wie die statistische Analyse, wenn wir versuchen, eine sportliche Leistung zu erklären – auch wenn beide Ansätze ihre Fehler haben.

Während die akademische Welt das Momentum im Sport erst in letzter Zeit anerkennt, sind sich Wettanbieter schon länger bewusst, dass es existiert. Je nach der Sportart, dem Team und den Spielern steckt in den Quoten generell immer ein Element des Momentums.

In einem früheren Artikel habe ich die Auswirkung des Momentums zwischen den Sätzen in Profi-Tennis-Matches gezeigt. Wenn ein Wettender genauer bestimmen kann, welche Mannschaft oder welcher Spieler wahrscheinlich die in den Quoten reflektierte implizierte Wahrscheinlichkeit über- oder unterschreitet, kann er daraus Profit schlagen, unabhängig davon, ob seine Prognosen auf statistischen Analysen oder seinem Instinkt beruhen.

Wettressourcen – Für bessere Wetten

Die Wettressourcen von Pinnacle sind eine der umfangreichsten Sammlungen von Expertenratschlägen zum Thema Wetten im Internet. Sie richten sich an alle Erfahrungslevel mit dem Ziel, den Wettenden wertvolles Wissen zu vermitteln.