close
12 12, 2016
12 12, 2016

Zákon malých čísel ve sportovním sázení

Zákon malých čísel ve sportovním sázení
Zákon malých čísel je kognitivní zkreslení, kdy lidé vykazují tendenci věřit tomu, že poměrně malý počet pozorování dobře odráží celou populaci. Čtěte dál, otestujte své logické dovednosti v nemocničním kvízu a zjistěte, jak zavádějící mohou být nejrůznější grafy, případně jak se vyhnout ztrátám při sázení podle statistik.

Nemocniční kvíz

V roce 1974 dva psychologové, Daniel Kahneman a Amos Tversky, postavili své účastníky experimentu před následující scénář a otázku. Město má dvě nemocnice. Ve větší z nich se denně narodí okolo 45 dětí, v menší okolo 15.

Jak víme, asi 50 % všech dětí jsou chlapci. Přesné procento se však každý den liší. Někdy je to více než 50 %, někdy méně. Obě nemocnice po dobu jednoho roku zaznamenávaly dny, ve kterých se narodilo více než 60 % chlapců. Která nemocnice podle vás zaznamenala více takových dní?

  •        Větší nemocnice
  •        Menší nemocnice
  •        Asi stejně (do rozdílu 5 %)

Podle binomické teorie platí, že počet dní, kdy se narodí více chlapců než dívek v poměru alespoň šest ku čtyřem, bude v menší nemocnici skoro třikrát vyšší než ve větší, jednoduše vzhledem k vyšší variabilitě jednotlivých poměrů. Větší vzorek se pravděpodobně méně vzdálí od 50 %. Správnou odpověď však uvedlo pouze 22 % respondentů.

Co je heuristika?

Kahneman a Tversky popsali tuto chybu jako důvěru v zákon malých čísel. Obecněji pak platí, že úsudky vytvořené na základě menších vzorků jsou často nesprávně považovány za reprezentativní pro širší populaci. Například malý vzorek, který vypadá jako náhodně rozložený, posiluje přesvědčení, že širší populace, z které byl vybrán, bude také rozložena náhodně. 

Nemocniční kvíz: Větší vzorek se pravděpodobně méně vzdálí od 50 %. Správnou odpověď však uvedlo pouze 22 % respondentů.

A obráceně platí, že malý vzorek vykazující zdánlivě jasnou strukturu – například 9x orel z 10 hodů mincí – způsobí, že pozorovatel se bude domnívat, že tatáž struktura platí i pro celou populaci. V tomto případě by předpoklad zněl, že mince je zmanipulovaná. Vnímání smysluplných vzorců v náhodných nebo nesmyslných souborech dat se říká apofenie.

Důvěra v zákon malých čísel je součástí širší skupiny mentálních zkratek, ke kterým se lidé uchylují při nejistém rozhodování. Kahneman a Tversky říkají těmto zkratkám heuristiky. Zobecňování malých vzorků je příkladem reprezentativní heuristiky, kdy lidé odhadují pravděpodobnost určité události výhradně na základě zobecnění předcházející podobné události, na kterou si vzpomenou.

Dalším příkladem takové reprezentativní heuristiky je výraz paradox hazardního hráče. I ten pochází z důvěry v zákon malých čísel. Jak říká Kahneman a Tversky:

Srdcem paradoxu hazardního hráče je nesprávné chybné pojetí zákonů pravděpodobnosti. Hazardní hráč cítí, že férovost mince ospravedlňuje očekávání, že odchylka jedním směrem bude brzy vyvážena odpovídající odchylkou druhým směrem. Zkoumané osoby se chovají, jakoby každá součást náhodné série musela odrážet skutečné poměry; pokud se série od poměrů celé populace odchýlí, očekává se úprava opačným směrem.

Čtení grafů s nestejně velkými vzorky

Mylnou důvěrou v zákon malých čísel a nesprávným rozeznáváním vzorů mohou trpět zejména sportovní sázkaři. V dlouhodobé perspektivě platí, že nesprávné vyhodnocení ziskovosti z malého počtu sázek jako důkazu o lepších odhadovacích schopnostech může mít opravdu nepříjemné finanční důsledky. Projděte si například hypotetickou ziskovost 100 sázek na bodová rozpětí v NFL níže. Každá sázka se uzavře při kurzu 1,95. Působivé, ne?

 gr-small-numbers-1.jpg

Co kdybych vám prozradil, že tento záznam pochází od známého hendikepového sázkaře v amerických sportech? Vzhledem k růstové tendenci a výnosu 15 % bych vám nemohl mít za zlé, kdybyste mi uvěřili. Samozřejmě ovšem lžu. Ve skutečnosti si lepší obrázek uděláte z následující tabulky 1 000 sázek.

gr-small-numbers-2.jpg


Tady žádnou dlouhodobou ziskovost nenajdete. Důvod: tabulku vyrobil generátor náhodných čísel, který předpokládal 50% pravděpodobnost jednotlivých výher a
očekávání zisku ve výši -2,5 %. První tabulka představuje prostě jen prvních 100 sázek z té druhé.

Ovšem i v druhé tabulce byla zdravá ziskovost zachována po několik set sázek. Kromě toho platí, že ačkoli vykazuje celkovou ztrátu, časová struktura vůbec nevypadá náhodná, s celkem jasnými vlnami.

Jak si ale všimli Kahneman a Tversky, sérii podobných výsledků mnohem spíše chápeme jako ne-náhodnou, ačkoli se za nimi žádný mechanismus nenachází. Která z následujících binárních řad vypadá náhodná a která nikoli?

0, 0, 0, 0 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1
 
0, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1

 

Většina lidí vy si vybrala druhou řadu. Ve skutečnosti však tu první vygeneroval náhodně Excel a druhou jsem schválně připravil s kratšími sériemi jedniček a nul. Když nás někdo požádá, abychom vytvořili podobnou náhodnou řadu, většina z nás přechází z jedničku na nulu nebo naopak podle toho, zde se některé číslo neobjevuje příliš často.

Nyní se podívejte na následující tabulky 1 000 sázek. Všechny byly vygenerovány náhodně. Tak veliké rozpětí možných výsledků by mělo dostatečně připomenout, jak snadné je nechat se ošálit zdánlivě smysluplným vzorem.


gr-small-numbers-3.jpg
Nezapomínejte, že se jedná o sérii 1 000 sázek, nikoli pouze 100. Podívejte se například na tu prostřední. Ta má všechny známky zkušeného tipaře nebo sázkaře s 5% výnosem a solidním růstem zisku po celou sérii sázek. Výkonu, který nejlepší hendikepoví sázkaři dlouhodobě skutečně dosahují. A přece byla vytvořena náhodně.

Pomocí binomického rozdělení můžeme zjistit pravděpodobnost ziskovosti po určité době sázení přes očekávání -2,5 %.

Počet sázek (kurz 1,95, 50% pravděpodobnost výhry)

Minimální potřebný počet výher

Pravděpodobnost ziskovosti

100

52

38.22%

250

129

32.90%

500

257

28.05%

1000

513

21.46%

2500

1283

9.68%

5000

2565

3.40%

10000

5129

0.51%


Ačkoli sázíme jen čistě náhodně, po 1 000 sázkách máme stále šanci 1 ku 5 zůstávat v zisku. Pokud bychom podali jednu hendikepovou sázku na každý odehraný zápas NFL, trvalo by nám to skoro čtyři sezóny. A to je dost dlouhá doba abych uvěřili, že máme něco víc než jen štěstí.

Jaké malá jsou malá?

Zákon malých čísel je kognitivní zkreslení, kdy lidé vykazují tendenci věřit tomu, že poměrně malý počet pozorování dobře odráží celou populaci. Jak nám navíc ukázal příklad výše, „malý počet“ může být někdy pěkně velký. Tento zákon existuje proto, že lidé preferují jistotu před pochybnostmi, vysvětlení před nevědomostí, příčinu před asociací, pravidelný vzor před náhodou a dovednosti (hlavně svoje vlastní) před pravděpodobností. Neocenit dostatečně jeho význam může být pro sportovního sázkaře dost drahá záležitost. 

Informační zdroje o sázení – Abyste mohli lépe sázet

Informační zdroje o sázení společnosti Pinnacle jsou jednou z nejrozsáhlejších sbírek odborných článků a rad o sázení, jaké na internetu najdete. Zajímavé informace v ní najdou sázkaři bez ohledu na míru svých zkušeností. Naším cílem je zprostředkovat lidem znalosti, aby mohli lépe sázet.