11 1, 2018
11 1, 2018

Štěstí a smůla: Tenká hranice očekávání

Klasický příklad s hodem mincí

Binomická směrodatná odchylka

Pomáhá nebo škodí vám zákon velkých čísel?

Štěstí a smůla: Tenká hranice očekávání

Sázení je často ovlivněno náhodou. Někdy nám pomůže štěstí, jindy se staneme obětí smůly. Je důležité chápat, jakou roli může náhoda v sázení hrát. Jak tenká je ale hranice mezi štěstím a smůlou? Čtěte dál a uvidíte.

Celé sázení na sporty je více méně založeno na náhodě. Lidé, kteří v něm vyhrají, toho dosáhnou téměř výhradně díky štěstí; nakonec téměř všichni podlehnou vlivu bookmakerovy marže a zákonu velkých čísel. Ti z vás, kteří v posledních letech četli mé články, vědí, že ohledně šance na dlouhodobý zisk ze sázení dokáži psát dosti nekompromisně. Neočekávám, že se mnou nutně bude každý souhlasit. Je to totiž součástí nekonečného boje mezi nadějí a realismem, který dobře zná každý sázkař.

Jako protiváha těmto textům je v Informačních zdrojích o sázení společnosti Pinnacle mnoho článků, které učí sázkaře lépe předpovídat. Nicméně zákony pravděpodobnosti se vztahují i na těch několik málo lidí, kterým se podaří dosáhnout dlouhodobě ziskové očekávané hodnoty. V tomto článku se tím budu podrobněji zabývat. Zejména popíši, jak tenká je hranice mezi štěstím a smůlou.

Klasický příklad s hodem mincí

Všichni víme, že při hodu mincí je pravděpodobnost pro pannu a orla 50:50. Víme také, že pokud hodíme dvacetkrát, nepadne vždy 10 panen a 10 orlů, ačkoli právě takový je nejpravděpodobnější výsledek. Někdy padne 12 panen a 8 orlů, někdy naopak. Velmi zřídka padne 5 panen a 15 orlů. Skutečné pravděpodobnosti každého možného výsledku můžeme zjistit pomocí binomického rozdělení. Pro 20 hodů mincí vypadá takto.

Content-In-article-luck-in-betting_1.jpg

Většina pravděpodobných výsledků se pohybuje od 5 panen a 15 orlů po 15 panen a 5 orlů. A co v případě stovky hodů mincí? Rozdělení bude vypadat takto.

Content-In-article-luck-in-betting_2.jpg

Tentokrát je rozsah pravděpodobných výsledků větší. Vizuálně se pro 20 hodů nachází mezi 5 a 15 pannami, což je rozdíl 10. U 100 hodů mincí je tento rozsah zhruba dvojnásobný, mezi 40 a 60 pannami. Znamená to, že spolu se zvětšováním velikosti vzorku (počtu hodů) se zvětšuje i rozsah možných výsledků? Ano i ne.

Když matematik Jacob Bernoulli s tímto scénářem experimentoval, všiml si, že ačkoli absolutní číselný rozdíl mezi počtem panen a orlů se může s rostoucí velikostí vzorku zvětšovat, procento panen se přibližuje k 50 %. 5 z 20 panen je 25 %, 40 ze 100 je ale 40 %. Toto druhé vysvětlení, které je základem zákona velkých čísel, hraje důležitou roli v tom, aby sázkař porozuměl pravděpodobnosti. 

Binomická směrodatná odchylka

Rozsah nebo rozptyl přítomný v určitém rozdělení lze změřit pomocí směrodatné odchylky. U binomického rozdělení se směrodatná odchylka σ vypočte touto jednoduchou rovnicí.

thin-line-formula1.png

Kde n je počet binárních opakování (tj. hodů mincí), p je pravděpodobnost úspěchu (panna) a q je pravděpodobnost neúspěchu (orel). Protože p + q = 1: 

thin-line-formula2.png

A pro jednoduchý případ, kde p = q (tj. 0,5): 

thin-line-formula3.png

Pro 20 hodů mincí je σ = 2,24, zatímco pro 100 hodů mincí je to σ = 5.

Směrodatná odchylka nám ukazuje rozsah, v němž se nachází většina možných výsledků. Například pro 100 hodů mincí se o něco málo více než dvě třetiny vzorků nachází mezi ±1σ, tedy mezi 45 a 55 pannami.

Potvrdili jsme Bernoulliho první zjištění: čím větší je velikost vzorku, tím větší je absolutní rozsah. Co když ale namísto absolutních čísel použijeme procenta panen? Procento panen vypočteme tak, že jejich počet vydělíme celkovým počtem hodů mincí n. Stejně tak směrodatnou odchylku v procentech vypočteme tak, že ji vydělíme n. 

Pro běžný hod 50:50 tedy platí: 

thin-line-formula4.png

V případě 20 hodů mincí je směrodatná odchylka procentuálního podílu panen 0,11 (tedy 11 %), zatímco při 100 hodech činí pouhých 0,05 (tedy 5 %).

Zákon velkých čísel

Podle zákona velkých čísel by průměrný výsledek získaný z určitého počtu pokusů měl být tím blíže očekávané hodnotě, čím větší počet pokusů byl proveden. V případě hodu mincí platí, že čím vícekrát hodíme, tím blíže bude procentuální podíl panen k očekávané hodnotě 50 %.

Protože směrodatná odchylka v procentech je úměrná druhé odmocnině počtu hodů mincí, existuje mezi oběma proměnnými vztah zvaný mocninový zákon a směrodatná odchylka se mění s mocninou nebo logaritmem počtu hodů. Na grafu log-log tento vztah vypadá jako přímka. S každou mocninou n klesne hodnota σ na polovinu.

Content-In-article-luck-in-betting_3.jpg

Tento vztah podle mocninového zákona znamená, že z hlediska úměrnosti k většině poklesu směrodatné odchylky dojde u prvních několika pokusů. Z σ=0,5 po 1 hodu mincí spadne odchylka už po 25 hodech na pouhou 0,1, takže se o čtyři pětiny přiblíží k limitní hodnotě nula (která nastane po nekonečném počtu hodů). Takto vidíme, jak rychle ve skutečnosti začíná působit zákon velkých čísel. Ještě lépe si tuto rychlost představíme, pokud výše uvedený graf překreslíme na lineární osy. 

Content-In-article-luck-in-betting_4.jpg

Výhry a prohry při sázení

Výhry a prohry při sázení se velmi podobají pannám a orlům při házení mincí. Sázka je v podstatě binární událost: buď ji vyhrajete, nebo ne. Proto v případě výsledků nejjednodušších sázek, u nichž je očekávaná pravděpodobnost výhry vždy stejná, budou možné výsledky binomicky rozložené.

Zřejmým příkladem takové binární sázky jsou bodové handicapy na americké sporty, případně sázky s asijským handicapem na americký fotbal, kde díky uplatnění handicapu na jeden nebo druhý tým vznikne událost s pravděpodobností 50:50 a spravedlivým kurzem 2,00. 

My se však nesmíme omezovat jen na události typu 50:50. Vzpomeňte si na výše uvedený vzorec výpočtu směrodatné odchylky v procentech. Obecnější verze, která umožňuje vzít v úvahu i jiná možná očekávaná procenta výher, je tato: 

thin-line-formula5.png

I u zkušených sázkařů, kteří si dokáží zajistit dlouhodobě ziskovou očekávanou hodnotu, je většina jejich sázek jen náhodný šum kolem poměrně slabého signálu. Je to jednoduše proto, že tak složité systémy, jako jsou sportovní události, neodmyslitelně obsahují náhodnou variabilitu.

Ve skutečném světě sázení samozřejmě nezkušení sázkaři neskončí na nule ani v případě, že naplní očekávání. Po započtení bookmakerovy marže je v podstatě nevyhnutelné, že po 1000 sázkách proděláte.

Představte si sázkaře, který dlouhodobě sází na událost typu 50:50 a vyhrává v 55 % případů. Díky své schopnosti předvídat posunul své očekávané procento výher z 50 % na 55 %, stále však platí stejná binomická pravidla rozptylu.

Pomocí výše uvedené rovnice bychom mohli ukázat, že směrodatná odchylka procenta výher tohoto sázkaře by po 275 sázkách měla být 3 %, což znamená dvoutřetinovou pravděpodobnost, že poměr úspěšných sázek pro tento celkový počet sázek bude mezi 52 % a 58 %. 

Pokud budeme stále podávat jednoduché sázky se stejnou očekávanou pravděpodobností výhry (kurzem), můžeme pomocí binomického rozdělení poměrně dobře určit pravděpodobnost jakékoli události (v Excelu k tomu použijeme funkci BINOMDIST).

V níže uvedeném grafu jsem takto zakreslil několik sázkových historií. První z nich zahrnuje pouhých 20 sázek. Číselné hodnoty v grafu ukazují kumulativní pravděpodobnost toho, že skutečné procento výher bude vyšší než určitá hodnota. Například pokud je vaše dlouhodobé očekávání 20 %, máte 9% šanci, že vyhrajete více než šest sázek (30 %). Pokud typicky očekáváte výhru 16 sázek, máte zhruba jednoprocentní šanci, že vyhrajete všech 20. 

Content-In-article-luck-in-betting_5.jpg

Červené a zelené zóny zhruba vyznačují oblasti prodělku (červená) a zisku (zelená) v případě spravedlivých kurzů. Není překvapivé, že pokud prohrajete více sázek, než jste očekávali, proděláte. Vidíte však, že výrazné nenaplnění očekávání není příliš běžné.

I po pouhých 20 sázkách se stejnou výší potenciální výhry a prohry můžete ve třech čtvrtinách případů očekávat, že devět nebo více vyhrajete. Zákon velkých čísel je na vaší straně a chrání vás proti riziku výrazných procentních ztrát.

Logicky však platí i opak. Pokud vyhrajete více sázek, než jste očekávali, vyděláte. Jenže není příliš pravděpodobné, že vyděláte hodně. I pokud se v sázení vyznáte a dokážete dlouhodobě vyhrávat 55 % sázek se stejnou potenciální prohrou a výhrou, stále máte jen 13% šanci, že vyhrajete 14 nebo více sázek z 20. Nyní je zákon velkých čísel proti vám a brání vám dosáhnout výrazných procentuálních zisků. 

Žlutá zóna zhruba odpovídá oblasti, v níž sázkaři skončí s nulou. Je pozoruhodné, jak tenká je oblast mezi velkým štěstím a velkou smůlou, v níž skončí většina sázkových výsledků.

Podívejte se, co se se žlutou zónou stane po 100 sázkách.

Content-In-article-luck-in-betting_6.jpg

Šance na to, že se budete výrazně vymykat dlouhodobému očekávání, se prudce snížila. A co po tisíci sázek?

Content-In-article-luck-in-betting_7.jpg

Ve skutečném světě sázení samozřejmě nezkušení sázkaři neskončí na nule ani v případě, že naplní očekávání. Po započtení bookmakerovy marže je v podstatě nevyhnutelné, že po 1000 sázkách proděláte. Zničí vás zákon velkých čísel. U zkušených sázkařů to však vypadá výrazně jinak.

Pokud očekáváte, že vyhrajete 55 % z 1000 sázek se stejnou výší potenciální prohry i výhry, téměř vždy jich vyhrajete alespoň 50 %. Za předpokladu, že je bookmakerova marže menší než rozdíl mezi vámi očekávanou procentuální úspěšností a tím, jaký procentuální podíl výher očekává bookmaker, máte velmi slušnou šanci dlouhodobě vydělávat. Něco podobného se píše i na respektovaném webu ProfessionalGambler.com:

„rozdíl mezi procentem sázek vyhraných úspěšnými sportovními sázkaři a procentem sázek vyhraných chronicky neúspěšnými sázkaři je relativně velmi malý.“

Nyní tedy vidíte, jak malý skutečně je. Zákon velkých čísel je sázkařovým požehnáním i prokletím. 

Je zřejmé, že lidé většinou nepodávají tak jednoduché sázky, s jakými pracujeme v tomto článku. Sázkaři si vybírají různé kurzy a sázejí různě vysoké částky. K jejich analýze bychom potřebovali daleko sofistikovanější matematiku, případně bychom museli využít naši oblíbenou simulaci Monte Carlo, pokud by složitost matematiky byla už přílišná. 

Navíc jsem nebral v úvahu rozptyl skutečných zisků a ztrát, což je další samostatné a zajímavé téma, kterému jsem se věnoval v minulých článcích (čím vyšší kurz, tím větší je rozptyl zisků a ztrát).

Účelem tohoto článku nicméně bylo ukázat rychlost a sílu zákona velkých čísel a to, jak tenká je hranice mezi očekávanými a skutečnými výsledky a mezi královstvím štěstí a smůly.

Testování důvěryhodnosti sázkových historií

V závěru bych vám ještě rád ukázal, jak lze informace o směrodatné odchylce skutečného procenta výher využít k testování důvěryhodnosti sázkových historií, kterými se chlubí poradenské služby, které se vám snaží prodat své tipy. 

Použijme například handicapovou firmu, která nabízí „poctivý a otevřený přístup“ ke svým „principům určování handicapů“. Tato firma si evidentně uvědomuje, že je sázení na sporty ovlivněno náhodou. Zákazníkům totiž vysvětluje, že neexistuje nic jako zaručená výhra, a že „v každé soutěži hraje roli prvek náhody.“ Veřejně se nicméně chlubí úspěšností 76 % z více než 11 000 sázkových tipů a zdá se tedy, že se jí podařilo vrtkavost náhody překonat.

Podle zákona velkých čísel by průměrný výsledek získaný z určitého počtu pokusů měl být tím blíže očekávané hodnotě, čím větší počet pokusů byl proveden.

Pokud se podrobněji podíváme na výsledky, které tato firma dosud zveřejnila, zjistíme, že má úspěšnost 75 % z 10 312 tipů (několik tipů evidentně chybí). Ačkoli několik sázek má velmi nízké nebo velmi vysoké kurzy, 94 % sázek má kurz v rozmezí od 1,67 do 2,50 (což odpovídá implikované pravděpodobnosti 60 % a 40 %). Průměrná implikovaná pravděpodobnost výhry pro celý vzorek je po odečtení bookmakerovy marže 52,2 %. Rozdíl od sázky 50:50 je tedy nepodstatný.

Pokud výsledky rozdělíme na 56 měsíčních vzorků (od března 2014 do října 2018), zjistíme, že průměrně firma publikovala 184 tipů za měsíc. Více než polovina měsíců se vešla mezi 140 a 224 tipů. Pokud předpokládáme, že dlouhodobé očekávané procento úspěšnosti je 75 %, jaká by měla být variabilita měsíční procentuální úspěšnosti? Pomocí výše uvedeného vzorce pro výpočet očekávané směrodatné odchylky procentuálního podílu výher lze u vzorku 184 tipů spočítat, že jde o něco málo nad 3 %. Něco málo nad dvě třetiny vzorků by mělo být mezi 72 % a 78 %, celých 95 % se pak má vejít mezi 69 % a 81 %.

Jenže skutečná směrodatná odchylka měsíčních procentuálních úspěšností je 8,6 %, tedy daleko vyšší, než by být měla. Necelých 40 % hodnot leží v rozsahu ±1σ od 75 % a jen něco málo přes polovinu v rozmezí ±2σ. Variabilita je zkrátka příliš velká. I kdybychom předpokládali, že každý měsíc firma nabídka pouze 32 tipů, což se stalo v měsíci s nejmenším počtem tipů, byla by očekávaná směrodatná odchylka stále 7,7 %. 

Směrodatnou odchylku měsíční procentuální úspěšnosti 8,6 % lze typicky očekávat u velikosti vzorku zhruba 25, ne 184. V prosinci 2014 firma nabídla 151 tipů s průměrnou implikovanou úspěšností 51,4 %. Procentuální úspěšnost 46,4 % by bylo možno očekávat jednou za milion miliard let. V říjnu 2015 to bylo 168 tipů (s průměrným implikovaným očekáváním výhry 48,5 %), přičemž uspěla se 154 z nich (tedy 91,7 %). Takový výkon by takto zkušený tipař normálně podal zhruba jednou za milion let.

Nechám na vaší představivosti, abyste si domysleli, co tato zjištění mohou naznačovat. Možná ukazují, že se míra schopností může během krátké doby výrazně měnit. A nebo znamenají něco úplně jiného. V minulosti už jsem nicméně psal o hranicích očekávání zisku. Proto je mi jasné, že už víte, že procentuální úspěšnost 76 % v handicapovém sázení je něco, nad čím se lze leda tak pousmát a jít dál.

Informační zdroje o sázení – Abyste mohli lépe sázet

Informační zdroje o sázení společnosti Pinnacle jsou jednou z nejrozsáhlejších sbírek odborných článků a rad o sázení, jaké na internetu najdete. Zajímavé informace v ní najdou sázkaři bez ohledu na míru svých zkušeností. Naším cílem je zprostředkovat lidem znalosti, aby mohli lépe sázet.