10 18, 2017
10 18, 2017

Posouzení sázkařských schopností: Bayesovská vs. Frekvenční metoda

Jak mohou sázkaři posoudit úroveň svých schopností?

Jaký je rozdíl mezi Bayesovským a frekvenčním přístupem?

A co míra náhodnosti a očekávané pravděpodobnosti dovedností?

Posouzení sázkařských schopností: Bayesovská vs. Frekvenční metoda

Na nejzákladnější úrovni jsou k ziskovému sázení potřeba dvě věci. Dovednost a štěstí. Mnozí sázkaři si odmítají přiznat vliv náhody, zároveň ale často přehlížejí i nutnost posoudit svoji dovednost. Tento článek ukazuje, proč je důležité rozumět různým metodám posuzování sázkařských dovedností a jak se může výsledek lišit podle použitého přístupu.

Bayesova věta sportovním sázkařům usnadňuje předpovídání. Může nám také pomoci určit, jak je pravděpodobné, že v tomto předpovídání skutečně uspějeme a najdeme kladnou očekávanou hodnotu. V minulosti jsem se zabýval posouzením kvality minulých sázek pomocí frekvenčního přístupu (t-test). V tomto článku obě metody porovnám.

Míra důvěry

V teorii pravděpodobnosti popisuje Bayesova věta šanci toho, že dojde k určité události, za podmínky, že dojde i k jiné události. Řekněme například, že věřím, že mám 50% pravděpodobnost, že jsem zkušený sázkař, který dokáže najít hodnotu. Pokud příští sázku vyhraji, jak se to odrazí na tomto mém názoru? Jinými slovy, jak důkaz o vyhrané sázce změní pravděpodobnost, že jsem zkušený sázkař? 

Bayesova věta interpretuje pravděpodobnost jako „míru důvěry“ v tvrzení nebo hypotézu a matematicky formalizuje vztah mezi mírou důvěry před tím, než je znám důkaz (předchozí pravděpodobnost) a mírou důvěry po zohlednění důkazu (následná pravděpodobnost). Napsat to lze takto:

{rovnice} - P(A|B)= P(A)*P(B|A)/P(B)

V našem příkladu:

P(A) = předchozí pravděpodobnost, že jsem zkušený sázkař

P(B) = předchozí pravděpodobnost, že svou sázku vyhraji

P(B|A) = pravděpodobnost výhry v sázce závislá na tom, že jsem zkušený sázkař

P(A|B) = pravděpodobnost, že jsem zkušený sázkař, závislá na tom, zda vyhraji sázku

Ukažme si to na příkladu. Předpokládejme, že zkušený sázkař je z definice někdo, kdo dokáže dlouhodobě dosahovat návratnost investic 110 %. U spravedlivých sázek by to znamenalo 55 výher z každé stovky. P(B|A), tedy pravděpodobnost, že vyhraji sázku, závislá na tom, že jsem zkušený sázkař, tudíž je 55 %.

Pro nezkušeného sázkaře je pravděpodobnost výhry v sázce se spravedlivým kurzem, P(B), 50 %. Předpokládejme ale, že jsem před sázkou přesvědčen, že mám 50:50 šanci být zkušený {P(A) = 50 %} a P(B) pro takového sázkaře je 52,5 % (polovina mezi 50 % a 55 %).

Nejlepší handicapoví sázkaři jsou zpravidla schopni vyhrávat 57 % sázek. Po započtení marže sázkové kanceláře to znamená návratnost investic asi 110 %.

Pokud bych sázku vyhrál, zadáním těchto hodnot do Bayesovy věty zjistím následnou pravděpodobnost P(A|B), tedy 52,38 %. Vyhraji-li sázku, vede mě to k přesvědčení, že je vyšší pravděpodobnost než dříve, že jsem zkušený sázkař.

Bayesovu větu lze používat opakovaně. První sázku jsem vyhrál, upravil podle toho pravděpodobnost, že jsem zkušený sázkař, a podávám sázku další. Následná pravděpodobnost vypočtená v prvním kroku se stává novou pravděpodobností předchozí.

Nová následná pravděpodobnost toho, že jsem zkušený sázkař, se nyní stává závislou na tom, zda vyhraji (nebo prohraji) druhou sázku. Pokud vyhraji, pravděpodobnost, že jsem zkušený sázkař, znovu vzroste. V opačném případě klesne. Pokud bych v tomto příkladu druhou sázku vyhrál, pravděpodobnost, že jsem zkušený sázkař, by vzrostla na 54,75 %. 

Tento postup lze do nekonečna opakovat, přičemž upravená podmíněná pravděpodobnost vždy bude mezi 0 % a 100 %. Já tento výpočet provedl tisíckrát, tedy s 1000 sázkami. V níže uvedeném grafu vidíte dosaženou sázkovou historii (modrá čára) spolu s Bayesovskými pravděpodobnostmi toho, že jsem po každé jednotlivé sázce zkušeným sázkařem (červená čára).

Assessing skill in gambling

Významným problémem Bayesovské interpretace pravděpodobnosti je to, že vyžaduje značné předchozí znalosti nebo důvěru v určitou událost nebo situaci. Máme však při posuzování pravděpodobnosti, že umím dobře sázet, skutečně takové znalosti? Hodnota 50 %, kterou jsem v tomto příkladu zvolil, se zakládala pouze na svévolném odhadu. Podívejte se, co se stane, když počáteční pravděpodobnost změním na 1 %. 

 

Navíc pojem „zkušený“ může v tomto kontextu znamenat cokoli. I sázkař schopný dosáhnout návratnosti investic 105 % je značně schopný, pokud se mu to podaří při více než 1 000 sázkách – o tom, proč hraje roli velikost vzorku, se dočtete v článku o zákonu malých čísel. Podobně nejasné je i to, jak definovat P(B) pro každý krok opakování při aktualizované hodnotě P(A). 

V mém Bayesovském modelu jsem jednoduše předpokládal lineární vztah, takže jestliže je P(A) = 0 % / 20 % / 40 % / 60 % / 80 % / 100 %, pak P(B) = 50 % / 51 % / 52 % / 53 % / 54 % / 55 %. Platnost tohoto vztahu však nepochybně lze zpochybnit. Ještě důležitější však může být fakt, že protože i člověk se základní pravděpodobností výhry v sázce 52,5 % je evidentně schopný sázkař (jen ne tolik schopný jako člověk s 55% pravděpodobností), měříme zde ve skutečnosti míru dovednosti a nikoli její pravděpodobnost. 

Toto grafické zastoupení vývoje Baysovské pravděpodobnosti však představuje určité intuitivní měřítko pravděpodobnosti (nebo síly) sázkařovy schopnosti konzistentně dosahovat zisku a toho, jak se může v průběhu času měnit.

Assessing skill in gambling

Míra náhodnosti

Zatímco Bayesovský přístup se soustředí na pravděpodobnost hypotézy (že jsem zkušený sázkař) při fixní sadě dat (zisky a ztráty), frekvenční přístup se zaměřuje na pravděpodobnost (neboli frekvenci) dat při dané hypotéze. Tentokrát je hypotéza pevná – buď je pravda (100% pravděpodobnost), nebo pravda není (0% pravděpodobnost), že jsem schopný sázkař – zatímco u dat je předpokládána náhodnost. 

Začneme-li od 1% předchozí pravděpodobnosti, že je člověk zkušený sázkař, po 1000 sázkách hodnota stoupne na pouhých 20 %.

Frekvenční přístup zpravidla začíná nulovou hypotézou, která v tomto případě tvrdí, že dovedný sázkař nejsem a že výsledky mých sázek jsou dány výhradně náhodou. Pak se pomocí statistických údajů snaží vypočítat pravděpodobnost (obvykle nazvanou p-hodnota), že námi pozorovaná data, v tomto případě historie mých zisků a ztrát, mohla nastat za předpokladu pravdivosti nulové hypotézy.

Nakonec je tato pravděpodobnost porovnána s přijatelnou hodnotou významnosti (někdy se nazývá α-hodnota) tak, aby jestliže p < α (zpravidla 5 % nebo 1 %), byla nulová hypotéza zamítnuta ve prospěch hypotézy platné.

Statistickým údajem, kterým jsem se v Informačních zdrojích o sázení společnosti Pinnacle v minulosti zabýval, je t-rozdělení. Svůj název dostalo podle toho, že je odvozeno od Studentova t-testu statistické významnosti. Za předpokladu spravedlivých kurzů lze t-rozdělení aproximovat podle vzorce: 

kde n = počet sázek, r = návratnost investic (vyjádřená jako desetinné číslo) a o = průměrný desetinný sázkový kurz. T-rozdělení se na p-hodnotu přepočte pomocí statistických tabulek nebo internetové kalkulačky. V Excelu lze použít funkci TDIST. Podívejme se, jaké výsledky tato metoda dává s naší ukázkovou historií sázek.

Níže uvedený graf srovnává původní časovou řadu vývoje Bayesovské pravděpodobnosti – že jsem zkušený sázkař, přičemž je použita původní předchozí pravděpodobnost 50 %, že tomu tak je (červená čára) – s vývojem frekvenční p-hodnoty –pravděpodobnosti, že to, co se mi podařilo, se stalo pouze náhodou za předpokladu, že nemám vůbec žádné schopnosti (zelená čára). Byl použit jednovýběrový dvoustranný t-test.

Assessing skill in gambling

Při obecně kvalitativním pohledu jsou obě čáry svými zrcadlovými opaky, ačkoli je to spíše následkem štěstí než čehokoli jiného. Neměli bychom však přehlížet fakt, že p-hodnota měří pravděpodobnost nulové dovednosti, takže 1-p odpovídá pravděpodobnosti toho, že jde o schopného sázkaře.

Kdyby nic jiného, Bayesovská i frekvenční analýza by měly sázkařům připomenout, že sázení s dlouhodobým ziskem je běh na dlouhou trať.

Pravděpodobnost 5 %, že naše minulé zisky a ztráty nastaly jen náhodou, není to samé, jako pravděpodobnost 95 %, že nastaly díky naší dovednosti. Znamená prostě to, že za předpokladu pravdivosti nulové hypotézy – tedy že výhry a prohry jsou čistě náhodné – lze námi pozorované výsledky očekávat v 5 % případů.

Slabým místem frekvenčního přístupu je to, že považuje pravdu za absolutní. Naproti tomu Bayesovský přístup implicitně považuje pravdu za pravděpodobnostní, provizorní a vždy usvědčitelnou z nepravdivosti. I přes tento nedostatek představuje frekvenční testování hypotézy užitečný nástroj, pomocí nějž lze analyzovat sázkovou historii a zjistit, zda je pravděpodobné, že nastala díky něčemu jinému než náhodě.

Jak vycházejí frekvenční a Bayesovský model ze srovnání, jestliže druhý z nich pracuje s první předchozí pravděpodobností pouhé 1 % (namísto 50 %), že jsem zkušený sázkař?

Assessing skill in gambling

Tentokrát je jasné, že náš t-test bude daleko více podporovat myšlenku, že jsem dovedný sázkař, než Bayesovský přístup. Ten je tentokrát mnohem konzervativnější.

To opět ukazuje na citlivost Bayesovské pravděpodobnosti na prvotní předchozí pravděpodobnost. V tomto případě po téměř 700 sázkách t-test tvrdí, že naše sázková historie mohla s pouhou 3% pravděpodobností nastat náhodně, Bayesova věta říká, že stále je menší než 10% pravděpodobnost, že jsem dost schopný sázkař na to, abych dlouhodobě dokázal dosáhnout 110% návratnosti investic.

Protože se při sázení raději vyhýbám riziku, dal bych přednost konzervativnějšímu prvotnímu názoru na své schopnosti. Pokud nemám dobrý důvod k opaku, měl bych vždy začít předpokladem, že příliš dovedností nemám nebo sázet neumím vůbec.

Očekávané pravděpodobnosti úrovně dovednosti

Výše uvedená analýza představuje jen jeden náhodný příklad časové řady sázek s hypotetickou 110% návratností investic. V zájmu optické přehlednosti jsem vědomě vybral takovou historii sázek, která umožňovala názorně sdělit vysvětlované myšlenky.

Abychom ale získali lepší představu o očekávaných výsledcích, tedy abychom zjistili, co bychom měli průměrně čekat, měli bychom tento model mnohokrát zopakovat. Ti, kdo pravidelně čtou Informační zdroje o sázení společnosti Pinnacle, již vědí, že to lze provést pomocí simulace Monte Carlo.

První z níže uvedených grafů ukazuje výsledky simulace Monte Carlo s 1 000 opakováními, v níž jsem zkoumal vývoj Bayesovské pravděpodobnosti, že jsem zkušený sázkař, pro 10 hypotetických úspěšností: 51 % výher až 60 % výher s intervalem 1 % (to odpovídá očekávané hodnotě 102 % až 120 % při intervalu 2 % a spravedlivých kurzech).

Křivky jsem vytvořil vypočtením mediánu Bayesovské pravděpodobnosti po každé sázce v sérii 1000 sázek. Medián je v tomto případě názornější než průměr (u nějž mohou interpretaci zkreslit velmi malé a velmi vysoké hodnoty). 

Prvotní předchozí pravděpodobnost mé dovednosti {p(A)} byla stanovena na 1 %. Není překvapivé, že čím vyšší byla moje hypotetická úspěšnost (a očekávaná hodnota), tím rychleji se důvěra v mé schopnosti přibližovala 100% pravděpodobnosti. (Čím tmavší je křivka, tím vyšší je hypotetické procento úspěšných sázek.) 

Assessing skill in gambling

Nejlepší handicapoví sázkaři jsou zpravidla schopni vyhrávat 57 % sázek. Po započtení marže sázkové kanceláře to znamená návratnost investic asi 110 %. Tento graf ukazuje, že pokud se chcete stát jedním z nich, budete potřebovat skoro 1000 sázek, abyste získali velkou a oprávněnou důvěru ve své schopnosti. Alespoň za předpokladu, že jste z počátku o svých schopnostech přesvědčeni nebyli. 

Naproti tomu pokud zjistíte, že vyhráváte 54 % svých handicapů, bude vám to stále přinášet zisk, ale bude trvat déle, než ve své činy začnete skutečně věřit. Začneme-li od 1% předchozí pravděpodobnosti, že je člověk zkušený sázkař, po 1000 sázkách hodnota stoupne na pouhých 20 %. 

Poslední graf ukazuje podobnou sadu ideálních očekávaných p-hodnot odvozených ze stejné historie 1000 sázek a deseti hypotetických úspěšností. Protože existuje rovnice, pomocí níž lze aproximovat t-rozdělení pro jakoukoli kombinaci počtu sázek, návratnosti investic a kurzů, není třeba provádět simulaci Monte Carlo. Opět platí, že čím tmavší je křivka, tím vyšší je hypotetické procento úspěšných sázek (od 51 % do 60 %).

Assessing skill in gambling

Při 57 % výherních sázek je statistické významnosti (p-hodnota < 5 %) dosaženo po pouhých 200 sázkách a po zhruba 335 sázkách se dostáváme dokonce na vyšší hladinu významnosti (p-hodnota < 1 %). Zopakujme si však, že nám tato informace neříká nic o naší úrovni dovednosti. Znamená pouze to, s jakou pravděpodobností tato série výsledků sázek nastala pouze náhodou při nulové dovednosti. 

Uvedené úrovně statistické významnosti navíc jsou, stejně jako prvotní Bayesovská předchozí pravděpodobnost, založeny převážně na subjektivním rozhodnutí. Pokud však na tato slabá místa budeme pamatovat, mělo by statistické testování pomocí p-hodnoty stejně jako Bayesovský model představovat užitečný způsob, jak mohou sázkaři posoudit svoji schopnost dosáhnout dlouhodobého zisku.

Kdyby nic jiného, Bayesovská i frekvenční analýza by měly sázkařům připomenout, že sázení s dlouhodobým ziskem je běh na dlouhou trať. Nikdy si nemyslete, že z vás pár úspěšných sázek dělá zkušeného sázkaře.

Informační zdroje o sázení – Abyste mohli lépe sázet

Informační zdroje o sázení společnosti Pinnacle jsou jednou z nejrozsáhlejších sbírek odborných článků a rad o sázení, jaké na internetu najdete. Zajímavé informace v ní najdou sázkaři bez ohledu na míru svých zkušeností. Naším cílem je zprostředkovat lidem znalosti, aby mohli lépe sázet.