Regrese k průměru v sázení na sporty

Regrese k průměru v sázení na sporty
Systémy předpovědí jsou založeny převážně na minulých výkonech. Pro sportovní sázkaře je tedy velmi důležité znát princip regrese k průměru. Sezóna anglické Premier League 2015–16 zatím není skoupá na překvapení a nabízí se tedy otázka: jsou extrémní výsledky udržitelné? Přinášíme vám názor statistiků.

Při práci s náhodnými, či převážně náhodnými, systémy, mají proměnné s extrémní hodnotou při úvodním měření tendenci vykázat při následném měření méně extrémní výsledky. Tomuto jevu se říká regrese k průměru či ke středu.

Například výkony Leicesteru v první polovině sezóny 2015/16 Premier League tomuto týmu přinesly lepší týmové hodnocení než má tým Chelsea, kterému se během stejného období dařilo ve srovnání s očekáváním daleko hůře. Jenže pokud se na hodnocení těchto týmů podílely převážně náhodné faktory, naznačoval by princip regrese k průměru, že taková hodnocení nejsou udržitelná.

Měření výkonu týmů

Jedním ze způsobů, kterými lze měřit výsledky týmu, je srovnávat jeho výkony s očekáváním trhu. Například pokud je na výhru týmu vypsán kurz 2,00, ukazuje to, že mu trh dává 50% šanci na výhru (nebereme zde v úvahu vliv marže bookmakera). Pokud vyhraje, překonal očekávání trhu, pokud ale prohraje, pak očekávání nesplnil.

Při práci s náhodnými systémy mají proměnné s extrémní hodnotou při úvodním měření tendenci vykázat při následném měření méně extrémní výsledky.

Takový přístup je kvalitativně podobný metodě Brierova skóre, která měří rozsah, v jakém se tým odchýlil od očekávaného výsledku odvozeného z kurzů. Hlavním rozdílem je to, že umožňuje zjistit nejenom rozsah, ale i směr odchylky od očekávaného výsledku.

Podívejme se, jak se týmům Leicester a Chelsea dařilo ve srovnání s očekáváním bookmakerů Pinnacle v prvních 20 utkáních sezóny 2015/16 ligy Premier League. Za každý vyhraný zápas tým dostává skóre úpravy rizika rovnající se [1 - 1/kurz], zatímco za prohru obdrží skóre [-1/kurz].

V průběhu sezóny jsou tato skóre sčítána. Níže uvedená tabulka ukazuje, že Leicester měl daleko lepší výsledky, než jaké od něj bookmakeři Pinnacle očekávali, zatímco Chelsea měla výsledky horší.

Prvních 20 utkání týmu Chelsea

Soupeř Datum Kurz Pinnacle Výsledek Zisk/Ztráta Kumulativní zisk/ztráta
Swansea 08/08/15 1.39 Prohra -0.72 -0.72
Manchester City 16/08/15 3.87 Prohra -0.26 -0.98
WBA 23/08/15 1,65 Výhra 0.39 -0.58
Crystal Palace 29/08/15 1.37 Prohra -0.73 -1.31
Everton 12/09/15 2,01 Prohra -0.50 -1.81
Arsenal 19/09/15 2,45 Výhra 0,59 -1.22
Newcastle 26/09/15 1.63 Prohra -0.61 -1.83
Southampton 03/10/15 1.83 Prohra -0.55 -2.38
Aston Villa 17/10/15 1,34 Výhra 0,25 -2.13
West Ham 24/10/15 2,01 Prohra -0.50 -2.62
Liverpool 31/10/15 2.07 Prohra -0.48 -3.11
Stoke 07/11/15 2.07 Prohra -0.48 -3.59
Norwich 21/11/15 1.43 Výhra 0.30 -3.29
Tottenham 29/11/15 2.89 Prohra -0.35 -3.63
Bournemouth 05/12/15 1.38 Prohra -0.72 -4.36
Leicester 14/12/15 2.38 Prohra -0.42 -4.78
Sunderland 19/12/15 1.32 Výhra 0.24 -4.54
Watford 26/12/15 1.52 Prohra -0.66 -5.19
Manchester United 28/12/15 2.95 Prohra -0.34 -5.53
Crystal Palace 03/01/16 2.07 Výhra 0.52 -5.02

Prvních 20 utkání Leicesteru

Soupeř Datum Kurz Pinancle Sports Výsledek Zisk/Ztráta Kumulativní zisk/ztráta
Sunderland 08/08/15 1.99 Výhra 0,50 0,50
West Ham 15/08/15 3.42 Výhra 0.71 1.21
Tottenham 22/08/15 2.69 Prohra -0.37 0.83
Bournemouth 29/08/15 3.57 Prohra -0.28 0.55
Aston Villa 13/09/15 1.86 Výhra 0.46 1.02
Stoke 19/09/15 3.10 Prohra -0.32 0,69
Arsenal 26/09/15 4.55 Prohra -0.22 0.47
Norwich 03/10/15 3.31 Výhra 0.70 1.17
Southampton 17/10/15 5.10 Prohra -0.20 0.98
Crystal Palace 24/10/15 2.21 Výhra 0.55 1.52
WBA 31/10/15 2.70 Výhra 0.63 2,15
Watford 07/11/15 1.88 Výhra 0.47 2.62
Newcastle 21/11/15 2.58 Výhra 0.61 3.23
Manchester United 28/11/15 3.26 Prohra -0.31 2,93
Swansea 05/12/15 2.80 Výhra 0.64 3.57
Chelsea 14/12/15 3.11 Výhra 0,68 4.25
Everton 19/12/15 3.65 Výhra 0.73 4.97
Liverpool 26/12/15 4.00 Prohra -0.25 4.72
Manchester City 29/12/15 4.25 Prohra -0.24 4.49
Bournemouth 02/01/16 1.94 Prohra -0.52 3.97

Do jaké míry jsou výkony vysvětleny štěstím

Vyvstává otázka: měli bychom předpokládat, že budou nečekaně dobré výkony Leicesteru a nečekaně špatné výkony Chelsea (relativně k očekáváním trhu) pokračovat? Pokud šlo převážně o vliv kauzálních faktorů, tedy schopností hráčů a manažerského stylu, pak můžeme předpokládat jen malou regresi směrem k tržním očekáváním, alespoň dokud trh plně nepřehodnotí novou úroveň schopností těchto týmů. Pokud ale na druhou stranu šlo převážně o následky náhody, lze předpokládat rychlejší a výraznější regresi k průměru.

Abychom zjistili, jak velký vliv má regrese k průměru, a následně tedy náhoda, na výsledek fotbalových zápasů, musíme data rozdělit na dvě poloviny – na první a druhou polovinu sezóny – a porovnat je. Pokud by regrese k průměru byla malá, dalo by se očekávat, že budou extrémní výkony v první polovině lépe korelovat s podobně extrémními výkony v polovině druhé.

Výsledky by tedy byly stálé. Naopak, pokud by regrese k průměru byla velká, extrémní výkony v první polovině by měly vykazovat jen malou podobnost s extrémními výkony v polovině druhé.

Na níže uvedeném grafu vidíte tuto korelaci pro anglické fotbalové týmy z Premier League a Football League v sezonách 2012/13 až 2014/15. Každý z 276 datových bodů představuje dvojici výsledků jednoho týmu v první a druhé polovině jedné sezóny. Tmavé čáry vyznačují průměrný trend datových bodů. 

Korelace výkonu v 1. a 2. polovině sezóny

regression-to-mean-betting-table.jpg

Jak vidíte, korelace neexistuje skoro žádná, zato regrese k průměru je téměř dokonalá. Hodnota R2 v takovém korelačním grafu ukazuje, do jaké míry variabilita jedné proměnné vysvětluje variabilitu druhé proměnné.

Hodnota 1 znamená úplnou korelaci, zatímco 0 ukazuje na nepřítomnost korelace. Zde vidíme, že variabilita ve výkonech v první polovině sezóny nevysvětluje v podstatě nic z variability výkonů ve druhé polovině sezóny. To ukazuje, že mezi těmito proměnnými neexistuje žádné kauzální spojení, a že odchylky od tržních očekávání jsou v podstatě otázkou náhody.

20 týmů s nejhoršími výsledky mělo v první polovině sezóny průměrný výsledek -4,05. Jejich výkon ve druhé polovině sezóny se ovšem vrátil k průměru -0,01, přičemž pouze jediný tým měl výsledky horší. Naopak 20 týmů, jejichž výsledky v první polovině sezóny nejvíce předčily očekávání, mělo průměrný výsledek +3,71, což ale ve druhé polovině sezóny kleslo na +0,13. I v tomto případě pouze jeden tým měl extrémnější druhou polovinu sezóny než první.

Je možné, že sezóna je na hodnocení výkonu týmu příliš dlouhá doba. Za 38 utkání (nebo dokonce za 46 v případě Football League) se toho může stát hodně a očekávat jakoukoli smysluplnou stálost výkonů mezi první a druhou polovinou sezóny je přinejlepším zbožné přání.

Navíc lze tvrdit, že pokud skutečně dojde ke změně úrovně dovednosti týmu, všimne si toho sázkový trh a ve druhé polovině sezóny to již promítne do kurzů. Budoucí odchylky od očekávání tedy tak jako tak budou menší než předtím, bez ohledu na vlivy náhody. 

Je možné, že by tento vliv bylo možno omezit použitím mnohem kratšího období, například 12 zápasů. Mnoho kvantitativních systémů předpovědí skutečně při výpočtech indikátorů výkonu pro budoucí zápasy používá taková kratší období.

Korelace mezi výkony v 6 předchozích a 6 následujících zápasech je bohužel stejně mizerná. Pro celkem 1596 možných korelačních dvojic byla hodnota R2 opět nulová na dvě desetinná místa. Zdá se tedy, že i pro období pouhých 12 zápasů jsou výkony fotbalových týmů ve srovnání s tržním očekáváním téměř zcela otázkou náhody.

Moudrost sázkového trhu

Pokud se zamyslíme nad tím, co vlastně představuje takový sázkový trh, jako je třeba Pinnacle, pochopíte, proč se na výsledcích fotbalových sázek do takové míry podílí náhoda. Netvrdíme, že výsledek zápasu nezávisí na ničem jiném. Je jasné, že takové týmy, jako Arsenal, Manchester City a Chelsea jsou (většinou) lepší než týmy jako Norwich, Sunderland a Bournemouth. A že díky svým lepším dovednostem mají větší pravděpodobnost výhry. 

Máme spíše na mysli to, že sázkový trh bere formou úprav sázkových kurzů tyto rozdíly ve schopnostech týmů v úvahu. Týmy, u nichž je vnímána vyšší pravděpodobnost výhry, zpravidla přitáhnou více sázek. Proto budou jejich kurzy nižší. Ve výsledku fungují kurzy jako jakési handicapy vyrovnávající rozdíl v dovednostech týmů. A vzhledem k použití těchto handicapů se výsledek stává výrazněji otázkou štěstí.

Pokud velký počet sázkařů vyjádří prostřednictvím sázek svůj názor na pravděpodobný výsledek utkání, často poměrně správně vyhodnotí pravděpodobnost tohoto výsledku prostřednictvím procesu podobnému fungování volného trhu (kde poptávku vyvažuje nabídka). Není překvapivé, že se tomuto jevu začalo říkat moudrost davu.

O Pinnacle je známo, že nabízí jedny z nejpromyšlenějších a nejefektivnějších sázkových trhů ze všech bookmakerů, což je jedním z důvodů, proč může vypisovat nejlepší kurzy s nejnižšími maržemi. Sázkový trh však není vždy zcela efektivní. Platí to zejména v době těsně po jeho otevření, kdy svůj názor vyjádřilo ještě relativně málo sázkařů a mohou se vyskytovat nesprávné kurzy. 

Právě v tomto období zpravidla sází ti nejchytřejší sázkaři a využívají tak kurzů, které často bývají lepší než kurzy konečné. I výsledky těch nejbystřejších sázkařů však mohou být během krátkého období převážně dílem náhody. Znalost fenoménu regrese k průměru by měla sázkařům pomoci lépe pochopit vliv náhody a dovedností.

Jste připraveni vsadit si na anglickou Premier League? Pinnacle nabízí celou řadu kurzů na Premier League s nízkou marží na mnoha různých trzích. Zde si můžete založit účet. Pokud jste u sázení na sporty noví, prohlédněte si naši užitečnou stránku článků o sázení, která vám může pomoci rychle se dostat do hry.

strategy-openaccount.jpg 

Informační zdroje o sázení – Abyste mohli lépe sázet

Informační zdroje o sázení společnosti Pinnacle jsou jednou z nejrozsáhlejších sbírek odborných článků a rad o sázení, jaké na internetu najdete. Zajímavé informace v ní najdou sázkaři bez ohledu na míru svých zkušeností. Naším cílem je zprostředkovat lidem znalosti, aby mohli lépe sázet.