Jedním z omezení Poissonova modelu je malá prediktivní schopnost u pravděpodobnosti bezgólových remíz. Tento článek vysvětluje, jak Poissonovů model upravit tak, aby dokázal s takovými remízami pracovat. Čtěte dál a dozvíte se víc.
Základním modelem používaným k předpovídání skóre ve fotbale je Poissonův model (nebo jeho varianty). Nejjednodušším přístupem je stanovit pro každý tým jako parametr očekávaný počet gólů a podle toho předpovědět výsledek.
Poissonův model funguje zhruba takto: parametrem domácího týmu je ligový průměr skóre tohoto týmu na domácím hřišti vynásobený útočným faktorem spočteným podle domácího týmu a obranným faktorem spočteným podle týmu hostů. První faktor upravuje skórovou výhodu domácích podle kvality obrany hostů (silnější obrana znamená méně gólových šancí) a druhý zas podle útočné kvality domácích. Očekávaný počet gólů hostů se vypočte podobně, použije se však útočný faktor hostů a obranný faktor domácích.
Nedostatky Poissonova modelu
Stejně jako u všech modelů i při předpovídání skóre fotbalového zápasu Poissonovým modelem existují určitá omezení – konkrétně platí, že výsledky jsou citlivé na změny použitých parametrů.
Skutečná pravděpodobnost remízy 0:0 je mnohem větší u týmů, které obvykle dosahují vysokého skóre, protože pokud ani po uplynutí značné části zápasu nepadne gól, mohou zvolnit tempo.
Poissonův model také předpokládá, že po stanovení parametrů očekávaného počtu gólů jsou počty gólů skórovaných jednotlivými týmy nezávislé. Ačkoli to je do určité míry řešeno použitím konkrétních faktorů obrany a útoku, můžeme skutečně předpokládat, že pravděpodobnost vstřelení pěti gólů týmem hostů je stejná bez ohledu na to, zda domácí tým dal také pět gólů, nebo vůbec žádný?
Nejvýraznějším omezením je předpoklad, že variance gólů vstřelených týmem je rovna očekávanému počtu gólů, což je vlastnost Poissonova rozdělení. Existují chytré způsoby, jak tento problém vyřešit, například Poissonovy modely s nadměrným (nebo malým) rozptylem a dvojrozměrný Poissonův model. Jejich popis však přesahuje rámec tohoto článku.
Jedním z kombinovaných důsledků těchto omezení je nedostatečná prediktivní síla pro bezgólovou remízu, jejíž pravděpodobnost může být vyšší i nižší než výsledek daný Poissonovým modelem. Podle mého názoru Poissonův model podhodnocuje možnost bezgólové remízy u týmů s vysokým očekávaným počtem gólů.
Skutečná pravděpodobnost remízy 0:0 je mnohem větší u týmů, které obvykle dosahují vysokého skóre, protože pokud ani po uplynutí značné části zápasu nepadne gól, mohou zvolnit tempo. Naproti tomu týmy, které obvykle dosahují nízkého skóre, mohou držet vysoké tempo až do vstřelení prvního gólu. Standardní Poissonův model by to nezachytil a pravděpodobnost bezgólové remízy by tedy určil příliš vysokou. Je to nicméně jen názor nepodložený žádným testem – pokud to je někdo ochoten otestovat a dát mi vědět, budu rád.
Jak podcenit nebo nadsadit pravděpodobnost remízy
Jedním přístupem, jak pravděpodobnosti bezgólových remíz zpřesnit, je nadsadit nebo podcenit takové remízy a podle toho upravit ostatní předpovědi. Lze to popsat jako postup o pěti krocích. Zde si ho ukážeme na jednoduchém příkladu:
Krok 1: Výpočet parametrů očekávaného počtu gólů pro oba týmy
Tato část vám pravděpodobně zabere nejvíce času, pokud jste výpočet neautomatizovali. Benjamin Cronin jej výborně popisuje ve svém článku o Poissonově roydělení. Pro jednoduchost předpokládejme, že parametry konečného průměru gólů jsou 1,7 pro domácí a 1,2 pro hosty (jde jen o náhodně určená čísla).
Krok 2: Výpočet pravděpodobnosti pro počet gólů vstřelený jednotlivými týmy
Tyto hodnoty vypočteme podle vzorce. Příklad najdete na výše uvedeném odkazu. V tomto případě používáme rozdělení pravděpodobnosti počtu vstřelených gólů. Vzorec je tento:
Krok 3: Výpočet rozdělení pravděpodobnosti pro různé výsledky zápasu
Nyní můžeme jednotlivé pravděpodobnosti vynásobit, čímž získáme pravděpodobnosti různých výsledků zápasu. Například skóre 0:0 má pravděpodobnost 18,3 % x 30,1 % = 5,5 %. Výsledky jsou uvedeny níže. Všimněte si, že součet není 100 %, protože zápas může skončit i jinými výsledky (například 5:1). Lze spočítat, že pravděpodobnost jiných skóre je 3,7 %.
Výpočet pravděpodobnosti výsledků zápasu
Krok 4: Výpočet nadsazení/podcenění parametru pro remízu 0:0
Zde do našeho výpočtu může proniknout subjektivní pohled. Předpokládejme napřílad, že podle minulých výsledků by bezgólová remíza měla mít pravděpodobnost 10 %. Proto bychom museli 5,5 % zvýšit na 10 %.
Parametr nadsazení lze vypočítat takto:
(předpokládaná pravděpodobnost 0-0)/(předpovězená pravděpodobnost)=(předpokládaná pravd.)/(pravd(0,0))
Pokud to označíme symbolem a, dostaneme:
α=10/5.5=1.82.
To v podstatě znamená, že pravděpodobnost bezgólové remízy zvyšujeme o 82 %. Protože pravděpodobnost tohoto výsledku vzrostla z 5,5 % na 10 %, musí celková pravděpodobnost ostatních výsledků stejnou měrou klesnout tak, aby součet činil 100 %.
Krok 4: Výpočet nadsazení/podcenění pro ostatní výsledky
Pro tento koeficient použijeme symbol β. Vypočteme jej takto:
β=(1-α[pravd(0,0)])/(1-[prob(0,0)])=(1-předpokládaná pravd.)/(1-předpovězená pravd.)
V tomto případě dostaneme β=(1-0,1)/(1-0,055)=0,95
Krok 5: Znovu vyplňte tabulku skóre upravenými hodnotami
Nyní konečně můžeme znovu vypočítat pravděpodobnosti různých výsledků vynásobením pravděpodobnosti 0:0 koeficientem α a zbytek pravděpodobností koeficientem β. Dostaneme níže uvedené výsledky. Pravděpodobnost ostatních výsledků bude 3,5 %.
Upravené pravděpodobnosti různých výsledků
Co jsme se o úpravách Poissonova modelu dozvěděli?
V tomto článku jsme psali o úpravách tradičního Poissonova modelu tak, aby se změnila pravděpodobnost bezgólové remízy. Tento model lze rozšířit o úpravu jakéhokoli výsledku, pokud jsou upraveny i pravděpodobnosti ostatních výsledků tak, aby součet byl 100 %.
Nejde o jediný přístup, jak změnit pravděpodobnosti některých výsledků. Například Dr. Alun Owen popsal na konferenci MathSport loni v květnu možná lepší přístup založený na zkráceném Poissonově modelu.
Toto upravení neomezuje vliv nedostatků Poissonových modelů, z nichž některé jsme si zde zmínili. Naopak přidává několik dalších předpokladů – předpokládanou pravděpodobnost bezgólové remízy a předpoklad, že se příslušně změní i pravděpodobnost ostatních výsledků β. Přesto může být dobrým vylepšením tradičních modelů, které bezgólové remízy zpravidla přeceňují nebo naopak podceňují.