Ve fotbale se týmy snaží skórovat do soupeřovy branky, aniž by přitom samy dostaly gól. Zní to jednoduše, ale kvůli náhodně, štěstí a podobným faktorům týmy ne vždy dosáhnout takových výsledků, jaké si „zaslouží“.
Proto se při sázení na sporty hodí analyzovat různé údaje, například právě očekávaný počet gólů – můžeme tak výkon prozkoumat z analytičtějšího pohledu a pracovat s fakty namísto toho, abychom jen říkali „Měli smůlu, že nevyhráli.“
Protože akcí definující gól je střela, jsou pro každý model očekávaného počtu gólů nezbytné údaje o střelách.
Počet očekávaných gólů (často zkracovaný jako xG) je jedním ze způsobů analýzy údajů používaných fotbalovými týmy a mezi sázkaři je stále oblíbenější. Údaje o očekávaném počtu gólů jsou snadno dostupné na internetu, někdy se však na různých místech liší kvůli rozdílným modelům použitým k jejich výpočtu.
Modely mohou být jednoduché i složité. Níže naleznete vysvětlení jejich principu. Jaký je tedy mechanismus různých modelů a jak se liší jejich výstupy?
Využití základních údajů o střelách
Andrew Beasley v minulosti popsal, jak vypočítat očekávaný počet gólů pomocí jednoduchého modelu vycházejícího z údajů o střelách. Protože akcí definující gól je střela, jsou pro každý model očekávaného počtu gólů nezbytné údaje o střelách – ve fotbalovém zápasu dochází k bezpočtu událostí, které mohou přispět ke vstřelení gólu, při předpovídání tohoto konkrétního výsledku jsou však nepochybně nejdůležitější právě střely.

Jde o jednoduchý přístup využívající toho, co Opta definuje jako „velkou šanci – tedy situaci, kdy od hráče lze rozumně očekávat, že dá gól – a počet střel z brankoviště a z větší vzdálenosti.
Procenta proměněných šancí z uplynulých pěti sezón Premier League ukazují, že velké šance mají hodnotu xG rovnou 0,387 (38,7% šance na vstřelení gólu), střely z brankoviště mají 0,070 a střely z větší vzdálenosti 0,036.
Podrobná analýza údajů o střelách
Vzhledem k velikosti fotbalového hřiště, různým úhlům, z nichž lze střílet, a vlivu těchto faktorů na pravděpodobnost úspěchu je zřejmé, že na výstup modelu očekávaných gólů má vliv i to, zda daný model podrobněji zkoumá místo, odkud hráč střílí.

Ačkoli je tento přístup podobný jednoduchému modelu Andrewa Beasleye, podrobněji zkoumá místo střely a podle něj jí přiřazuje hodnotu xG. Nejjednodušším způsobem, jak to udělat, je rozdělit plochu, z níž se na branku střílí, na mřížku a každou střelu do ní zakreslit.
Výhodou takového modelu je ta, že bere v úvahu rozdíl mezi střelou z místa přímo před brankou (s velkou pravděpodobností úspěchu) a střelou z ostrého úhlu (mnohem menší šance) a mezi tím, zda šlo o hlavičku (mnohem menší šance na gól) nebo kop nohou (kterým je vstřelení gólu snazší).
Dobrým příkladem o něco složitějšího přístupu k analýze údajů o místě střely v rámci modelu xG je model Paula Rileye.
Zohlednění postupu útoku
Pravděpodobnost proměnění šance samozřejmě nezáleží jen na místu střely a na tom, jakou částí těla je míč na bránu vyslán. Vliv na kvalitu dané šance bude mít i průběh hry v bezprostředních okamžicích před střelou.
Namísto prostého přiřazení hodnoty xG ke střele podle místa jejího kopnutí některé modely zkoumají, jak gólová příležitost vznikla (přihrávkou ze strany, z dálky skrz obránce, protiútokem atd.) a jak přesně byla provedena (střela po úspěšné kličce, po znovuzískání míče atd.).

Je jasné, že takový model vyžaduje více údajů a zdrojů jak k vytvoření, tak k udržování – jedním z příkladů modelu očekávaného počtu gólů, který při přiřazování hodnot xG zohledňuje širší postup útoku, je model 11tegen11.
Vliv obrany na xG
Všechny tři výše uvedené způsoby modelování očekávaného počtu gólů poskytují kvalitní odhady toho, jaký počet gólů lze od týmu očekávat v jednom zápase nebo za celou sezónu. K potenciálu gólové příležitosti však přispívají i jiné proměnné.
Namísto prostého přiřazení hodnoty xG ke střele podle místa jejího kopnutí některé modely zkoumají, jak gólová příležitost vznikla a jak přesně byla provedena.
Ve fotbale nejde jen o útoky. Stejně důležité je rozestavení obrany a omezení soupeřovy šance vstřelit gól. Obránci mohou útočícího hráče přinutit vystřelit z jiného úhlu nebo na poslední chvíli změnit plán, což jeho šanci na úspěch sníží.
Kromě analýzy celého postupu útoku – od chvíle, kdy šance vznikla, až po místo samotné střely – lze zvýšit podrobnost modelu očekávaných gólů tak, že zohledníme blízkost soupeřových obránců a jejich vliv na kvalitu střely.
To znamená, že nejpřesnější odhad očekávaného počtu gólů můžeme získat, pokud zohledníme postavení brankáře a obránců relativně k místu, odkud střela letěla.
Jaký typ modelu očekávaných gólů je nejpřesnější?
Když teď víme, jak různé modely očekávaného počtu gólů fungují, můžeme se podívat, jaká metoda dává nejpřesnější výsledky. Níže uvedená tabulka porovnává skutečný gólový rozdíl pro jednotlivé týmy z Premier League 2016/17 a očekávaný gólový rozdíl vypočtený různými modely uvedenými výše.
Aktuální gólový rozdíl vs. očekávaný gólový rozdíl
Tým
|
Skutečný GR
|
Model 1 xGR
|
Rozdíl
|
Model 2 xGR
|
Rozdíl
|
Model 3 xGR
|
Rozdíl
|
Arsenal
|
+33
|
+12.5
|
-20.5
|
+17
|
-16
|
+15.39
|
-17.61
|
Bournemouth
|
-12
|
-6.80
|
+5.20
|
-15
|
-3
|
-13.76
|
-1.76
|
Hull City
|
-43
|
-33.80
|
+9.20
|
-35
|
+8
|
-38.88
|
+4.12
|
Burnley
|
-16
|
-19.20
|
-3.20
|
-26
|
-10
|
-21.06
|
-5.06
|
Chelsea
|
+52
|
+25.90
|
-26.10
|
+31
|
-21
|
+31.91
|
-20.09
|
Crystal Palace
|
-13
|
-1.50
|
+11.50
|
-5
|
+8
|
-6.05
|
+6.95
|
Everton
|
+18
|
+5
|
-13
|
+1
|
-17
|
+1.82
|
-16.18
|
Sunderland
|
-40
|
-27.40
|
+12.60
|
-26
|
+14
|
-30.56
|
+9.44
|
Leicester City
|
-15
|
-7.60
|
+7.40
|
-7
|
+8
|
-6.65
|
+8.35
|
Liverpool
|
+36
|
+25.30
|
-10.7
|
+33
|
-3
|
+31.87
|
-4.13
|
Manchester City
|
+41
|
+41.80
|
+0.80
|
+44
|
+3
|
+51.13
|
+10.13
|
Manchester United
|
+25
|
+25
|
0
|
+24
|
-1
|
+29.48
|
+4.48
|
Middlesbrough
|
-26
|
-21
|
+5
|
-25
|
+1
|
-22.46
|
+3.54
|
Southampton
|
-7
|
+6.60
|
+13.60
|
+8
|
+15
|
+8.15
|
+15.15
|
Stoke City
|
-15
|
-0.60
|
+14.40
|
-2
|
+13
|
+0.45
|
+15.45
|
Swansea City
|
-25
|
-21.70
|
+3.30
|
-20
|
+5
|
-27.34
|
-2.34
|
Tottenham Hotspur
|
+60
|
+32.50
|
-27.50
|
+30
|
-30
|
+31.04
|
-28.96
|
Watford
|
-28
|
-12.20
|
+15.80
|
-13
|
+15
|
-16.14
|
+11.86
|
WBA
|
-8
|
-11.80
|
-3.80
|
-7
|
+1
|
-8.52
|
-0,52
|
West Ham United
|
-17
|
-11.10
|
+5.90
|
-7
|
+10
|
-9.83
|
+7.17
|
Přesnost těchto metod nejlépe posoudíme tak, že najdeme odchylku střední kvadratické hodnoty (RMSD), nazývanou někdy i chyba střední kvadratické hodnoty (RMSE). Tu vypočteme umocněním rozdílu mezi skutečným gólovým rozdílem a očekávaným gólovým rozdílem jednotlivých týmů, spočtením průměru těchto hodnot a jeho odmocněním.
Přesnost modelu očekávaných gólů
|
Model 1 xGR
|
Model 2 xGR
|
Model 3 xGR
|
RMSD
|
12.92
|
12.55
|
12.01
|
Jak vidíte, výsledky těchto tří metod jsou při výpočtu očekávaného gólového rozdílu v sezóně Premier League 2016/17 neuvěřitelně podobné – rozdíl v RMSD mezi všemi třemi je pouze 0,91. A to i přesto, že každá metoda používá jiné množství vstupních údajů.
Jedna sezóna (380 zápasů) však není dostatečný vzorek k tomu, abychom mohli s jakoukoli rozumnou mírou jistoty prohlásit, že jedna metoda je lepší než jiná. O přesnosti jednotlivých modelů a jejich schopnosti správně odhadnout počet gólů vstřelený v určitém zápase navíc lépe vypoví výpočet RMSD pro jednotlivé zápasy.
Chtěli byste se o očekávaném počtu gólů dozvědět víc?
Pokud byste se chtěli o očekávaném počtu gólů dozvědět víc a nově získané znalosti využít v praxi, přečtěte si článek Andrewa Beasleye o tom, jak lze tuto metriku využít při sázení na Premier League.
Můžete také sledovat Paula Rileye a 11tegen11 na Twitteru a zúčastnit se diskusního dne, který společnost Pinnacle pořádá 10. září 2017 právě na téma očekávaného počtu gólů.
