close
sep 5, 2017
sep 5, 2017

En analyse av forskjellige modeller for forventet antall mål

Hvordan beregner man forventet antall mål?

Hvilke forskjellige metoder finnes det for modellering av forventet antall mål?

Hvilken type modell for forventet antall mål er mest presis?

En analyse av forskjellige modeller for forventet antall mål

Referanseverdien Forventet antall mål var tidligere forbeholdt et fåtall sportsdata-entusiaster, men nå har den fått plass blant annen vanlig fotballstatistikk som ballbesittelse, skudd på mål og antall overtredelser. Det finnes mange forskjellige tilnærminger til forventet antall mål. I denne artikkelen ser vi på de forskjellige modellene som brukes og hvordan de gir forskjellige resultater.

Målet i fotball er å skåre på motstanderen uten å slippe inn mål selv. Det høres kanskje enkelt ut, men på grunn av faktorer som tilfeldighet og flaks, oppnår ikke lagene alltid de resultatene de fortjener.

Det er derfor dataanalyse og referanseverdier som forventet antall mål er så nyttige i sportstipping. Vi kan analysere resultatene fra et mer analytisk ståsted og gi mer dyptgående svar enn "det var uflaks at de ikke vant".

Siden et skudd er den definerende handlingen for et mål, er skuddata nøkkelen til enhver modell for forventet antall mål.

Forventet antall mål (ofte forkortet til xM) er en type dataanalyse som brukes av fotballag og som blir stadig mer populær blant tippespillere. Du finner mye forskjellig statistikk for forventet antall mål på nettet, men de er ikke alltid like, fordi de beregnes med forskjellige modeller.

Modellene varierer fra det enkle til det komplekse. Nedenfor ser du en forklaring av hvordan forskjellige modeller for forventet antall mål fungerer. Hva er så egentlig hemmeligheten bak de forskjellige modellene, og hvor store forskjeller er det på resultatene man får fra dem?

Basert på grunnleggende skuddata

Andrew Beasley har tidligere forklart hvordan man beregner forventet antall mål med en enkel skuddata-modell. Siden skuddet er den definerende handlingen i et mål, er skuddata nøkkelen til en god modell for forventet antall mål. Det finnes talløse hendelser i en fotballkamp som påvirker målskåringen, men når vi skal beregne akkurat dette, er skuddene utvilsomt det viktigste.

heat-map-inarticle.jpg

Dette er en enkel metode som baserer seg på det Opta kaller "store sjanser" – en situasjon der man med rimelighet kan forvente at en spiller bør skåre – samt skudd fra utenfor og innenfor sekstenmeteren.

Konversjonsrater fra de siste fem Premier League-sesongene viser at en stor sjanse har xM-verdien 0,387 (38,7 % sjanse for skåring), mens skudd fra innenfor sekstenmeteren har 0,070 i xM-verdi og skudd fra utenfor sekstenmeteren har 0,036 i xM-verdi.

Basert på detaljerte analyser av skuddata

Fotballbaner er store, så de forskjellige vinklene man kan skyte fra påvirker selvfølgelig skåringssjansen. Derfor påvirkes resultatet for forventet antall mål av hvor detaljert en modell analyserer skuddposisjonen. 

grid-inarticle.jpg

Denne tilnærmingen minner mye om Andrew Beasleys grunnleggende modell for forventet antall mål, men bruker en mer detaljert analyse av hvor skuddet tas fra for å tildele xM-verdien. Den enkleste måten å gjøre dette på er å dele inn avstanden skuddet kan tas fra i forskellige soner og plotte inn alle skuddene.

Fordelen ved denne typen modell er at den tar skuddstedet med i beregningen. Sannsynligheten er annerledes hvis en spiller skyter fra rett foran målet (høy sannsynlighet for skåring) eller fra en skrå vinkel (lavere sannsynlighet for skåring), og hvis skuddet tas med hodet (vanskeligere å skåre) eller med foten (lettere å skåre).

Paul Rileys modell er et godt eksempel på en noe mer avansert tilnærming til analyse av data for skuddsted når man lager en xM-modell.

Basert på angrepsprosessen

Det er selvsagt ikke bare skuddstedet og hvilken kroppsdel som brukes som bestemmer hvor sannsynlig det er at man skårer på et skudd. Spillet før skuddet påvirker også hvor god sjansen er.

Heller enn bare å tildele en xM-verdi til et skudd basert på skuddstedet, ser noen modeller nærmere på hvordan skuddsjansen oppsto (krysspasning, gjennomspill, kontring osv.) og hvordan skuddet ble tatt (skudd etter vellykket dribling, kontring etter en redning osv.).

pass-inarticle.jpg

Det kreves naturlig nok mer data og flere ressurser for å lage og opprettholde en slik modell – xM-modellen til 11tegen11 er et eksempel på en modell for forventet antall mål som tar med mer av angrepsprosessen i beregningen når den regner ut en xM-verdi til skuddene.

Effekten forsvaret har på xM

De tre andre modelleringsmetodene for forventet antall mål gir gode anslag for hvor mange mål et lag kan forvente å skåre i en enkelt kamp eller for hele sesongen sammenlagt. Likevel finnes det flere variabler som påvirker potensielle målsjanser.

Heller enn bare å tildele en xM-verdi til et skudd basert på skuddstedet, ser noen modeller nærmere på hvordan skuddsjansen oppsto og hvordan skuddet ble tatt.

Fotball handler ikke bare om angrep. Defensiv posisjonering og redusering av motstanderens skåringssjanse er like viktig – forsvarsspillere kan tvinge en spiller til å skyte på en annen måte eller gjøre justeringer i siste minutt som påvirker sannsynligheten for skåring.

I tillegg til å analysere hele prosessen – fra en sjanse blir skapt og helt frem til den siste handlingen finner sted – kan man videreutvikle modellen for forventet antall mål ved å ta med avstanden til forsvarsspillerne og hvordan dette påvirker skuddkvaliteten i beregningen.

Dette innebærer at hvis man ser på hvor målvakten og forsvarsspillerne er plassert i forhold til skuddstedet, kan man ende opp med en enda mer presis modell for forventet antall mål.

Hvilken type modell for forventet antall mål er mest presis?

Nå som vi vet hvordan modeller for forventet antall mål fungerer, kan vi begynne å analysere hvilken metode som gir mest presise resultater. I tabellen under sammenlignes faktisk målforskjell for hvert av lagene i Premier League-sesongen 2016/17 med forventet målforskjell basert på de forskjellige modellene for forventet antall mål som vi nevnte over.

Faktisk målforskjell kontra forventet målforskjell

Lag

Faktisk MF

Modell 1 xMF

Differanse

Modell 2 xMF

Differanse

Modell 3 xMF

Differanse

Arsenal

+33

+12,5

-20,5

+17

-16

+15,39

-17,61

Bournemouth

-12

-6,80

+5,20

-15

-3

-13,76

-1,76

Hull City

-43

-33,80

+9,20

-35

+8

-38,88

+4,12

Burnley

-16

-19,20

-3,20

-26

-10

-21,06

-5,06

Chelsea

+52

+25,90

-26,10

+31

-21

+31,91

-20,09

Crystal Palace

-13

-1,50

+11,50

-5

+8

-6,05

+6,95

Everton

+18

+5

-13

+1

-17

+1,82

-16,18

Sunderland

-40

-27,40

+12,60

-26

+14

-30,56

+9,44

Leicester City

-15

-7,60

+7,40

-7

+8

-6,65

+8,35

Liverpool

+36

+25,30

-10,7

+33

-3

+31,87

-4,13

Manchester City

+41

+41,80

+0,80

+44

+3

+51,13

+10,13

Manchester United

+25

+25

0

+24

-1

+29,48

+4,48

Middlesbrough

-26

-21

+5

-25

+1

-22,46

+3,54

Southampton

-7

+6,60

+13,60

+8

+15

+8,15

+15,15

Stoke City

-15

-0,60

+14,40

-2

+13

+0,45

+15,45

Swansea City

-25

-21,70

+3,30

-20

+5

-27,34

-2,34

Tottenham Hotspur

+60

+32,50

-27,50

+30

-30

+31,04

-28,96

Watford

-28

-12,20

+15,80

-13

+15

-16,14

+11,86

WBA

-8

-11,80

-3,80

-7

+1

-8,52

-0,52

West Ham United

-17

-11,10

+5,90

-7

+10

-9,83

+7,17

Den beste måten å teste presisjonen til hver av disse tilnærmingene på er å finne avviket fra kvadratisk gjennomsnitt (Root-Mean-Square, RMS). Dette gjør man ved å ta kvadratet av differansen mellom faktisk målforskjell og forventet målforskjell for hvert av lagene, beregne snittet og så finne kvadratroten av det snittet.

Presisjon på modell for forventet antall mål

Modell 1 xMF

Modell 2 xMF

Modell 3 xMF

RMS-avvik

12,92

12,55

12,01

Som du ser, gir de tre forskjellige tilnærmingene svært like resultater for Premier League-sesongen 2016/17 – det er kun 0,91 RMS-avvik som skiller mellom dem, til tross for at de ble basert på forskjellige data.

Dessverre er ikke én sesong (380 kamper) et stort nok datagrunnlag til at vi med sikkerhet kan si om en modell er bedre enn den andre. I tillegg kan man beregne RMS-avvik på kampbasis for å få mer innsikt i hvor presis hver modell er og hvor godt de kan beregne hvor mange mål som kommer til å bli skåret i en kamp.

Vil du lære mer om forventet antall mål?

Hvis du vil vite mer om forventet antall mål, og bruke disse kunnskapene i tipping, har Andrew Beasley skrevet om hvordan dette referansetallet kan  brukes til Premier League-tipping.

Du kan også følge Paul Riley og 11tegen11 på Twitter og delta i Pinnacles diskusjonsdag for forventet antall mål, den 09.10.2017.

discussion-day-expected-goals-inarticle.jpg

Tipperessurser – Bli en bedre spiller

Pinnacles Tipperessurser er en av nettets mest omfattende samlinger av ekspertråd for tipping. Passer for alle erfaringsnivåer, og formålet er ganske enkelt å gi kundene våre støtten de trenger for å bli bedre spillere.