jan 25, 2019
jan 25, 2019

En innsikt i begrensningene ved forventede mål

Fremveksten av forventede mål

Hva inneholder modellen, og hva kan vi lære av den?

Trenger vi spillerspesifikk informasjon?

Når og hvordan vi kan bruke forventede mål

En innsikt i begrensningene ved forventede mål

De siste 18 månedene har måleverdien forventede mål funnet veien fra obskure blogger for fotballanalyse til artikler i massemedia. Folk begynner kanskje å få en bedre forståelse av måleverdien og fordelen den gir, men det ser ut som mange ikke har forstått de potensielle fallgruvene. Hvilke begrensninger har forventede mål? Les videre for å finne det ut.

Fremveksten av forventede mål

Før vi begynner å se på begrensningene ved forventede mål (xM), vil jeg gjerne forklare hva det er og hvorfor det har blitt så populært. Kort fortalt er xM et mål på sjansenes kvalitet. Det forteller oss hvor stor sannsynlighet det er (hva forventningen er) for at et skudd skal ende med mål. Statistikken baseres på et stort utvalg skudd fra akkurat den posisjonen på fotballbanen (det kan også tas med flere aspekter i beregningen, men dette kommer vi tilbake til senere).

Forventede mål angis som oftest som et tall mellom 0 og 1 (der 0 er garantert bom, og 1 er garantert mål). Det er også mulig å angi kvaliteten på en skåringssjanse som en prosentverdi (dette er bare 0–1 xM konvertert til prosent). Et skudd som har 0,5 xM, kan også beskrives som et skudd med 50 % sjanse for skåring.

xM fungerer bra til å analysere ytelse (fordelaktig for et fotballag som prøver å lære og forbedre seg eller rekruttere nye talenter), men har også blitt populært blant fotballfans generelt fordi det har vist seg å gi bedre prognoser enn andre populære statistiske måleverdier (blant annet skudd, målforskjell og poeng).

Hva inneholder modellen, og hva kan vi lære av den? 

Det finnes mange gode argumenter for å ikke bruke xM, og av og til kommer disse fra folk som har brukt mye tid på å studere xM til siste detalj. Dessverre kommer denne kritikken ofte fra folk som mener at den strider mot sportens tradisjoner, og som ikke har tatt seg tid til å forstå hva den innebærer og hvordan den fungerer.

Dataene du bruker er riktig nok en viktig del av enhver modell, men det er akkurat like viktig hvordan du analyserer data.

«Fotball spilles på banen, ikke på et regneark» og «Det eneste tallet som betyr noe, er resultatet etter 90 minutter» er bare et par eksempler på hva du kan forvente å høre fra kritikerne av forventede mål. Likevel sier mange av disse også ting som «Han burde ha skåret derfra» og «Det var uflaks at vi ikke vant», noe som egentlig er akkurat de tingene som xM kan støtte (eller motbevise) ved å bruke data.

Den negative oppfatningen av forventede mål stammer tydeligvis fra ubegrunnede og ofte ulogiske slutninger, men det finnes også noen begrensninger ved denne måleverdien. Hvis du planlegger å bruke forventede mål til din fordel, spesielt hvis du planlegger å lage en prognosemodell for tipping på fotball, kan det være meget problematisk å ignorere disse ulempene. 

Velg riktig modell

Det er kanskje ikke spesielt negativt, men det er viktig å forstå at det ikke finnes én altomfattende modell for forventede mål. Det finnes mange forskjellige modeller for forventede mål (mange av dem er tilgjengelig gratis på nettet), og hver av disse modellene er basert på egne sett parametere som gir forskjellige forventede mål-verdier – en modell gir kanskje 0,52 xM, mens andre viser 0,47, 0,58 eller til og med over 0,60.

Det er ikke lett å si hvilken xM-modell som er best, og det er lett å bli lurt til å tro at jo mer informasjon man tar med i en modell, desto bedre blir den. Hvis man tar med mer informasjon enn den grunnleggende, som skuddplassering, ved å legge til vinkelen mot mål, hvilken kroppsdel som brukes til å utføre skuddforsøket, typen assistanse, hvor mye motstand forsvaret gir og hvor målvakten er plassert, får man en mer avansert modell. Dessverre øker også sannsynligheten for at modellen blir for spesifikk.

Det finnes masse støy (tilfeldighet) i fotball, og xM kan hjelp deg med å se forbi den støyen og få et mer tydelig bilde, men etter hvert som forventede mål-modeller blir mer avanserte, stiger også risikoen for at ting blir alt for kompliserte. Hvis man legger til for mange parametere i en modell, kan resultatet rett og slett bli at man bare gjenspeiler dataene man mater inn i stedet for å gi verdifulle prognoser.

Trenger vi spillerspesifikk informasjon?

Et av de største problemene med xM er ikke hva den kan fortelle oss, men hva den ikke kan fortelle oss. Forventede mål tar ikke med enkeltspillere i beregningen (eller hvor dyktige de er). De fleste modeller baseres på en database med mange tusen skudd, så resultatet blir et gjennomsnittlig tall, ikke spesifikt for den personen som tar skuddet.

Siden man ikke har med spillerspesifikk informasjon, betyr det at hvis Harry Kane og Pablo Zabaleta sto på samme sted og skulle skyte samme skudd, ville sannsynligheten blitt oppgitt som den samme xM-verdien (selv om vi vet at det er betydelig større sjanse for at Harry Kane kom til å skåre).

Det er viktig å vite hvilken spiller som skal ta skuddet, både når man analyserer lag og enkeltspillere. Det er også viktig å vite hvem som står i mål (et annet parameter som xM ikke kan ta med i beregningen). Denne gangen kan vi tenke oss at Harry Kane har samme mulighet som tidligere. Han kan kanskje skyte på David De Gea eller en målvakt fra fjerdedivisjon i Engelsk fotball, men en forventede mål-modell vil gi akkurat samme sannsynlighet for skåring i begge tilfellene.

Dette problemet vises tydelig når vi vet at visse spillere (som Harry Kane) konsistent har gjort det bedre enn de aller fleste xM-modeller de siste årene. I tillegg har visse målvakter (som De Gea) bidratt til at lagene deres har gjort det bedre enn forventede mål-verdien (xMi) i den samme tidsperioden.

Når og hvordan vi kan bruke forventede mål

Det andre problemet ved forventede mål handler mer om hvordan man bruker den enn om selve måleverdien. I dette tilfellet ligger ikke problemet hos forventede mål, men hos de som bruker den. For å si det enkelt har xM liten nytteverdi når man ser bare på én enkelt kamp, og fungerer best når man ser på lengre tidsperioder og større datasett.

Hvis du planlegger å bruke forventede mål til din fordel, kan det være meget problematisk å ignorere disse ulempene.

Fotball er en meget fleksibel sport som endrer seg fra det ene øyeblikket til det andre. Stillingen, antallet spillere på banen, hvor mye av kampen som gjenstår og hva som står på spill (sistnevnte er spesielt viktig når det spilles om nedrykk eller lignende). Hvis (kanskje man egentlig bør si når) man bruker forventede mål på enkeltkamper, kan tallene være misvisende fordi de ikke forteller hele historien og mangler viktig kontekst.

Det er også viktig å forstå at selv om forventede mål kan være en nyttig verdi, betyr det ikke at den bør brukes i hytt og pine. Tidlig i sesongen er dataene sannsynligvis dårlige, fordi det bare har blitt spilt en håndfull kamper med den gjeldende konkurransesituasjonen (selv uten at man tar med nivået på motstanderne man har møtt). 

Den sjette kampen i en nasjonal sesong anses ofte for å være et viktig punkt. Det kan hevdes at det er først da ting begynner å stabilisere seg datamessig, og det blir mindre støy som forstyrrer. Omtrent seks kamper inn i sesongen begynner xM å bli nyttig, og fra dette punktet og utover kan den brukes.

Akkurat som man kan si at forventede mål ikke bør brukes tidlig i sesongen, er det også noen som hevder at den ikke bør brukes for sent (i det minste ikke for mye). Vi må selvsagt vente lenge nok til at trendene rekker å utvikle seg, men samtidig kan det hende at enkelte lag gjør det bedre eller dårligere enn forventningene av spesifikke årsaker, og det finnes tilfeller der vi blir nødt til å se på mer enn dataene (heller enn å vente på regresjon).

Det finnes ikke noe magisk tall, men når man beveger seg inn i den siste tredjedelen av en nasjonal ligasesong, anbefales det at man begynner å se nærmere på de faktiske resultatene (man kan likevel fortsette å bruke xM for å få mer innsikt).

Dette betyr ikke nødvendigvis at forventede mål ikke kan være nyttige på lang sikt. Flytende xM er en bra måte å vurdere om et lag forbedrer seg eller blir dårligere, spesielt når det dukker opp en ny trener eller nye spillere. Disse dataene kan være nyttige når man går fra en sesong til en annen, men tendensen til at lagoppsetningen endres betyr også at dataene fort kan bli utdaterte.

Forventede mål er en nyttig verdi, men den må brukes riktig.

For mange er forventede mål den absolutt beste måleverdien for ytelsesstatistikk i fotball. Alle analytikere vet likevel at konteksten betyr veldig mye, og at det kan være farlig å lene seg for mye på én enkelt måleverdi for statistisk analyse – spesielt når det skjer på enkeltkampbasis.

Alle som bruker xM har en viss forståelse av fordelene, men de bør også lære seg hvilke begrensninger som gjelder. Dataene du bruker er riktig nok en viktig del av enhver modell, men det er akkurat like viktig hvordan du analyserer data. xM kan kun oppnå sitt fulle potensial (både på godt og vondt) hvis man fullt ut forstår hva man holder på med.

Tipperessurser – Bli en bedre spiller

Pinnacles Tipperessurser er en av nettets mest omfattende samlinger av ekspertråd for tipping. Passer for alle erfaringsnivåer, og formålet er ganske enkelt å gi kundene våre støtten de trenger for å bli bedre spillere.