Det er ikke så ofte det blir mål. For de siste fem fullførte Premier League-sesongene er snittet for antall mål per kamp bare 2,73. Som det sto i en populær bok om fotballdata, The Numbers Game, kan opptil 50 % av kampresultatet skyldes flaks, tilfeldig sprett på ballen eller dommerbeslutninger.
Derfor er det viktig å bruke et stort datasett når du skal gjøre beregninger. Så i stedet for å bruke de 2,73 målene per kamp i Premier League-sesongen 2015/16 til modellen vår, kan vi bruke de 8,49 skuddene på mål eller kanskje de 25,7 skuddene totalt.
Problemet her er at selv om alle mål er verdt like mye, kan sannsynligheten for skåring variere enormt. Det er her beregninger av forventet antall mål (eller FM) kommer inn i bildet. I snitt ble 9,7 % av skuddene i den engelske toppdivisjonen de siste fem årene konvertert til mål, men hvis vi fordeler skuddene på kategorier, får vi se hvor store forskjeller det er mellom konverteringsratene.
Hvis vi ser på historiske data, kan vi bruke så mange faktorer vi ønsker for å beregne hvor sannsynlig det er at et skudd blir til en skåring. Visse svært detaljerte modeller tar med faktorer som hvorvidt målet ble skåret med føttene eller hodet, situasjonen som førte til skåringen og så videre. Dette krever avansert datainnsamling og kunnskap om statistisk analyse, men det er faktisk mulig å skaffe seg innsikt ved å beregne antall mål med et enklere system. Her skal jeg forklare det jeg bruker selv.
Beregne verdien av forskjellige typer mål
La oss starte med straffespark. Fra 2011/12-sesongen til 2015/16-sesongen var det 443 straffespark i Premier League. Til sammen ble det skåret på 347 av disse, altså ble det skåret på 78,3 % av straffesparkene. Dette tilsvarer en målforventning på 0,783 for straffespark.
Opta klassifiserer det de regner for å være kvalitetsmuligheter som "store sjanser" og beskriver disse som "situasjoner der man har rimelig grunn til å forvente at en spiller vil skåre (vanligvis i 1-mot-1-situasjoner eller på kort avstand fra mål)."
I de siste fem sesongene av den engelske toppdivisjonen har det blitt skåring på 2579 av de totalt 6213 store sjansene. Men vi må huske at dette også omfatter straffespark. Hvis vi fjerner alle straffesparkene, blir sluttresultatet at det skåres på 38,7 % av de store sjansene, altså blir FM-verdien 0,387.
Så kan vi se bort fra de store sjansene og ta en titt på resten av skuddene fra innenfor sekstenmeteren. De siste fem årene har det vært 22 822 skudd fra innenfor sekstenmeteren som ikke var store sjanser. 1587 av disse havnet i nettet, altså er målforventningen 0,070 for denne typen skudd.
Til slutt har vi skudd fra utenfor sekstenmeteren. Det var 22 318 slike skudd i Premier League mellom august 2011 og mai 2016. 809 av dem endte med skåring, noe som gir 3,6 % sjanse i snitt for å skåre på slike skudd. Dette tilsvarer en målforventning på 0,036 for skudd fra utenfor sekstenmeteren. Det finnes variasjoner også innen dette. For direkte frispark er målforventningen omtrent 5–6 %, men for et enkelt system som dette, holder det å bruke tallet 3,6 %.
Slik beregner man forventede mål per lag
Denne skuddstatistikken er lett tilgjengelig fra diverse fotballnettsteder og -apper, så med denne kunnskapen kan du enkelt finne FM-verdien for hvert av lagene i en kamp. Hvis vi ser på kamper for denne sesongen (til og med 12. mars 2017) ser vi hvordan dette kan gi en fordel fremfor ren skuddstatistikk. I de 211 Premier League-kampene som ble "vunnet" (ekskludert selvmål), vant laget som skjøt flest skudd 151 (71,6 %) av gangene, mens laget som hadde høyest FM-verdi vant 170 (80,6 %) av gangene.
Jeg brukte FM-data for 2016/17-sesongen og Poisson-fordelingen til å lage følgende prognoser for resultatene og oddsene for kamper i uke 29 av Premier League.
Resultatprognoser basert på FM-verdier
Vi ser i kolonnen "forventet resultat" at det var ett riktig resultat og fire andre resultatvalg (altså hjemmeseier, uavgjort eller borteseier) som var korrekte. Med oddsene jeg beregnet med systemet mitt kan vi se at favoritten "vant" veddemålet i seks av ti kamper, men du må selvsagt sammenligne oddsene dine med oddsene Pinnacle tilbyr og bestemme deg for hvor du skal satse penger. Du kan lese vår populære artikkel Hva representerer oddsen i tipping for å finne ut hvordan du kan ta i bruk dette.
Begrensningene til FM-verdimodellen
Det er viktig å huske at alle modeller har sine begrensninger. Uansett hvor bra systemet ditt er, kan det ikke vite om en stjernespiss blir skadet, en klubb får ny giv etter bytte av trener eller at et lag er utslitt etter å ha spilt en kamp ute i Europa.
Et system som dette kan heller ikke forutsi kamper med uvanlig mange mål. Dette er uunngåelig siden det er basert på snitt og det skåres mindre enn 2,5 mål i omtrent halvparten av kampene som spilles.
Men selv om et skudd generelt har målforventningen 0,097, kan man bruke et enkelt system som dette for å finne ut at skuddene til Manchester City er verdt 0,113 mens skuddene til Hull bare er verdt 0,083.
Vi kan bruke statistiske data og beregne forventede mål for å gi presise evalueringer av forsvars- og angrepsstyrken til spesifikke lag. Hvis du kombinerer det ovennevnte med Poisson-fordelingen, er du godt på vei til å kunne lage presise prognoser på forventet resultat i fotballkamper.