nov 17, 2016
nov 17, 2016

Beregne sluttabellen i Premier League 2016/17

Beregne sluttabellen i Premier League 2016/17
Evnen til å forutse fremtidige resultater basert på historiske data er alfa og omega for tippeentusiaster som vil bruke statistikk til å forbedre fortjenesten. Men hvor pålitelige er egentlig prognosemodeller? I denne artikkelen forklarer Joseph Buchdahl hvordan True Score-teorien gjelder innenfor sportstipping og bruker den til å beregne sluttabellen for denne Premier League-sesongen. Les videre for å se prognosene hans.

Dominic Cortis beskrev i en tidligere artikkel hvordan man utformer og bruker prognosemodeller til å beregne fremtidige resultater. I en av artiklene han har skrevet om unøyaktighet i prognosemodeller minner han oss på at "prognoser er ikke profetier", da de kan "påvirkes av feil".

Feil og usikkerhet, også kjent som tilfeldighet og flaks, er grunnen til at mange modeller undervurderer mengden forskjellige resultater når de prøver å beregne hva vi kan forvente av fremtiden. Dette kan illustreres på en fin måte ved å se på True Score-teorien og hvordan den kan brukes til å forutse poengtabellen i Premier League. 

Prognoser skal være mindre omfattende enn virkeligheten

Phil Birnbaum forklarer i bloggen sin hvorfor prognoser fra modeller skal være mindre omfattende enn virkeligheten.

"Hvert eneste år siden 1983 har minst ett MLB-lag fullført med 97 eller flere seire. Det beste laget hadde over 100 seire over halvparten av gangene. Men hvis du ser på lagprognosene til ESPN for 2014, er det høyeste anslaget deres 93–69. Hva er det egentlig som skjer her? Forventer ESPN virkelig at ingen lag kommer til å vinne flere enn 93 kamper? Niks. Jeg vedder på at ESPN vil gi deg gode odds for at et eller annet lag kommer til å vinne 94 eller flere kamper, når man tar med tilfeldighet og flaks i beregningen."

Nøkkelordet her er "flaks". En modell prøver kun å stille en prognose for forventningene, uten å ta med flaks og uflaks i beregningen. I virkeligheten vil man se at noen lag har mer flaks enn uflaks, mens andre lag opplever det motsatte. Det beste laget kan kanskje ikke forvente å vinne flere enn 93 kamper basert på dyktigheten, men hvis de vinner et par kamper på grunn av flaks også, kan de ende opp med et bedre resultat. Er det mulig å fastslå i hvilken grad de faktiske resultatene oppstår basert på henholdsvis flaks og dyktighet?

True Score-teorien

True Score-teorien er en måte man kan beregne hvor mye av grunnlaget for resultater som skyldes henholdsvis flaks og dyktighet. Dette er en teori om måling som er veldig enkel, om enn kanskje ikke bevist: Det observerte resultatet er faktisk evne (dyktighet) pluss tilfeldige feil (flaks).

Mer spesifikt så hevder den at variasjonen i resultat er summen av variansen i dyktighet og variansen i flaks. Varians er et statistisk mål på mengden variasjon i et datasett, for eksempel sluttresultatene i Premier League-tabellen. Det tilsvarer kvadratet av standardavviket.

Tabellen nedenfor viser de faktiske sluttresultatene for de 20 Premier League-lagene ved slutten av sesongen 2015/16. 


Sluttabellen for Premier League 2015/16

Lag

Faktiske poeng

 Leicester

81

 Arsenal

71

 Tottenham

70

 Manchester City

66

 Manchester United

66

 Southampton

63

 West Ham

62

 Liverpool

60

 Stoke

51

 Chelsea

50

 Everton

47

 Swansea

47

 Watford

45

 WBA

43

 Crystal Palace

42

 Bournemouth

42

 Sunderland

39

 Newcastle

37

 Norwich

34

 Aston Villa

17


Mye har blitt skrevet om hvor heldige Leicester City var da de vant forrige Premier League-sesong, mens mange av de store lagene klarte seg mye dårligere enn forventet. Man kan også si at det dårlige resultatet til Aston Villa til en viss grad skyldes uflaks. Hvor stor effekt har flaks og uflaks på resultatene i denne tabellen?

Effekten av flaks

Den enkleste måten å finne ut hvor stor rolle flaksen spiller er kanskje å starte med å anta at alle lag er like gode, altså at det er samme sannsynlighet for at kampresultatet for hvert lag blir hjemmeseier, uavgjort eller borteseier.  Siden Premier League ble opprettet i 1992 har omtrent 46 % av kampene endt med hjemmeseier, mens omtrent 27 % av kampene har endt med uavgjort og 27 % har endt med borteseier. 

Siden Premier League ble opprettet i 1992 har omtrent 46 % av kampene endt med hjemmeseier, mens omtrent 27 % av kampene har endt med uavgjort og 27 % har endt med borteseier.

Hvis alle lag hadde oppnådd dette resultatet, ville alle fullført med omtrent 52 poeng. Men siden flaks og tilfeldigheter også spiller en rolle, vil ikke dette skje hver gang. Dette er den samme effekten som gjør at vi ikke alltid får nøyaktig 5 mynt og 5 kron etter 10 myntkast.

Vi kan bruke enMonte Carlo-simulering for å modellere i hvilken grad flaks og uflaks påvirker spredningen av poengresultatene rundt dette gjennomsnittet. For en simulering med 1000 hendelser var standardavviket 7,8 poeng, altså lå omtrent to tredjedeler av poengsummene mellom 44 og 60.

Effekten av dyktighet

I følge True Score-teorien skal variansen i dyktighet tilsvare den observerte variansen minus variansen som skyldes flaks. Det er enkelt å beregne den observerte variansen basert på poengtabellen for Premier League 2015/16, som vises over. Standardavviket er på 15,4 og viser at variansen er omtrent 238. Så kan vi beregne variansen som skyldes flaks: kvadratet av 7,8 er omtrent 61. Det betyr at variansen som skyldes dyktighet er omtrent 177 og standardavviket er omtrent 13,3 poeng.

Hvem vinner Premier League 2016/17?

True Score-teorien viser at resultatene i den endelige, observerte Premier League-tabellen skyldes en blanding av enkeltlagenes dyktighet og flaks. Siden alle prognosemodeller prøver å forutse forventede resultater uten å ta med flaks i beregningen, vet vi derfor at variasjonen i faktiske Premier League-poeng alltid er større enn det vi finner fra modellen. 

Dette stemmer godt med det man observerer i virkeligheten. Følgende tabell viser de modellerte sluttresultatene som vi kunne forvente basert på Pinnacles kampodds for de 380 kampene som ble spilt i sesongen 2015/16. Constantinos Chappas viser hvordan man beregner forventede poeng basert på grunnleggende kampodds.


Prognose for sluttabellen i Premier League 2016/17* 

Lag

Forventede poeng

Manchester City

76

Arsenal

75

Chelsea

68

Manchester United

67

Tottenham

65

Liverpool

65

Southampton

58

Everton

54

Leicester

53

Bournemouth

47

Crystal Palace

46

West Ham

46

Swansea

45

Stoke

45

Watford

42

Norwich

42

Newcastle

41

WBA

38

Sunderland

37

Aston Villa

34

*Aston Villa, Norwich og Newcastle er inkludert i tabellen for 2016/17, siden prognosene over er basert på data fra sesongen 2015/16. 

Sammenligne variasjonen i disse forventede poengsummene med de observerte poengsummene i den tidligere tabellen. Det er åpenlyst at området er mindre. Faktisk er standardavviket omtrent 13 poeng og variansen 170, svært nærme resultatene som vi fikk basert på True Score-teorien.

I en artikkel for Scoreboard Journalism bekrefter Simon Gleave, analysesjef for Gracenote Sports, tilsvarende funn for modellprognoser som han mottok for 2015/16-sesongen av Premier League. Den gjennomsnittlige modellen hadde standardavvik på 15 poeng, mens standardavviket for de faktiske sluttresultatene var 19 poeng. 

Modellenes begrensninger

Siden sluttresultatet i en Premier League-sesong skyldes en kombinasjon av lagets dyktighet og flaks, må vi innse at ingen modeller kan være perfekte og at de alltid vil undervurdere bredden av mulige resultater. Siden flaks ikke kan beregnes på forhånd, bør ingen prognosemodeller inneholde større varians enn de faktiske resultatene gjør. Hvis de gjør det, er det enten noe feil med modellen, eller som Phil Birnbaum sier det, er det"et tegn på at noen prøver å forutsi hvilke lag som kommer til å ha flaks. Og det er umulig." 

Tipperessurser – Bli en bedre spiller

Pinnacles Tipperessurser er en av nettets mest omfattende samlinger av ekspertråd for tipping. Passer for alle erfaringsnivåer, og formålet er ganske enkelt å gi kundene våre støtten de trenger for å bli bedre spillere.