jan 14, 2016
jan 14, 2016

Regresjon mot gjennomsnittet innen sportstipping

Regresjon mot gjennomsnittet innen sportstipping
Siden prognosesystemer stort sett baserer seg på historisk ytelse, er det svært viktig for tippere å forstå regresjon mot gjennomsnittet. Den engelske Premier League-sesongen 2015–2016 har vært full av overraskelser, og det er naturlig å lure på om de ekstreme resultatene vil vedvare. Dette er hva statistikken har å si om saken.

Når man har med tilfeldige eller nesten tilfeldige systemer å gjøre, har variabler som viser ekstreme verdier i første måling en tendens til å være mindre ekstreme ved andre måling. Dette fenomenet kalles regresjon mot gjennomsnittet.

For eksempel kan Leicesters prestasjoner i første halvdel av Premier League-sesongen 2015–2016 gi dem en høyere lagrating enn Chelsea, som har prestert mye dårligere sammenlignet med forventningene i samme periode. Men hvis mye av denne forskjellen er basert på tilfeldige faktorer, antyder teorien om regresjon til gjennomsnittet at disse resultatene ikke vil vedvare på sikt.

Måle lagenes prestasjoner

En måte å måle prestasjonene til et lag på, er å se hvordan de har prestert sammenlignet med markedets forventninger. Hvis for eksempel oddsen for at et lag skal vinne er 2,00, betyr dette at markedet tror det er 50 % sjanse for at de vinner (hvis vi ser bort fra effekten av bookmakerens margin). Hvis laget vinner, har prestasjonen deres overgått markedets forventninger; hvis de ikke vinner, har de prestert dårligere.

Når man har med tilfeldige systemer å gjøre, har variabler som viser ekstreme verdier i første måling en tendens til å være mindre ekstreme ved andre måling.

Denne tilnærmingen minner kvalitativt sett om Briers resultatmetode, som måler hvor mye et lags resultater avviker fra hva oddsen antyder. Den viktigste forskjellen er at den lar oss måle både størrelsesordenen og retningen for avviket fra forventningene.

La oss se hvordan Leicester og Chelsea har prestert sammenlignet med forventningene til Pinnacle, for de første 20 kampene i Premier League-sesong 2015–2016. Hver kamp et lag vinner, gir en risikojustert poengsum tilsvarende [1 – 1/odds], og hver gang de ikke vinner, får de en poengsum tilsvarende [-1/odds].

Disse resultatene oppsummeres løpende under hele sesongen. Tabellene nedenfor viser at Leicester har prestert mye bedre enn tippemarkedet til Pinnacle har forventet, mens Chelsea har klart seg mye dårligere.

Første 20 kamper for Chelsea

Motstander Dato Pinnacle-odds Resultat Gevinst/tap Sammenlagt gevinst/tap
Swansea 08.08.15 1,39 Ikke seier -0,72 -0,72
Man City 16.08.15 3,87 Ikke seier -0,26 -0,98
WBA 23.08.15 1,65 Seier 0,39 -0,58
Crystal Palace 29.08.15 1,37 Ikke seier -0,73 -1,31
Everton 12.09.15 2,01 Ikke seier -0,50 -1,81
Arsenal 19.09.15 2,45 Seier 0,59 -1,22
Newcastle 26.09.15 1,63 Ikke seier -0,61 -1,83
Southampton 03.10.15 1,83 Ikke seier -0,55 -2,38
Aston Villa 17.10.15 1,34 Seier 0,25 -2,13
West Ham 24.10.15 2,01 Ikke seier -0,50 -2,62
Liverpool 31.10.15 2,07 Ikke seier -0,48 -3,11
Stoke 07.11.15 2,07 Ikke seier -0,48 -3,59
Norwich 21.11.15 1,43 Seier 0,30 -3,29
Tottenham 29.11.15 2,89 Ikke seier -0,35 -3,63
Bournemouth 05.12.15 1,38 Ikke seier -0,72 -4,36
Leicester 14.12.15 2,38 Ikke seier -0,42 -4,78
Sunderland 19.12.15 1,32 Seier 0,24 -4,54
Watford 26.12.15 1,52 Ikke seier -0,66 -5,19
Man United 28.12.15 2,95 Ikke seier -0,34 -5,53
Crystal Palace 03.01.16 2,07 Seier 0,52 -5,02

Første 20 kamper for Leicester

Motstander Dato Pinancle Sports-odds Resultat Gevinst/tap Sammenlagt gevinst/tap
Sunderland 08.08.15 1,99 Seier 0,50 0,50
West Ham 15.08.15 3,42 Seier 0,71 1,21
Tottenham 22.08.15 2,69 Ikke seier -0,37 0,83
Bournemouth 29.08.15 3,57 Ikke seier -0,28 0,55
Aston Villa 13.09.15 1,86 Seier 0,46 1,02
Stoke 19.09.15 3,10 Ikke seier -0,32 0,69
Arsenal 26.09.15 4,55 Ikke seier -0,22 0,47
Norwich 03.10.15 3,31 Seier 0,70 1,17
Southampton 17.10.15 5,10 Ikke seier -0,20 0,98
Crystal Palace 24.10.15 2,21 Seier 0,55 1,52
WBA 31.10.15 2,70 Seier 0,63 2,15
Watford 07.11.15 1,88 Seier 0,47 2,62
Newcastle 21.11.15 2,58 Seier 0,61 3,23
Man United 28.11.15 3,26 Ikke seier -0,31 2,93
Swansea 05.12.15 2,80 Seier 0,64 3,57
Chelsea 14.12.15 3,11 Seier 0,68 4,25
Everton 19.12.15 3,65 Seier 0,73 4,97
Liverpool 26.12.15 4,00 Ikke seier -0,25 4,72
Man City 29.12.15 4,25 Ikke seier -0,24 4,49
Bournemouth 02.01.16 1,94 Ikke seier -0,52 3,97

Hvor mye av resultatene skyldes flaks?

Det neste blir å spørre seg om hvorvidt Leicesters gode prestasjoner og Chelseas dårlige prestasjoner sammenlignet med markedets forventninger vil fortsette. Hvis disse trendene i hovedsak er et resultat av vanlige faktorer som spillernes egenskaper og trenerens dyktighet, kan man forvente liten grad av regresjon til markedets forventninger, i det minste før markedet rekker å endre oppfatning om lagenes nye prestasjonsnivåer. Men hvis resultatene stort sett skyldes flaks, vil regresjonen mot gjennomsnittet være raskere og større.

For å finne ut i hvilken grad regresjonen mot gjennomsnittet, i denne sammenheng flaks og tilfeldighet, påvirker resultatet av fotballkamper, deler vi dataene våre inn i to sett: første og andre halvdel av sesongen. Deretter sammenligner vi de to settene. Hvis det er lite regresjon mot gjennomsnittet, kan vi forvente at ekstreme resultater i første halvdel av sesongen vil matches av tilsvarende ekstreme resultater i andre halvdel.

Med andre ord vil prestasjonene vedvare. Hvis det er mye regresjon mot gjennomsnittet, vil ekstreme resultater i første halvdel ikke matches i nevneverdig grad av ekstreme resultater i andre halvdel.

Tabellen nedenfor viser denne korrelasjonen for engelske fotballag i Premier League og Football League i sesongene 2012–2013 og 2014–2015. Hvert av de 276 datapunktene viser et prestasjonspar for første og andre halvdel for hvert av lagene i én enkel sesong. Den mørke linjen viser gjennomsnittlig trend for datapunktene. 

Korrelasjon for ytelsen i 1. og 2. halvdel av sesongen

regression-to-mean-betting-table.jpg

Som du ser, er det omtrent ingen korrelasjon, og vi ser en omtrent fullstendig regresjon til gjennomsnittet. I en korrelasjonsgraf som dette viser verdien til R2 i hvilken grad variabiliteten i én variabel forklarer variabiliteten i den andre variabelen.

Tallet 1 betyr perfekt korrelasjon, mens tallet 0 betyr ingen som helst korrelasjon. Her ser vi at variabiliteten i resultatene fra første halvdel av sesongen nesten ikke har noen effekt på variabiliteten i andre halvdel av sesongen. Dette antyder at det ikke finnes noen årsakssammenheng mellom de to, og at avvik fra markedets forventning stort sett skyldes flaks.

De 20 lagene som presterte dårligst i forhold til forventningene, hadde resultatet -4,05 i gjennomsnitt for første halvdel av sesongen. Dette gikk tilbake til -1,01 i snitt for resultatene i andre halvdel, og bare ett lag presterte dårligere. På den annen side hadde de 20 lagene som gjorde det best i forhold til forventningene +3,71 i snitt for resultatene i første halvdel. Dette gikk tilbake til +0,13 i andre halvdel. Igjen var det bare ett lag som hadde mer ekstreme resultater i andre halvdel enn i første.

Det er mulig at en hel sesong er en for lang tidsperiode å bruke når vi skal evaluere lagenes resultater. Mye kan skje på 38 kamper (eller 46, for Football League), og det er nok ønsketenkning å forvente at resultatene i første halvdel av en sesong vedvarer inn i andre halvdel.

I tillegg kan man gjette at hvis et lag virkelig har blitt bedre, vil tippemarkedet reagere på dette. Oddsen ville derfor endret seg tilsvarende inn i andre halvdel, slik at eventuelle fremtidige avvik fra gjennomsnittet ville krympe uansett, uavhengig av tilfeldige prosesser. 

Man kan anta at denne effekten kan reduseres ved å se på et mindre utvalg kamper, for eksempel 12 kamper. Og mange kvantitative prognosesystemer bruker faktisk slike korte perioder når de beregner indikatorer på resultatene i fremtidige kamper.

Dessverre er det like svak korrelasjon mellom resultatene i de første seks og neste seks kampene. I sammenlagt 1596 forskjellige korrelasjonspar ser vi igjen at R2 er 0,00 for to relaterte tall. Selv for et utvalg med bare 12 kamper ser det ut til at hvor godt et fotballag presterer sammenlignet med markedets forventninger nesten bare er flaks.

Tippemarkedets visdom

Hvis vi tenker over hva et tippemarked, for eksempel markedet som Pinnacle tilbyr, egentlig står for, er det lett å forstå hvorfor flaks er en så viktig faktor i resultatene når man tipper på fotball. Vi sier ikke at resultatet av kampen bare er flaks eller tilfeldighet. Lag som Arsenal, Manchester City og Chelsea gjør det helt klart (i det minste mesteparten av tiden) mye bedre enn lag som Norwich, Sunderland og Bournemouth. Det er fordi de overlegne egenskapene deres gjør det mer sannsynlig at de vil vinne. 

Det vi sier er heller at tippemarkedet tar med disse variasjonene i lagenes egenskaper i beregningen, ved å justere oddsene. Lag som regnes for å ha større vinnersjanse er som oftest mer populære valg når man tipper. Derfor blir oddsene deres lavere. Oddsen er i praksis et system for handikap, ved at de utjevner forskjellen i lagenes egenskaper. Denne prosessen gjør at resultatene stort sett skyldes flaks.

Når en gruppe spillere gir sin mening ved å plassere innsatsene sine der de tror det er størst vinnersjanse, gir dette ofte en meget nøyaktig evaluering av hvor sannsynlig det resultatet er. Denne prosessen tilsvarer markedsklarering, der etterspørselen fra kjøpere balanseres ut med tilbud fra selgere. Dette fenomenet kalles forståelig nok markedets visdom.

Pinnacle er kjent for å ha noen av de beste og smarteste tippemarkedene som finnes. Dette er en av grunnene til at de kan tilby de beste prisene og de laveste marginene. Men tippemarkeder er ikke alltid hundre prosent effektive. Dette stemmer ekstra godt rett etter at markedet åpner, da relativt få spillere har gitt sin mening og markedsprisene ofte kan være "feil". 

Det er i denne perioden at de beste spillerne har mulighet til å satse på odds som på sikt viser seg å være bedre enn oddsene som tilbys rett før markedet stenger. Men selv de dyktigste spillerne blir påvirket av flaks på kort sikt. Hvis de forstår konseptet regresjon til gjennomsnittet, bør spillere ha enklere for å forstå effekten av flaks og dyktighet.

Er du klar for å spille på engelsk Premier League? Pinnacle tilbyr omfattende EPL-odds med lav margin i en rekke forskjellige markeder. Registrer en konto her, eller ta en titt på vår informasjonsrike side med artikler om tipping hvis du er nybegynner, der finner du alt du trenger for å komme raskt i gang med spillingen.

strategy-openaccount.jpg 

Tipperessurser – Bli en bedre spiller

Pinnacles Tipperessurser er en av nettets mest omfattende samlinger av ekspertråd for tipping. Passer for alle erfaringsnivåer, og formålet er ganske enkelt å gi kundene våre støtten de trenger for å bli bedre spillere.