close
des 1, 2017
des 1, 2017

Del to: Finnes det en magisk tippeformel?

Slik lager man en tippemodell basert på forventet målantall

Kan man slå bookmakeren med forventet antall mål?

Hvilken lærdom gir det å lage en modell?

Del to: Finnes det en magisk tippeformel?

I del én av denne artikkelen forklarte David Sumpter, professor i matematikk, hvordan man går frem for å bygge en tippemodell basert på underprisede uavgjortresultater. Nå analyserer han hvorvidt forventet antall mål kan brukes til å slå bookmakerens odds. Er det mulig? Les videre for å finne det ut.

Forventet antall mål: En oversikt

Fotballmodellen som har fått mest oppmerksomhet de siste årene, er utvilsomt forventet antall mål. Tanken bak forventet antall mål er enkel: Man måler sjansenes kvalitet.

Det er åpenlyst at hvis spillere skyter fra 5 meter, er målsjansene mye større enn hvis de skyter et langskudd fra 25 meters avstand. Forventet antall mål forvandler intuisjonen til sannsynlighetsberegning. Hver sjanse får tildelt en sannsynlighetsgrad for at det blir mål.

Det finnes masse lesestoff med informasjon om forventet antall mål, men det er ett viktig poeng jeg gjerne vil fremheve: Det absolutt viktigste aspektet ved denne modellen er hvor skuddet tas fra.

Se på ballongene som kommer ut av målet i bildet under. De viser sannsynligheten for skåring hvis det oppstår en sjanse innenfor den ballongen. Utenfor området som diagrammet viser, er sjansen omtrent 3 %.

magic-formula-part-two-in-article-1.jpg

Basert på dette kan du lage din egen modell for forventet antall mål når du ser på kampen. Du trenger bare å telle antall sjanser som oppstår innenfor hver ballong.

Hvis de hadde to sjanser innenfor 30 %-ballongen, én sjanse innenfor 15 %-ballongen, fem sjanser innenfor 7 %-ballongen og ti sjanser utenfor ballongene, finner man forventet antall mål slik:

2×0,30 + 1×0,15 + 5×0,07 + 10×0,03 = 0,855 xG

Modellen for forventet antall mål som jeg har utviklet, er litt mer avansert enn dette. Jeg tar også med i beregningen hvorvidt en sjanse er et motangrep, tas med hodet, er en "stor sjanse" og noen få faktorer til. Dette forbedrer modellen utover å bruke bare skuddplassering, men skuddplassering er alltid det første man skal se på når man lager en modell for forventet antall mål.

Forventet antall mål: Er det mulig å slå fotballoddsene?

Det store spørsmålet for fotballmodeller er ikke hvorvidt de slår oddsene. Som jeg skrev i del én er jeg skeptisk til at det skal finnes en magisk formel for tipping. Så, kan forventet antall mål være løsningen? Er det mulig å slå fotballoddsene?

For å besvare dette spørsmålet må vi først starte med å se på fotballoddsene. Når jeg ønsker å lete etter bias i fotballoddsene, starter jeg som oftest med en statistisk modell som heter logistisk regresjon.

magic-formula-part-two-in-article-2.jpg

Formålet med regresjon er å se hvor gode fotballoddsene er til å forutse kampresultatene. Tenk deg at vi ser på sannsynligheten for borteseier.

For å gjøre dette tilpasser vi modellen til sannsynligheten for å vinne på bortebane, der a er bookmakerens odds for borteseier (i desimaloddsformat, korrigert for å fjerne bookmakerens margin) og er konstant. Hvis du ikke kjenner til logistisk regresjon, finnes det mange nettguider som kan forklare det.

Logistisk regresjon: Et eksempel

Under ser du et eksempel på logistisk regresjon for de to siste sesongene av Premier League (2015/16 og 2016/17).

magic-formula-part-two-in-article-3,jpg

Størrelsen på punktene her er proporsjonal med antall ganger disse oddsene ble tilbudt. Jo større punktene er, desto mer vanlige er akkurat denne oddsen.

Det viktigste er ikke hvilke forslag modellen kommer med, men metoden. Hvis du vil lage en modell og vinne penger ved å tippe på fotball, må du alltid starte med oddsene.

Hvis disse sirklene ligger under den prikkede linjen, betyr det at sannsynligheten for borteseier var lavere enn oddsene antydet. Hvis sirklene ligger over den prikkede linjen, betyr det at sannsynligheten for borteseier var høyere enn oddsene antydet.

Den heltrukne linjen er den som passer best for dataene. Denne linjen viser den generelle trenden. Hvis man ser nøye på kurven for sannsynligheter som er anslått til rundt 0,1, altså tilsvarende odds på rundt 10,0, ser du at kurven ligger litt over linjen, mens trenden er omvendt for sannsynligheter på over 0,25.

Dette viser at de siste to sesongene har outsidere vunnet på bortebane og favoritter tapt på bortebane oftere enn det bookmakernes odds har antydet.

Undervurderte outsidere og overvurderte favoritter

Hvis det er noe verdi å hente fra de siste to sesongene, er det i å anslå hvilke outsidere som vinner på bortebane og hvilke favoritter som taper. Det er her vi kan bruke forventet antall mål. Jeg laget en ny logistisk regresjon på følgende form:

magic-formula-part-two-in-article-4.jpg

Jeg har nå lagt til variabelen xGDiff. Denne variabelen viser forventet måldifferanse for de to lagene, beregnet ved å se på lagenes gjennomsnittlige forventet antall mål for de siste fem kampene: 

magic-formula-part-two-in-article-5.jpg

Ved hjelp av denne logistiske regresjonen fant jeg ut at lag som spilte på bortebane, men hadde mer fordelaktig xGDiff-differanse, hadde større vinnersjanser enn oddsene antydet.

Så hvis vi kan finne en outsider som spiller på bortebane med sterk xG, er det verdt å satse på denne outsideren. Favoritter som spiler på bortebane med svak xG, bør man ikke satse på at vinner. 

Logistisk regresjon: Medregning av forventet antall mål

Under ser du en tabell for forventet målantall for inneværende sesong (2017/18), per uke 11. 

Forventet Premier League-tabell for 2017/18 (per uke 11)

Lag

xSeire

xUavgjort

xTap

xMål for

xMål imot

xPoeng

Manchester City

8

2

1

25,9

6

26

Liverpool

6,2

2

2,8

20,3

11,6

20,6

Tottenham Hotspur

5,7

3

2,2

15,2

7,6

20,1

Manchester United

5,8

2,3

2,9

19,4

10,7

19,7

Arsenal

5,8

2,1

3,2

18,9

12,5

19,5

Leicester City

5,5

2,5

3

17,3

12,3

19

Chelsea

4,2

3,2

3,6

11,9

10,9

15,8

Southampton

4,2

2,9

3,9

13,1

12,4

15,5

Watford

3,9

2,9

4,3

14,8

16,3

14,6

Crystal Palace

4

2,5

4,4

12,3

15,1

14,5

Everton

3,5

3,1

4,4

11,9

14,5

13,6

Newcastle

3,5

2,7

3,8

11

11,4

13,2

Brighton & Hove Albion

3,2

3

4,9

9,1

13

12,6

WBA

2,8

3,6

4,6

8,3

12,7

12

Swansea City

2,7

3

5,2

8,6

14,8

11,1

Stoke City

2,7

2,9

5,4

11

17,6

11

West Ham United

2,5

3,1

5,3

8,6

14,9

10,6

Huddersfield Town

2,3

3,6

5,1

6,5

13

10,5

Bournemouth

2,3

2,8

5,9

7,6

15,5

9,7

Burnley

1,9

2,9

5,2

5,5

14,3

8,6

Her kan vi bruke kampen mellom WBA og Chelsea for å teste modellen. xGDiff for disse lagene er: 

(8,3+11,9 - 12,7-11,9)/2 = -2,7

Per kamp blir dette -0,25. Chelsea var favorittene, med oddsen a=1,62* i skrivende stund. Hvis vi legger inn disse oddsene og xGDiff-en i ligningen (2), får vi P(bortseier)=42 % (med parametrene b0=-0,49b=0,75 og b2=0,73, basert på data fra forrige sesong). 

Oddsene antyder altså at det er 62 % sjanse for at Chelsea vinner, men modellen antyder at sannsynligheten er mye lavere. Mest sannsynligvis kommer ikke Chelsea til å vinne.

Forventet antall mål forvandler intuisjonen til sannsynlighetsberegning. Hver sjanse får tildelt en sannsynlighetsgrad for at det blir mål.

En annen kamp som skiller seg ut i tabellen over, er Southamptons bortekamp mot Liverpool. xGDiff for disse lagene er 0,36 i Liverpools favør, altså er de favorittene. Men oddsene for Southampton-seier er 8,3, noe som antyder en sannsynlighet på 12 % for seier. 

Modellen min gir dem 15 % vinnersjanse. Dette antyder at det kan være lurt å satse på at Southampton vinner, men husk at selv om modellen har rett, vinner du bare 15 % av gangene.

Hva kan vi lære fra modellen? 

Det viktigste er ikke hva modellen antyder (både WBA og Southampton tapte), men hvilken metode som brukes. Hvis du vil lage en modell og vinne penger ved å tippe på fotball, må du alltid starte med oddsene.

Bruk først logistisk regresjon for å finne uregelmessigheter i oddsene, og legg så til variabler (som forventet antall mål) for å se om du kan finne en fordel. Denne fordelen er ikke så stor, men den kan være lønnsom på sikt.

Hvis du vil lære mer om arbeidet til David Sumpter, kan du følge @Soccermatics på Twitter.

Tipperessurser – Bli en bedre spiller

Pinnacles Tipperessurser er en av nettets mest omfattende samlinger av ekspertråd for tipping. Passer for alle erfaringsnivåer, og formålet er ganske enkelt å gi kundene våre støtten de trenger for å bli bedre spillere.