dec 1, 2017
dec 1, 2017

Del två: Finns det någon magisk spelformel?

Att bygga en spelmodell utifrån förväntade mål

Kan man slå spelbolagen med hjälp av förväntade mål?

Vad kan man lära sig av att bygga en modell?

Del två: Finns det någon magisk spelformel?

David Sumpter är professor i tillämpad matematik. I del ett av den här artikeln förklarade han hur man kan bygga en spelmodell baserad på felaktiga odds för kryss. Nu undersöker han om förväntade mål kan användas för att slå spelbolagens odds. Går det? Läs vidare och ta reda på det.

Förväntade mål: En översikt

Fotbollsmodellen som har fått mest uppmärksamhet de senaste åren är utan tvekan den om förväntade mål. Syftet med en modell för förväntat antal mål är helt enkelt att mäta olika målchansers kvalitet.

Om en spelare skjuter precis framför mållinjen har han naturligtvis bättre chans att göra mål än om han skjuter från 30 meter, men hur mycket större är sannolikheten egentligen? Med en modell för förväntade mål kvantifieras det uppenbara. Varje målchans tilldelas en sannolikhet för att bli mål.

Mycket har skrivits om förväntade mål, men den absolut viktigaste aspekten av modellen är var på planen skotten kommer ifrån.

Lägg märke till ballongerna utanför målet i bilden nedan. De representerar sannolikheterna för att skott som kommer från respektive ballong ska resultera i mål. Skott som kommer från ännu längre distans än den yttersta ballongen går i mål i cirka 3 % av fallen.

magic-formula-part-two-in-article-1.jpg

Utifrån denna information kan du skapa en egen modell för förväntade mål. Det kan du till exempel göra medan du ser ditt favoritlag spela match. Räkna helt enkelt antalet skott som kommer från varje ballong.

Om laget sköt två gånger i 30 %-ballongen, en gång i 15 %-ballongen, fem gånger i 7 %-ballongen och tio gånger utanför ballongerna är lagets förväntade antal mål:

2×0,30 + 1×0,15 + 5×0,07 + 10×0,03 = 0,855 xG

Min egen modell är lite mer komplex än så. Jag tar även hänsyn till andra faktorer som till exempel huruvida ett skott görs på kontring eller nick, om det är en fantastisk målchans plus några andra faktorer. Innan du lägger till sådana faktorer till din modell är det bäst att börja med att bara anteckna varifrån skotten kommer.

Förväntade mål: Kan en sådan modell slå fotbollsoddsen?

För varje ny spelmodell blir den naturliga frågan: kan den slå oddsen? Som jag skrev i del ett är jag skeptisk till att det finns någon magisk formel som garanterat fungerar. Men hur är det med en modell för förväntat antal mål? Kan en sådan modell slå fotbollsoddsen?

För att besvara den frågan måste man först börja med att titta på fotbollsoddsen. När jag vill undersöka om jag kan hitta skevheter bland fotbollsoddsen börjar jag vanligtvis med en statistisk modell som kallas logistisk regression.

magic-formula-part-two-in-article-2.jpg

Tanken bakom regression är att ta reda på hur väl fotbollsoddsen förutsäger matchresultatet. Ponera att vi tittar på sannolikheten för bortaseger i en fotbollsmatch.

För att göra det anpassar vi modellen till sannolikheten för bortaseger – a representerar spelbolagets odds för bortaseger (i decimalt oddsformat med fråndragen spelbolagsmarginal) och är en konstant. Om du inte är bekant med logistisk regression finns det gott om onlineguider att ta hjälp av.

Exempel på logistisk regression

Nedan följer ett exempel på en logistisk regression för de två senaste Premier League-säsongerna (2015/16 och 2016/17).

magic-formula-part-two-in-article-3.jpg

Storleken på prickarna är proportionella till antalet gånger motsvarande odds erbjöds. Ju större en prick är desto vanligare är just det oddset.

De viktigaste lärdomarna att dra är inte modellens spelförslag utan själva metoden. Om du vill bygga en modell och vinna pengar på fotboll bör du alltid börja med oddsen.

Om dessa cirklar ligger under den prickade linjen var sannolikheten för en bortaseger mindre än oddsen förutspådde. Om cirklarna ligger över linjen var sannolikheten för en bortaseger större än oddsen förutspådde.

Den fasta linjen är den viktigaste datapunkten. Den förmedlar nämligen den övergripande trenden. Om du tittar noga på kurvan för förutspådda sannolikheter som ligger omkring 0,1 (motsvarande odds på cirka 10,0) ser du att kurvan ligger något över linjen, medan motsatt gäller för förutspådda sannolikheter på över 0,25.

Enligt dessa data har favoriterna förlorat både hemma och borta oftare än spelbolagsoddsen motsvarade.

Underskattning av underdogs och överskattning av favoriter

Med hjälp av data från de två senaste säsongerna kan man eventuellt förutsäga vilka underdogs som kommer att vinna på bortaplan och vilka favoriter som inte kommer att vinna. Det är här som förväntade mål kommer in i bilden. Jag gjorde en ny logistisk regression som ser ut så här:

magic-formula-part-two-in-article-4.jpg

Jag har nu lagt till variabeln xGDiff. Denna variabel är den förväntade målskillnaden mellan de två lagen. Den beräknas genom att titta på lagens genomsnittliga förväntade mål under de fem senaste matcherna: 

magic-formula-part-two-in-article-5.jpg

Genom att utföra denna logistiska regression fann jag att lag som spelade bortamatch med en mer fördelaktig xGDiff-skillnad hade större chans att vinna än vad oddsen motsvarade.

Om man kan hitta en underdog med starkt xG-värde som ska spela bortamatch kan det alltså vara läge att satsa på bortaseger. När favoriter med svagt xG-värde ska spela bortamatch bör du däremot inte spela på bortaseger. 

Logistisk regression: Införlivning av förväntade mål

Nedan följer en tabell över förväntat antal mål för den aktuella säsongen (2017/18) beräknad vecka 11. 

Förväntad Premier League-tabell 2017/18 (beräknad vecka 11)

Lag

xVinster

xOavgjorda

xFörluster

xGjorda mål

xInsläppta mål

xPoäng

Manchester City

8

2

1

25,9

6

26

Liverpool

6,2

2

2,8

20,3

11,6

20,6

Tottenham Hotspur

5,7

3

2,2

15,2

7,6

20,1

Manchester United

5,8

2,3

2,9

19,4

10,7

19,7

Arsenal

5,8

2,1

3,2

18,9

12,5

19,5

Leicester City

5,5

2,5

3

17,3

12,3

19

Chelsea

4,2

3,2

3,6

11,9

10,9

15,8

Southampton

4,2

2,9

3,9

13,1

12,4

15,5

Watford

3,9

2,9

4,3

14,8

16,3

14,6

Crystal Palace

4

2,5

4,4

12,3

15,1

14,5

Everton

3,5

3,1

4,4

11,9

14,5

13,6

Newcastle

3,5

2,7

3,8

11

11,4

13,2

Brighton & Hove Albion

3,2

3

4,9

9,1

13

12,6

West Bromwich

2,8

3,6

4,6

8,3

12,7

12

Swansea City

2,7

3

5,2

8,6

14,8

11,1

Stoke City

2,7

2,9

5,4

11

17,6

11

West Ham United

2,5

3,1

5,3

8,6

14,9

10,6

Huddersfield Town

2,3

3,6

5,1

6,5

13

10,5

Bournemouth

2,3

2,8

5,9

7,6

15,5

9,7

Burnley

1,9

2,9

5,2

5,5

14,3

8,6

Här kan vi testa modellen med hjälp av matchen mellan West Bromwich och Chelsea. xGDiff-värdet för dessa lag är: 

(8,3+11,9 - 12,7-11,9)/2 = -2,7

Per match motsvarar detta -0,25. Chelsea var favorit med odds på a=1,62* när den här artikeln skrevs. När man införlivar dessa odds och xGDiff till ekvation (2) blir P(bortaseger)=42 %. Parametrarna b0=-0,49 b=0,75 och b2=0,73 har hämtats från tidigare säsongers data. 

Enligt oddsen har alltså Chelsea 62 % chans att vinna, men modellen tyder på att sannolikheten är mycket lägre än så. Det smartaste vore att spela på att Chelsea inte vinner.

Med en modell för förväntade mål kvantifieras det uppenbara. Varje målchans tilldelas en sannolikhet för att bli mål.

En annan match som sticker ut i ovanstående tabell är Southampton borta mot Liverpool. XGDiff för dessa lag är 0,36 i Liverpools favör vilket innebär att Liverpool är favorit. Men oddset för Southampton-seger är 8,3 vilket motsvarar en segersannolikhet på 12 %. 

Min modell ger dem 15 % chans att vinna. Alltså kan det vara en god idé att spela på Southampton-seger, men kom ihåg att även om modellen är korrekt kommer du bara att vinna i 15 % av fallen.

Lärdomar från modellen 

De viktigaste lärdomarna att dra är inte modellens spelförslag (både WBA och Southampton förlorade) utan själva metoden. Om du vill bygga en modell och vinna pengar på fotboll bör du alltid börja med oddsen.

Använd dig först av logistisk regression för att identifiera inkonsekvenser i oddsen. Lägg sedan till variabler (som till exempel förväntade mål) för att hitta positiva väntevärden. De positiva väntevärdena kommer att vara små, men de kan betala sig väl på lång sikt.

Om du vill lära dig mer om David Sumpters alster kan du följa @Soccermatics på Twitter.

Oddsresurser: Bli en bättre spelare

Pinnacles avdelning Oddsresurser är en av nätets mest omfattande artikelsamlingar med spelråd från experter. Vi tillgodoser behoven hos både nybörjare och proffs – vårt mål är helt enkelt att öka våra spelares kunskaper.