joulu 1, 2017
joulu 1, 2017

Osa kaksi: Onko olemassa taikakaavaa vedonlyöntiin?

Vedonlyöntimallin muodostaminen maalimäärän odotusarvon avulla

Voiko maalimäärän odotusarvo päihittää vedonvälittäjän?

Mitä mallin rakentamisesta voi oppia?

Osa kaksi: Onko olemassa taikakaavaa vedonlyöntiin?

Sovelletun matematiikan professori David Sumpter selitti tämän artikkelin ensimmäisessä osassa vedonlyöntimallin rakentamisen alihinnoiteltujen tasapelien perusteella. Nyt hän analysoi, voiko maalimäärän odotusarvoa käyttää vedonvälittäjien kertoimien päihittämiseen. Onko se mahdollista? Lue lisää tästä.

Maalimäärän odotusarvo: yleiskatsaus

Viime vuosina eniten huomiota saanut jalkapallomalli on epäilemättä ollut maalimäärän odotusarvo. Maalimäärän odotusarvon mallin periaate on yksinkertainen: se mittaa maalipaikkojen laatua.

Tiedämme intuitiivisesti, että jos pelaaja laukaisee 5,5 metrin alueen sisältä, hänen laukauksensa onnistuu todennäköisemmin kuin jos hän pommittaisi 30 metristä. Maalimäärän odotusarvon malli muuntaa intuitiomme todennäköisyyksiksi. Jokaiselle maalipaikalle määritetään maalin syntymisen todennäköisyys.

Saatavilla on runsaasti maalimäärän odotusarvon laskemisen yksityiskohtia selittävää aineistoa, mutta on yksi tärkeä asia, jota haluan korostaa: mallin ehdottomasti tärkein tekijä on se, mistä laukaus lähtee.

Katso alla olevan kuvan maalista lähteviä ilmapalloja. Ne kuvaavat kyseisen ilmapallon alueelta lähtevien laukausten maalin todennäköisyyttä. Kaavion esittämän alueen ulkopuolella todennäköisyys on noin 3 %.

magic-formula-part-two-in-article-1.jpg

Tämän pohjalta voit muodostaa oman maalimäärän odotusarvon mallin joukkueellesi, kun katselet ottelua. Laske vain paikat, jotka joukkueella on ollut kunkin ilmapallon alueelta.

Jos sillä on ollut kaksi paikkaa 30 % ilmapallon alueelta, yksi 15 %:n alueelta, viisi paikkaa 7 %:n ilmapallon alueelta ja kymmenen paikkaa ilmapallojen ulkopuolelta, joukkueen maalimäärän odotusarvo on seuraava:

2 × 0,30 + 1 × 0,15 + 5 × 0,07 + 10 × 0,03 = 0,855 xG

Kehittämäni maalimäärän odotusarvon malli on hieman tätä monimutkaisempi. Lisään siihen, onko kyseessä vastahyökkäys, pusku tai ”hyvä maalipaikka” sekä tiettyjä muita tekijöitä. Nämä parantavat mallia hieman, kun siinä otetaan huomioon muutakin kuin laukaisupaikka, mutta laukaisupaikka on oikea paikka aloittaa maalimäärän odotusarvon mallin luominen.

Maalimäärän odotusarvo: voiko se päihittää jalkapallokertoimet?

Tärkeä kysymys minkä tahansa mallin kohdalla on, voittaako se kertoimet. Kuten kirjoitin osassa yksi, suhtaudun epäilevästi siihen, että olisi olemassa jokin vedonlyönnin taikakaava. Voisiko maalimäärän odotusarvon malli siis tarjota ratkaisun? Voiko se päihittää jalkapallokertoimet?

Saadaksemme vastauksen tähän kysymykseen meidän on tarkasteltava ensin jalkapallokertoimia. Kun haluan nähdä, löydänkö vinoumia jalkapallokertoimista, lähden yleensä liikkeelle logistiseksi regressioksi kutsutusta tilastollisesta mallista.

magic-formula-part-two-in-article-2.jpg

Regression perustana oleva ajatus on tarkasteleminen, kuinka hyvin jalkapallokertoimet ennustavat lopputulosta. Kuvitellaan esimerkiksi, että tutkimme vierasvoiton todennäköisyyttä.

Tätä varten sovitamme mallin vierasvoiton todennäköisyyttä varten, jossa a on vedonvälittäjän kerroin vierasvoitolle (desimaalikerroinmuodossa ja korjattuna vedonvälittäjän katteen poistamiseksi), ja se on vakio. Jos logistinen regressio ei ole sinulle tuttu, voit lukea siitä online-oppaista, joita on tarjolla lukuisia.

Logistinen regressio: esimerkki

Seuraavassa on esimerkki logistisesta regressiosta kahdelta edelliseltä Valioliiga-kaudelta (2015/16 ja 2016/17).

magic-formula-part-two-in-article-3.jpg

Pisteiden koko on tässä suhteessa siihen, kuinka monta kertaa näitä kertoimia tarjottiin. Mitä suurempi piste on, sitä yleisempi kyseinen kerroin on ollut.

Pääasiana tässä eivät ole mallin antamat ehdotukset vaan menetelmä. Jos haluat rakentaa mallin ja voittaa rahaa lyömällä vetoa jalkapallosta, lähde aina liikkeelle kertoimista.

Jos nämä ympyrät ovat pisteviivan alapuolella, vierasvoiton todennäköisyys oli pienempi kuin kertoimen mukainen ennuste. Jos ympyrät ovat pisteviivan yläpuolella, vierasvoiton todennäköisyys oli suurempi kuin kertoimen mukainen ennuste.

Jatkuva viiva on parhaan tietojen mukaisen sopivuuden viiva. Tämä viiva kertoo meille yleistrendin. Jos katsot tarkkaan todennäköisyyskäyrää kohdan 0,1 ympäriltä, mikä vastaa kerrointa 10,0, huomaat, että käyrä on hieman viivan yläpuolella, kun taas kohdassa 0,25 todennäköisyyksien trendi on päinvastainen.

Tästä voimme nähdä, että edellisten kahden kauden aikana altavastaajat ovat voittaneet vieraissa ja suosikit ovat hävinneet vieraissa useammin kuin vedonvälittäjien kertoimien perusteella olisi odottanut.

Aliarvioidut altavastaajat ja yliarvioidut suosikit

Jos edellisten kahden kauden ajalta on löydettävissä arvoa, se löytyy ennustamisesta, mitkä altavastaajat voittavat vieraissa ja mitkä suosikit eivät voita. Tässä voimme käyttää maalimäärän odotusarvoa. Tein uuden logistisen regression seuraavalla kaavalla:

magic-formula-part-two-in-article-4.jpg

Lisäsin nyt muuttujan xGDiff. Tämä muuttuja on kahden joukkueen välisten maalimäärän odotusarvojen ero, joka lasketaan joukkueiden edellisten viiden ottelun maalimäärän odotusarvojen keskiarvoista: 

magic-formula-part-two-in-article-5.jpg

Suorittamalla logistisen regression sain selville, että vieraissa pelaavat joukkueet, joilla oli suosiollisempi xGDiff-ero, voittivat todennäköisemmin kuin kertoimien perusteella olisi olettanut.

Jos siis voimme löytää vieraissa pelaavan altavastaajan, jolla on vahva xG, sen puolesta kannattaa lyödä vetoa. Vieraissa pelaavia suosikkeja, joilla on heikko xG, ei kannata pelata. 

Logistinen regressio: maalimäärän odotusarvon sisällyttäminen

Seuraavassa on maalimäärän odotusarvon taulukko meneillään olevalle kaudelle (2017/18) otteluviikolla 11. 

Valioliigan 2017/18 maalimäärän odotusarvon taulukko (otteluviikolla 11)

Joukkue

xVoitot

xTasapelit

xHäviöt

xTehdyt maalit

xPäästetyt maalit

xPisteet

Manchester City

8

2

1

25.9

6

26

Liverpool

6.2

2

2.8

20.3

11.6

20.6

Tottenham Hotspur

5.7

3

2.2

15.2

7.6

20.1

Manchester United

5.8

2.3

2.9

19.4

10.7

19.7

Arsenal

5.8

2.1

3.2

18.9

12.5

19.5

Leicester City

5.5

2,5

3

17.3

12.3

19

Chelsea

4.2

3.2

3.6

11.9

10.9

15.8

Southampton

4.2

2.9

3.9

13.1

12.4

15.5

Watford

3.9

2.9

4.3

14.8

16.3

14.6

Crystal Palace

4

2,5

4.4

12.3

15.1

14.5

Everton

3.5

3.1

4.4

11.9

14.5

13.6

Newcastle

3.5

2.7

3.8

11

11.4

13.2

Brighton and Hove Albion

3.2

3

4.9

9.1

13

12.6

West Bromwich

2.8

3.6

4.6

8.3

12.7

12

Swansea City

2.7

3

5.2

8.6

14.8

11.1

Stoke City

2.7

2.9

5.4

11

17.6

11

West Ham United

2,5

3.1

5.3

8.6

14.9

10.6

Huddersfield Town

2.3

3.6

5.1

6.5

13

10.5

Bournemouth

2.3

2.8

5.9

7.6

15.5

9.7

Burnley

1.9

2.9

5.2

5.5

14.3

8.6

Tässä voimme käyttää West Bromwichin ja Chelsean välistä ottelua mallin testaamiseen. Näiden joukkueiden xGDiff-arvo on seuraava: 

(8.3+11.9 - 12.7-11.9)/2 = -2.7

Ottelua kohden tämä tekee -0,25. Chelsea oli tämän artikkelin kirjoitushetkellä suosikki kertoimella a = 1,62*. Lisäämällä nämä kertoimet ja xGDiff-arvon yhtälöön (2) saamme P(vierasvoitto) = 42 % (parametreilla b0 = -0,49, b = 0,75 ja b2 = 0,73, jotka on saatu edellisen kauden tiedoista). 

Vaikka kertoimien perusteella Chelsean voittotodennäköisyys olisi 62 %, se on mallin mukaan paljon pienempi. Paras veto on, että Chelsea ei voita.

Maalimäärän odotusarvon malli muuntaa intuitiomme todennäköisyyksiksi. Jokaiselle maalipaikalle määritetään maalin syntymisen todennäköisyys.

Toinen yllä olevasta taulukosta erottuva kohde on Southampton Liverpoolin vieraana. Näiden joukkueiden xGDiff-arvo on 0,36 Liverpoolin eduksi, eli Liverpool on suosikki. Southamptonin voiton kerroin on kuitenkin 8,3, mikä vastaa 12 %:n todennäköisyyttä. 

Mallini antaa joukkueen voittotodennäköisyydeksi 15 %. Tämän perusteella veto Southamptonin voiton puolesta olisi kannattava, mutta kannattaa muistaa, että vaikka malli olisi oikeassa, voitat vain 15 % kerroista.

Mallista opittuja asioita 

Pääasiana tässä eivät ole mallin antamat ehdotukset (sekä West Bromwich että Southampton hävisivät) vaan menetelmä. Jos haluat rakentaa mallin ja voittaa rahaa lyömällä vetoa jalkapallosta, lähde aina liikkeelle kertoimista.

Etsi ensin logistisen regression avulla epäjohdonmukaisuuksia kertoimista ja lisää sitten muuttujat (kuten maalimäärän odotusarvo) nähdäksesi, saatko edun vedonvälittäjään nähden. Tämä etu tulee olemaan pieni, mutta se voi hyvinkin olla pitkällä aikavälillä arvokas.

Jos haluat lukea lisää David Sumpterin työstä, seuraa tunnusta @Soccermatics Twitterissä.

Vedonlyöntiresurssit auttavat vedonlyönnissä

Pinnaclen Vedonlyöntiresurssit-osio on yksi netin kattavimmista asiantuntevan vedonlyöntineuvonnan kokoelmista. Tavoitteenamme on auttaa kaikentasoisia vedonlyöjiä parantamaan tietämystään.