close
syys 5, 2017
syys 5, 2017

Erilaisten odotetun maalimäärän mallien analyysi

Kuinka voi laskea odotetun maalimäärän?

Minkälaisia lähestymistapoja odotetun maalimäärän mallinnukseen voi käyttää?

Millainen odotetun maalimäärän malli on tarkin?

Erilaisten odotetun maalimäärän mallien analyysi

Aiemmin vain pienen urheiludatayhteisön käyttämä odotetun maalimäärän mittari on nyt samassa sarjassa muiden jalkapallotilastojen kanssa, kuten pallonhallintaprosentti, laukaukset maalia kohti ja rikkeiden määrä. Odotetun maalimäärän arviointiin voi kuitenkin käyttää monia eri lähestymistapoja. Tässä artikkelissa tarkastellaan erilaisia käytettyjä malleja sekä sitä, miten ne tuottavat erilaisia tuloksia.

Jalkapallossa on tarkoituksena saada maali vastustajaa vastaan päästämättä itse maalia. Kuulostaa yksinkertaiselta, mutta sellaiset asiat kuin satunnaisuus ja tuuri aiheuttavat sen, että joukkueet eivät aina saa ”ansaitsemiaan” tuloksia.

Tämän vuoksi data-analyysi ja vaikkapa odotetun maalimäärän kaltaiset luvut ovat hyödyllisiä urheiluvedonlyönnissä – voimme tutkia suorituksia analyyttisemmin ja selvittää sellaisten väitteiden todenperäisyyden kuin ”oli huonoa tuuria, että he eivät voittaneet”.

Koska laukaus on tärkein asia maalin syntymisen kannalta, laukaustilastot ovat olennaisia kaikissa odotetun maalimäärän malleissa.

Odotettu maalimäärä (usein lyhennetään xG – expected goals) on data-analyysin muoto, jota jalkapallojoukkueet käyttävät ja joka on tullut yhä suositummaksi myös vedonlyöjien keskuudessa. Odotetun maalimäärän tilastoja on helposti saatavilla verkosta, mutta ne voivat poiketa toisistaan, koska niiden laskemiseen käytetään erilaisia malleja.

Mallit voivat vaihdella yksinkertaisista monimutkaisiin, ja seuraavassa on kuvattu, miten eri odotetun maalimäärän mallit toimivat. Mitä mekanismeja näiden eri mallien taustalla sitten on ja miten paljon niiden tuottamat tulokset eroavat toisistaan?

Tavallisten laukaustilastojen käyttäminen

Andrew Beasley on selittänyt aiemmin, kuinka lasketaan odotettu maalimäärä käyttämällä tavallisten laukaustilastojen mallia. Koska laukaus on tärkein asia maalin syntymisen kannalta, laukaustilastot ovat olennaisia kaikissa odotetun maalimäärän malleissa. Jalkapallo-ottelussa on lukemattomia tapahtumia, jotka edesauttavat maalin syntymistä, mutta kun sitä pyritään ennustamaan, laukaukset ovat epäilemättä kaikkein tärkein asia.

heat-map-inarticle.jpg

Tämä on yksinkertainen lähestymistapa, jossa hyödynnetään tilastotietoa ”hyvistä paikoista” – Optan määritelmän mukaan tilanteita, jossa pelaajan voi hyvällä syyllä odottaa tekevän maalin – sekä laukauksia rangaistusalueen sisä- ja ulkopuolelta.

Edellisten viiden kauden maalintekoprosenttien mukaan hyvän paikan xG-arvo on 0,387 (38,7 %:n todennäköisyys tehdä maali). Laukauksilla rangaistusalueen sisältä xG-arvo on 0,070 ja laukauksilla rangaistusalueen ulkopuolelta se on 0,036.

Laukaustietojen yksityiskohtainen analyysi

Kun otetaan huomioon jalkapallokentän koko, eri laukaisukulmat sekä näiden vaikutus maalin todennäköisyyteen, odotetun maalimäärän lukemaan vaikuttaa se, analysoiko malli laukauskohdan tarkemmin. 

grid-inarticle.jpg

Vaikka tämä malli on samankaltainen kuin Andrew Beasleyn odotetun maalimäärän perusmalli, tässä lähestymistavassa analysoidaan laukauksen xG-arvoa varten tarkemmin, mistä kohtaa laukaus lähtee. Helpoin tapa tehdä tämä on jakaa maalilaukausten kannalta olennainen alue ruudukoksi ja kuvata kukin laukaus tälle ruudukolle.

Tällaisesta mallista on etuna, että se ottaa huomioon eron siinä, kun pelaaja laukoo suoraan maalin edestä (erittäin todennäköinen maali), ja siinä, kun pelaaja laukoo tiukasta kulmasta (paljon epätodennäköisempi maali). Lisäksi malli ottaa huomioon, onko laukaus tehty päällä (vaikeampaa tehdä maali) vai jalalla (helpompaa tehdä maali).

Paul Rileyn malli on hyvä esimerkki hieman kehittyneemmästä tavasta analysoida laukausten sijaintitietoja xG-mallin muodostamisessa.

Hyökkäysprosessin ottaminen huomioon

Tietenkään maaliyrityksen onnistumistodennäköisyyttä eivät määrää pelkästään laukauksen lähtöpaikka ja ruumiinjäsen, jolla laukaus suoritetaan. Laukausta edeltävä pelin kulku vaikuttaa maalipaikan laatuun.

Sen sijaan, että laukaukselle määritetään xG-arvo sen perusteella, mistä se on laukaistu, joissakin malleissa tarkastellaan, kuinka laukausmahdollisuus on luotu (keskitys, läpisyöttö, vastahyökkäys jne.) ja analysoidaan tarkemmin, kuinka laukaus on suoritettu (laukaus onnistuneen kuljetuksen jälkeen, torjunnan jälkeinen paluupallo jne.).

pass-inarticle.jpg

Tietenkin tällaisen mallin koostamiseen ja ylläpitoon tarvitaan paljon enemmän tilastotietoja. 11tegen11:n xG-malli on esimerkki odotetun maalimäärän mallista, jossa otetaan huomioon hyökkäysprosessi laajemmin, kun laukauksille määritetään xG-arvo.

Puolustuksen vaikutus xG-malliin

Kaikki kolme edellistä odotetun maalimäärän mallinnustapaa antavat hyvän arvion siitä, kuinka monta maalia joukkueen voi odottaa tekevän ottelussa tai koko kauden aikana. On kuitenkin muitakin muuttujia, jotka vaikuttavat maalintekomahdollisuuteen.

Sen sijaan, että laukaukselle määritetään xG-arvo sen perusteella, mistä se on laukaistu, joissakin malleissa tarkastellaan, kuinka laukausmahdollisuus on luotu ja analysoidaan tarkemmin, kuinka laukaus on suoritettu.

Jalkapallo ei ole pelkää hyökkäämistä. Puolustuksen sijoittuminen ja vastustajan maalintekomahdollisuuden pienentäminen on aivan yhtä tärkeää – puolustajat voivat pakottaa pelaajan laukomaan eri tavalla tai tekemään viime hetken muutoksia niin, että maalinteko vaikeutuu.

Sen lisäksi, että analysoidaan koko hyökkäysprosessi – maalipaikan luontitavasta siihen, mistä laukaus lopulta lähtee – odotetun maalimäärän mallinnus voidaan viedä vielä yksityiskohtaisemmaksi lisäämällä yhtälöön vastustajan puolustajien läheisyys ja sen vaikutus laukauksen laatuun.

Kun otetaan huomioon maalivahdin ja puolustajien sijoittuminen suhteessa laukaisupaikkaan, voidaan ehkä saada kaikista tarkin odotetun maalimäärän arvo.

Millainen odotetun maalimäärän malli on tarkin?

Nyt kun tiedämme, miten eri odotetun maalimäärän mallit toimivat, voimme alkaa analysoida, mikä menetelmä tuottaa tarkimmat tulokset. Seuraavassa taulukossa vertaillaan kunkin joukkueen todellista maalieroa Valioliiga-kaudella 2016/17 sekä odotettua maalimäärää käyttäen edellä mainittuja odotetun maalimäärän malleja.

Toteutunut maaliero verrattuna odotettuun maalieroon

Joukkue

Toteutunut maaliero

Mallin 1 xG-ero

Erotus

Mallin 2 xG-ero

Erotus

Mallin 3 xG-ero

Erotus

Arsenal

+33

+12.5

-20.5

+17

-16

+15.39

-17.61

Bournemouth

-12

-6.80

+5.20

-15

-3

-13.76

-1.76

Hull City

-43

-33.80

+9.20

-35

+8

-38.88

+4.12

Burnley

-16

-19.20

-3.20

-26

-10

-21.06

-5.06

Chelsea

+52

+25.90

-26.10

+31

-21

+31.91

-20.09

Crystal Palace

-13

-1.50

+11.50

-5

+8

-6.05

+6.95

Everton

+18

+5

-13

+1

-17

+1.82

-16.18

Sunderland

-40

-27.40

+12.60

-26

+14

-30.56

+9.44

Leicester City

-15

-7.60

+7.40

-7

+8

-6.65

+8.35

Liverpool

+36

+25.30

-10.7

+33

-3

+31.87

-4.13

Manchester City

+41

+41.80

+0.80

+44

+3

+51.13

+10.13

Manchester United

+25

+25

0

+24

-1

+29.48

+4.48

Middlesbrough

-26

-21

+5

-25

+1

-22.46

+3.54

Southampton

-7

+6.60

+13.60

+8

+15

+8.15

+15.15

Stoke City

-15

-0.60

+14.40

-2

+13

+0.45

+15.45

Swansea City

-25

-21.70

+3.30

-20

+5

-27.34

-2.34

Tottenham Hotspur

+60

+32.50

-27.50

+30

-30

+31.04

-28.96

Watford

-28

-12.20

+15.80

-13

+15

-16.14

+11.86

West Bromwich

-8

-11.80

-3.80

-7

+1

-8.52

-0,52

West Ham United

-17

-11.10

+5.90

-7

+10

-9.83

+7.17

Paras tapa arvioida kunkin lähestymistavan tarkkuutta on selvittää erotusten neliöllinen keskiarvo (RMSD eli root-mean-square deviation tai RMSE eli root-mean-square error). Tämä tehdään korottamalla kunkin joukkueen toteutuneen ja odotetun maalimäärän välinen erotus toiseen potenssiin, laskemalla keskiarvo ja ottamalla tästä keskiarvosta sitten neliöjuuri.

Odotetun maalimäärän mallin tarkkuus

Mallin 1 xG-ero

Mallin 2 xG-ero

Mallin 3 xG-ero

RMSD

12.92

12.55

12.01

Kuten voidaan nähdä, kolme menetelmää ovat tuottaneet hyvin samankaltaiset odotetun maalimäärän tulokset Valioliiga-kaudelle 2016/17 – menetelmien RMSD-luvuissa on eroa vain 0,91, vaikka käytettyjen tilastotietojen yksityiskohtaisuustasot ovat erilaiset.

Yksi kausi (380 ottelua) ei ole kuitenkaan riittävän suuri otoskoko, jotta voitaisiin minkäänlaisella varmuudella sanoa jonkin lähestymistavan olevan toista parempi. Lisäksi RMSD:n laskeminen pelikohtaisesti antaa todennäköisemmin hyödyllistä tietoa kunkin mallin tarkkuudesta sekä siitä, miten lähelle ne kykenevät ennustamaan ottelun odotetun maalimäärän.

Haluatko lukea lisää odotetusta maalimäärästä?

Jos haluat tietää lisää odotetusta maalimäärästä ja hyödyntää sitä vedonlyönnissä, lue Andrew Beasleyn kirjoitus siitä, miten tätä lukua voi hyödyntää Valioliiga-vedonlyönnissä.

Voit myös seurata Paul Rileytä ja 11tegen11:ä Twitterissä sekä osallistua Pinnaclen odotetun maalimäärän keskustelupäivään 9.10.2017.

discussion-day-expected-goals-inarticle.jpg

Vedonlyöntiresurssit auttavat vedonlyönnissä

Pinnaclen Vedonlyöntiresurssit-osio on yksi netin kattavimmista asiantuntevan vedonlyöntineuvonnan kokoelmista. Tavoitteenamme on auttaa kaikentasoisia vedonlyöjiä parantamaan tietämystään.