touko 13, 2020
touko 13, 2020

Tutustumme taas satunnaisuuteen ja tehokkuuteen jalkapallovedonlyönnissä

Miltä tehokkuus näyttää?

Satunnaisuuden ja tehokkuuden ymmärtäminen

Vielä on opittavaa

Tutustumme taas satunnaisuuteen ja tehokkuuteen jalkapallovedonlyönnissä

Joseph Buchdahl on julkaissut lukuisia opintomateriaaleja satunnaisuuden mittaamisesta jalkapallovedonlyönnissä sekä kertoimien tehokkuudesta ja niiden voittamisen vaikeudesta. Uusimmassa artikkelissaan hän syventyy aiheeseen jälleen ja tutkii satunnaisuutta ja tehokkuutta jalkapallovedonlyönnissä.

Kuvittelen, että lukijat ovat jo väsyneet viestiin, että jalkapallovedonlyönti on vaikea ratkaistava, koska se on pääosin satunnaista ja tehokasta. Näin minäkin luulin, mutta tämän karanteenin ja jalkapallottomuuden aikana minulla ei ollut juuri muuta tekemistä kuin vitkastella uuden kirjan kirjoittamista, joten aloin taas katsoa vanhoja ideoita.

Tämä artikkeli on tuon työn hedelmä. Tässä ei ole mitään erityisen uutta, vain ideoiden esittämistä uudessa valossa. Toivottavasti havaitsette sen hyödylliseksi.

Miltä tehokkuus näyttää?

Vuosien aikana olen väitellyt sellaisten ihmisten kanssa, jotka väittävät, että jalkapallo ei ole satunnaista. Kuinka se voi olla, jos Manchester United paljon todennäköisemmin voittaa Cambridge Unitedin? He ovat oikeassa, mutta emme puhu jalkapallosta vaan jalkapallovedonlyönnistä.

Pohjimmiltaan kertoimet on tasoitettu ottamaan huomioon eri joukkueiden kyvyt. Paremmilla joukkueilla on pienemmät kertoimet. Kun riittävän monet ihmiset ovat antaneet rahalla mielipiteensä joukkueiden voittotodennäköisyydestä, kertoimet ovat varsin lähellä ”todellisia” kertoimia, jos ne voitaisiin tietää. Tätä prosessia kutsutaan hinnan selvittämiseksi. Sillä ei käytännössä ole väliä, tapahtuuko se joukkoälyllä tai taitavien vedonlyöjien älyllä.

Pinnaclen kertoimien voittaminen, ainakaan Englannin jalkapalloliigassa, ei ole helppo homma.

Vedonvälittäjän työ on päästä mahdollisimman lähelle todellisia kertoimia, jotta heillä on pienin mahdollinen riski kohteissa pidemmän päälle. Vedonlyöjien tehtävä on löytää heidän virheensä.

Yksi mahdollinen tapa selvittää, onko vedonvälittäjä keskimäärin lähellä todellisia kertoimia, on katsoa pääsisimmekö omillemme lyömällä vetoa kaikista, jos kate poistettaisiin. Lisäksi jos pienen esimerkkivetojen määrän palautuksen vaihtelevuus jakautuu samoin kuin reilussa kolikonheitossa ja jos palautuksissa näkyy regressio kohti keskiarvoa, se kertoo, että kertoimet ovat tehokkaita ja suorituksen vaihtelu on kohinaa signaalin sijaan.

Tarkastellaanpa tilastoja. Käyttämällä kolmea edellistä loppuun pelattua Englannin jalkapalloliigan kautta (2016/17–2018/19) laskin joukkuepisteet jokaisesta ottelusta käyttämällä Pinnaclen sulkemiskertoimia katteen poistamisen jälkeen (”reilu” kerroin). Yksinkertainen pisteytyssääntö, jota käytin aiemmin, määritetään seuraavasti.

Jos joukkue voittaa, pisteitä annetaan 1 – 1/kerroin

Jos joukkue ei voita, pisteitä annetaan –1/kerroin

Täten joukkueen pisteiden teoreettinen maksimi ja minimi ovat +1 ja -1.

Kolmen kauden ja neljän divisioonan (6 108 ottelua 12 216 maalia) pistekeskiarvo oli 0,0030 keskihajonnalla 0,4557. Tämä näyttää olevan varsin lähellä odotettua keskiarvoa 0, jos reilut kertoimet olisivat keskimäärin täydellisiä.

Satunnainen pistejakauma?

Entäpä pistenäytteiden jakauma? Kun tiedot järjestetään joukkueen ja ottelupäivämäärän mukaan, laskin kuuden ottelun juoksevan keskiarvon jokaiselle joukkueelle. Luonnollisestikaan ensimmäiset viisi ottelua eivät anna pisteitä.

Kuuden ottelun pistekeskiarvo oli 0,0032 keskihajonnalla 0,1866. Jakauma näkyy seuraavassa taulukossa sinisellä viivalla. Oranssi viiva näyttää teoreettisen normaalijakauman satunnaisuudelle. Yritä löytää eroa sen ja todellisten pisteiden jakauman väliltä.

Randomness-in-soccer-betting-InArticle-1.jpg

Keskihajonta on lähes sama kuin ensimmäisten periaatteiden ennuste keskiarvon vakiovirheellä,

Randomness-in-soccer-betting-InArticle-4.jpg

missä σ on pisteiden keskihajonta yksittäisten otteluiden kokonaisuudessa ja n on otoskoko, tässä tapauksessa 6. Täten

Randomness-in-soccer-betting-InArticle-5.jpg

Tämä poikkeaa huomattavasti havaitusta luvusta 0,1866. Voimme käyttää vakiovirhekaavaa taas laskemaan odotettu keskihajonta tälle vakiovirheluvulle, eli vakiovirheen vakiovirhe. Kun tiedetään, että 6 ottelun otoksia on 10 836, tämä lasketaan seuraavasti.

Randomness-in-soccer-betting-InArticle-6.jpg

Täten 0,1860 on vain keskihajonnan kolmanneksen etäisyydellä arvosta 0,1866, ja hyvin tilastollisen merkittävyyden rajojen sisäpuolella. Havainnon ja odotetun satunnaisuuden ero on noussut vain sattuman takia.

Tästä voi päätellä, että Pinnaclen kertoimet ovat todella hyvä mittapuu totuudelle, minkä lisäksi selkeä enemmistä palautuksista, jotka vedonlyöjät saavat niistä, ainakin kuuden ottelun jälkeen, on vain hyvän ja huonon onnen kauppaa.

Tämä on epämukava viesti ja saan siitä toistuvasti kritiikkiä. Kritiikin avain pyörii termin ”keskimäärin” ympärillä. Pinnaclen jalkapallokertoimet saattavat olla tehokkaita keskimäärin, mutta vedonlyöjät eivät lyö vetoa keskiarvosta. Tämä on tietysti totta, mutta vedonlyöjän vaikea osuus on selvittää vedonvälittäjän virheet systemaattisesti. Todisteet viittaavat siihen, että suurin osa ”löydöistä” on sattumaa.

Olen toistanut harjoituksen 12 ja 24 ottelun otoksilla. Niiden pistejakaumat näkyvät alla. Ne seuraavat satunnaisesti luotua jakaumaa vielä tarkemmin kuin kuuden ottelun pisteet.

Randomness-in-soccer-betting-InArticle-2.jpg

12 ja 24 ottelun pisteet olivat 0,0037 ja 0,0049 (pienet erot kaikkien kolmen välillä johtuvat todennäköisesti sattumasta ja erikokoisista ottelumäärien otoksista). Keskihajonnat olivat 0,1301 ja 0,0916 verrattuna arvoihin 0,1315 ja 0,0930, jotka on laskettu keskiarvon vakiovirheellä. Nämä erot odotetusta ovat noin 1 keskihajonnan verran, mikä taas viittaa siihen, että syynä on vain sattuma eikä mikään muu.

Regressio kohti keskiarvoa

Jos kuuden ottelun keskipisteiden hajonta oli systemaattista, voisi olla mahdollista ennustaa, mitä tapahtuu. Esimerkiksi kuuden pelin aikana hyvässä kunnossa olevat joukkueet, joiden pisteet ovat keskimäärin positiivisia, voisi ennustaa näyttävän jälleen positiivista keskiarvoa seuraavan kuuden pelin ajalta. Ikävä kyllä näin ei ole. Regressio kohti keskiarvoa on lähes täydellistä kuuden ottelun otoksessa.

Muista kuitenkin, etten väitä, että kuudessa ottelussa vahvoina pelaavat joukkueet muuttuisivat vähemmän vahvoiksi seuraavassa kuudessa pelissä. Päinvastoin, voimakkaammat joukkueet pysyvät voimakkaampina. Katso vaikka tämän kauden Liverpoolia. Väitän, että joukkueiden siitä saamat pisteet, jotka on tasoitettu vedonlyöntikohteessa huomioimaan joukkueen kyvyt, heikkenevät kohti keskiarvoa.

Seuraava taulukko näyttää kuinka keskimäärin on käytännössä mahdotonta ennustaa, mikä joukkueen kuuden ottelun pistekeskiarvo on otteluissa 7–12, jos perustana käytetään otteluita yhdestä kuuteen. Jalkapallojoukkueella voi olla voittoputkia, mutta tasoitetuista palkkioista vetoa lyövillä vedonlyöjillä ei.

Randomness-in-soccer-betting-InArticle-3.jpg

Vedonvälittäjien taito kertoimien asettamisessa ja vedonlyöjien taito mahdollisten virheiden hyväksikäyttämisessä tarkoittavat, että lähes kaikki nähty vaihtelu vedonlyöntipisteissä on satunnaista epävarmuutta: sattumaa.

Pisteytyssääntö?

Viime kuussa puhuin sijoitustodennäköisyystuloksesta (Rank probability score, RPS) pisteytyssääntönä, jolla voidaan mitata Pinnaclen jalkapallokohteiden tehokkuutta. Voisimme itse asiassa ajatella tässä artikkelissa käyttämääni pisteytyssääntöä vastaavalla tavalla.

Jos Pinnaclen kertoimet olisivat täydellisen tehokkaita, pistekeskiarvo olisi tasan 0. Samoin kuin RPS:n kanssa emme voi ikinä tietää kuinka suuri osa 0:sta poikkeamisesta on seurausta satunnaisesta epävarmuudesta (tulosten satunnaisuudesta) ja kuinka paljon järjestelmällistä epävarmuutta (virhe vedonvälittäjän kertoimien asettamismallissa). Olen mahdollisesti esitellyt toisen järjestelmällisen virheen tavassa, jota olen käyttänyt Pinnaclen katteen poistamiseen kertoimista. Koska en tiedä tarkkaan miten he sitä käyttävät, minun on täytynyt arvioida sen poistaminen.

Tästä huolimatta se, kuinka tarkasti pistekeskiarvo lähestyy nollaa ja kuinka tarkasti otteluiden pistejakauma lähestyy satunnaisjakaumaa, on voimakas todiste Pinnaclen jalkapallo-otteluiden kertoimien tehokkuudesta.

Entä kuumien käsien harha?

Kaikki tämä keskustelu jättää minulle ratkaisemattoman ongelman. Kaksi vuotta sitten esittelin vedonlyöntijärjestelmän, joka yritti käyttää hyväkseen Pinnaclen jalkapallokertoimien epätehokkuutta, jonka syynä saattaa olla kuumien käsien harha.

Hypoteesi oli, että vedonlyöjät saattavat uskoa voittoputkiin. Tämä seurauksena he saattavat lyödä vetoa voittoputkessa olevista joukkueista, mikä pienentää niiden kertoimia todellisiin kertoimiin verrattuna. Vastaavasti kylmät joukkueet saisivat liian vähän vetoja, mikä suurentaisi niiden kertoimia ja mahdollisesti loisi arvoa.

Suhteellisen kylmien joukkueiden ja suhteellisen kuumien joukkueiden puolesta vedonlyömisen ero oli heikosti tilastollisesti merkittävä (p-arvo = 0,02 analysoidulle otteluiden otokselle). Kylmimmät vastaan kuumimmat joukkueet antoivat merkityksellisemmän tuloksen (p-arvo = 0,001) ja Pinnaclen sulkemiskertoimista olisi voinut saada 2,7 % todellista tuottoa 5 000 vedon otoksella (keskimääräinen kerroin 3,9). Mutta jos tämä analyysi esittää kohteet lähes täysin tehokkaina, oliko tämä vain onnekas illuusio?

Vedonvälittäjän tehtävä on päästä mahdollisimman lähelle todellisia kertoimia... Vedonlyöjien tehtävä on löytää heidän virheensä.

Se on mahdollista. 2,7 %:n voitto voisi tapahtua seitsemän kertaa sadasta sattumalta, joten se ei ole mitenkään varmaa tuottoa tilastollisessa mielessä. Tästä huolimatta, jos 6 ottelun pisteiden keskiarvojakaumaa katsoo uudelleen, voi huomata, että suuria negatiivisia pisteitä on vähemmän kuin voisi odottaa pelkästään sattumalla olevan. 438 niistä on alle -0,3 verrattuna satunnaisgeneroinnin 563:een.

Mahdollinen selitys tälle on se, että kun vedonlyöjät lyövät vähemmän vetoja useampia otteluita häviävien joukkueiden puolesta, jokaisen häviön jälkeen ne saavat suhteessa vähemmän negatiivisia pisteitä. Jos olisit lyönyt vetoa näistä 438 joukkueesta, joiden 6 ottelun keskiarvo oli alle -0,30 pistettä 7. ottelun kohdalla, olisit tienannut 11,6 % (keskimääräinen kerroin 3,22, p-arvo = 0,06).

Itse asiassa vain 438 pistettä alle -0,3:n oli varsin onnekas tulos. Näillä kertoimilla tuloksien satunnaistaminen johdetuilla todennäköisyyksillä paljasti odotetuksi arvoksi 513, ja Monte Carlo -simulaatioista vain 2,5 % näytti alle 438:aa. Voimme sitten verrata tätä odotettua arvoa 513 odotettuun arvoon täydellisellä normaalijakaumalla ja populaation keskiarvopisteillä 0. Tämä on 584. Vain 3,5 %:ssa simulaatioista oli yli 584 kuuden ottelun keskiarvopistettä, joka oli alle -0,3. Tilastotieteilijät kutsuisivat tätä heikosti merkitseväksi. Ehkä todellisten 6 ottelun pisteiden jakauma ei olekaan satunnainen.

Luonnollisesti samaa järkeilyä pitäisi käyttää kuumiin joukkueisiin. Peräkkäisten voittojen pitäisi pienentää niiden kertoimia suhteessa todellisiin tulosten todennäköisyyksiin, jolloin siellä pitäisi olla vähemmän suuria positiivisia pisteitä. Mutta emme näe tätä näissä esimerkkitilastoissa.

Satunnaisuudesta ja tehokkuudesta on vieläkin lisää opittavaa

Jos jalkapallovedonlyönnin pistejakaumassa on jotakin epäsatunnaista löydettävänä, tämä analyysi vahvistaa, että se on vaikea löytää. Satunnaisen kohinan ja mahdollisesti hyväksi käytettävän järjestelmällisen signaalin välinen raja on hienon hieno, ja se paljastaa itsensä vain pitkän ja toistuvan pelaamisen kautta lahjakkaimmille ja ahkerimmille vedonlyöjille.

Tämä artikkeli on tuon työn hedelmä. Tässä ei ole mitään erityisen uutta, vain ideoiden esittämistä uudessa valossa. Toivottavasti havaitsette sen hyödylliseksi.

Yleisesti ottaen on selkeää, että Pinnaclen kertoimet ovat todella tehokkaita (vähintään keskimäärin) ja että järjestelmällisiä tehottomuuksia – joista yksi mahdollinen on kuumien käsien harha – on vaikea löytää. Lisäksi pääosin Pinnacle pystyy varmistamaan hyvin, että jos näitä epätehokkuuksia on, ne pysyvät pääosin heidän marginaaliensa sisällä. Pinnaclen kertoimien voittaminen, ainakaan Englannin jalkapalloliigassa, ei ole helppo homma.

Vedonlyöntiresurssit auttavat vedonlyönnissä

Pinnaclen Vedonlyöntiresurssit-osio on yksi netin kattavimmista asiantuntevan vedonlyöntineuvonnan kokoelmista. Tavoitteenamme on auttaa kaikentasoisia vedonlyöjiä parantamaan tietämystään.