joulu 10, 2019
joulu 10, 2019

Epäonnistuminen: Menestymisen salaisuus?

Onko epäonnistuminen menestymisen salaisuus?

Mallin heikkouksien analysointi

Epäonnistuminen: Menestymisen salaisuus?

Vedonlyöjät keskittyvät usein menestymisen ideaan vedonlyönnissä. Ihmiset haluavat epäonnistua mahdollisimman vähän ja voittaa mahdollisimman paljon. Andrew Mack, Statistical Sports Models in Excel -kirjan kirjoittaja, uskoo, että epäonnistuminen saattaa olla menestyksen salaisuus vedonlyönnissä. Hänen ensimmäisessä Pinnacle-artikkelissaan hän kertoo miksi.

Epäonnistuminen: Menestymisen salaisuus?

Mikään maailmassa ei korvaa sitkeyttä. Ei lahjakkuus; epäonnistuneita lahjakkuuksia on kaikkialla. Ei nerous; väärinymmärretty nero on suoranainen käsite. Ei koulutus; maailma on täynnä koulutettuja hylkiöitä. Vain sitkeydellä ja päättäväisyydellä yllät mihin tahansa.” – Calvin Coolidge

Urheilumallinnuksessa epäonnistuminen voi olla myöhemmän menestymisen salaisuus.

Tässä artikkelissa selitän yksinkertaisen metodin NHL-otteluiden 1X2-tulosten todennäköisyyden johtamiseen simulaation avulla. Aluksi käsittelemme perusmallia, jota on helppo itsekin käyttää Excelissä. Malli on yksinkertaistettu, mutta toimiva.

Todellinen tarkoitukseni tämän jakamisen kanssa on esitellä joitakin harvemmin keskusteltuja osia urheilumallinnuksesta: epäonnistuminen, kriittinen analysointi alan tietämyksellä ja ongelmanratkaisu.

Mallinrakennuksessa yllättävä totuus on, että usein epäonnistumisista oppii enemmän kuin onnistumisista. Tämän vuoksi kun olemme tehneet tämän mallin yhdessä ja luoneet perusmenetelmän, analysoimme mallin heikkouksia kriittisesti etsiäksemme mahdollisuuksia sen parantamiseen. Toivon, että näin toimimalla voin antaa sinulle jotakin pidemmän päälle arvokkaampaa kuin mikään malli pystyisi – ongelmanratkaisuprosessin omien ideoiden parantamiseen, kunnes ne ovat riittävän hyviä menestymään. Aloitetaan.

Vaihe 1: Kerätään tietoja

Aluksi tarvitsemme tietoja. Mennään osoitteeseen Hockey-Reference.com ja kopioidaan kaikki tulostiedot vuoden tämän vuoden 2019–2020 NHL-kaudelta ja liitetään ne Excel-taulukkoon.

success-failure1.jpg

Pystymme tekemään yllättävän paljon analysointia näistä yksinkertaisista pelitulostiedoista.  Saatamme esimerkiksi haluta tietää koti- ja vierasjoukkueiden tekemien maalien odotusarvon, tehtyjen maalien varianssin tai jatkoajan yleisyyden.

Jos käytämme Excelin AVG- ja VAR-toimintoja, huomaamme, että kotijoukkueiden keskiarvo oli 3,30 maalia pelissä, kun taas vierasjoukkueiden keskiarvo oli 2,85 maalia. Näiden maalien varianssi on 2,85 ja 2,62 tässä järjestyksessä. Jatkoaika on tähän mennessä tällä kaudella esiintynyt noin 26,81 % ajasta. Joka tapauksessa meillä on nyt tilastomme. Selvitetään seuraavaksi tavoitetuloksemme jakauma.

Vaihe 2: Tutustutaan tavoitetuloksen jakaumaan

Oletetaan, että tavoitetuloksemme on kummankin joukkueen tekemien maalien määrä. Se vaikuttaa varsin suoraviivaiselta, jos haluamme ennustaa kuka todennäköisesti voittaa ja kuinka usein. Olisi hyödyllistä tietää, millaiseen tilastolliseen jakaumaan nämä tiedot suurin piirtein menevät, kun yritämme myöhemmin muuttaa ennustamamme odotukset todennäköisyyksiksi.

Tiedämme, NHL:n maalit ovat diskreetti muuttuja. Ne ovat suhteellisen harvinaisia, vaikka onnistumiseen onkin paljon mahdollisuuksia, ne tehdään yksi kerrallaan ja niihin sisältyy satunnainen elementti. Poissonin käyrä vaikuttaa luonnolliselta valinnalta. Voimme tarkistaa tämän lukuisilla Excel-apuohjelmilla:

Poissonin käyrä vaikuttaa sopivan varsin hyvin tilastoihimme. Tämä ei ole yllättävää, koska monet tilastotutkijat ovat tutkineet ja kommentoineet tätä jo vuosien ajan. Pidetään nämä jakaumatiedot mielessä, kun jatkamme. Niistä on pian hyötyä.

Vaihe 3: Muodostetaan vihollisen mukaan säädetty odotus jokaiselle joukkueelle

Meillä on tilastomme, meillä on tavoitetulos ja meillä on todennäköisyysjakauma. Nyt tarvitsemme mallirakenteen, jolla saamme ennusteen kullekin ottelulle. Tässä esimerkissä käytän yksinkertaista mallirakennetta, joka käyttää kummankin joukkueen tehtyjä ja päästettyjä maaleja koti- ja vierasotteluissa ja ottaa niistä keskiarvon. Funktio näyttää tältä:

xTehdyt maalit = (keskimäärin tehdyt maalit + keskimäärin päästetyt maalit vastustajaa vastaan)/2

Näin olemme ottaneet huomioon hyökkäyksen, puolustuksen ja kotiedun (vaikkakin yksinkertaistettuna). Kun käytämme esimerkkinä ottelua New York Rangers vastaan Ottawa Senators, joka pidettiin 22. marraskuuta, mallimme odottaa Ottawan tekevän 3,43 maalia ja New Yorkin tekevän 2,73. Tästä näkee ensisilmäyksellä, että tietojensa perusteella mallimme odottaa Ottawan voittavan.

Vaihe 4: Satunnaisuuden esittäminen tulosten simuloinnissa

Nyt kun meillä on maaliodotus molemmille joukkueille, tarvitsemme tavan muuttaa nämä odotukset todennäköisyyksiksi. Yleinen tapa tähän on kilpaileva Poissonin matriisi, kuten kerroin kirjassani ”Statistical Sports Models in Excel”. Tämä on varsin helppo tehdä Excelissä POISSON-funktiolla.

Yksi mahdollinen heikkous tässä tavassa on, että se ei ota maalinteon satunnaisuutta huomioon kovin hyvin. Jotta saisimme paremman kuvan siitä, miten ottelu todennäköisesti päättyy, kokeilemme jotain hieman erilaista Poisson-simulaatiolla. Tätä varten käytämme Excelin satunnaislukujen luomista.

Jos Excelissäsi on data-analyysityökalupaketti asennettuna, napsauta ”Data”, ”Data Analysis” ja sitten ”Random Number Generation”.

Tämä simuloi meille 1 000 ottelua kummankin joukkueen odotetulla maalimäärällä. Voimme sitten laskea taajuuden kummankin joukkueen voitolle, jatkoajan taajuuden ja muuta, mitä haluamme tietää.

Asetetaan ”1” muuttujien määräksi, ”1000” satunnaisnumeroiden määräksi (simuloidut ottelut), ”Poisson” jakaumaksi ja New Yorkin odotetut maalit (2,73) lambdaksi. Kun olemme valinneet laskentataulukosta paikan, johon haluamme tulokset, napsautamme ”OK” ja annamme satunnaislukugeneraattorin tehdä ihmeitään.

Kun simulaatio on valmis, teemme saman Ottawalle varmistaen, että viemme tulokset taulukossa oikeaan vierekkäiseen sarakkeeseen.

Vaihe 5: Todennäköisyydeksi muuttaminen

Nyt kun simulaatioissamme on käsitelty molemmat joukkueet, meidän on laskettava taajuus kotivoittojen, vierasvoittojen ja tasapelien tapahtumistaajuudelle. Tätä varten lisäämme taulukkoomme sarakkeen, joka laskee kotijoukkueen voittomarginaalin [MOV]. Sitten laskemme, kuinka monta kertaa tuhannesta koti-MOV on yli nolla, alle nolla ja tasan nolla.

Tämän pitäisi antaa meille todennäköisyydet, joita voimme käyttää kotivoittojen, vierasvoittojen ja tasapelien kertoimen arvioimiseen. Näin malli arvioi New Yorkin reiluksi kertoimeksi 3,247, Ottawan kertoimeksi 1,855 ja tasapelin kertoimeksi 6,536. Voimme sitten verrata näitä arvioituja kertoimia markkinahintoihin etsiessämme arvoa vedonlyönnistä.

Mallin heikkouksien analysointi

Ottawa voitti tämän ottelun selkeästi, mutta vielä ei kannata olettaa, että käsissämme on voittava malli. Tästä onnistumisesta huolimatta tämä malli ei ole erityisen hyvä. En suosittele lyömään vetoa sen perusteella. Jos käyttäisimme tätä markkinoilla suuressa määrässä kokeiluja, se olisi kuin käyttäisimme turvasaksia tulitaistelussa. Sen verran tiedän, ja se selkenee sinullekin, jos päätät toteumatestata tähänastista malliamme.

Yhtä selkeää ei kuitenkaan ole se, miksi näin on – etenkin jos olet aloitteleva mallintaja. Tämä voi olla turhauttava hetki mallin rakentajalle. Olet tehnyt työtä, luonut mielestäsi järkevän prosessin, mutta tuloksena on epäonnistuminen. Vaikuttaa siltä, että käytit merkittävästi aikaa ja energiaa yrittäessäsi edistyä, mutta päädyit kuitenkin takaisin lähtöviivalle.

Mutta tämä ei ole mallisi loppu. Pikemminkin tästä alkaa se todellinen työ.

Hyvä malli vastaa hyvää kaukoputkea – sillä näkee kauas ja kuva on terävä. Huonolla mallilla ei näe kovin kauas (tai näkee vain taaksepäin!) ja se tuottaa sumean kuvan.  Huono suoritus toteumatestauksessa ilmaisee, että mallimme antaa sumean kuvan tulevaisuuden suorituksista. Kun näin tapahtuu, kannattaa kysyä itseltämme:

  • Mitä variaatioita alla olevasta prosessista emme käsittele riittävästi?
  • Mitä katastrofaalisia oletuksia saatamme tehdä?
  • Miten saisimme kuvasta terävämmän?

Seuraavassa on joitakin ehdotuksia, jotka voivat auttaa ongelmanratkaisussa. Kun mallin parantamista jatketaan oppimalla sen vioista, lopulta siitä voidaan saada riittävän tarkka, jotta siitä tulee arvokas työkalu vedonlyöntiarsenaaliisi.

Tietojen pohtiminen

On aika avata tämän mallin konepelti ja katsoa, mitä vikaa siinä voi olla. Aloitetaan käyttämistämme tiedoista. Se vaikutti riittävän yksinkertaiselta – halusimme arvioidun maalimäärän, joten käytimme maaleja. Sen pitäisi toimia, eikö niin?

Ehkä, ehkä ei. Maalimäärätiedot ovat tulostietoja. Minkä tahansa urheilulajin tuloksiin liittyy kohinaelementti, mikä tarkoittaa, että osa tallennetusta tuloksesta ei johdu siihen liittyvästä toistettavasta taidosta, jonka voimme ennustaa tarkasti.

Mitä satunnaisempaa pisteiden saaminen urheilulajissa on, sitä suurempaa tämä tilastollinen kohina todennäköisesti on. Jääkiekossa sitä on melko paljon. Olemme saattaneet vahingossa yrittää mallintaa kohinaa – mikä on yksi syy, miksi mallimme saattaa tuottaa heikkoja tuloksia.

Mieti, mitä olet nähnyt jääkiekkopeleissä: tyhjiä maaleja, epäonnisia maaliin päätyviä pomppuja ja torjuntoja, jotka pomppaavat maaliin jonkun kyynärpäästä – nämä kaikki lasketaan maaleiksi joukkueelle. Pitäisikö ne laskea osaksi joukkueen piileviä taitoja verrattuna toiseen joukkueeseen? Luultavasti ei. Tässä tilastolliset tekniikat, kuten regressio, ovat tärkeitä. Siksi myös odotettujen maalien ennustetta (xG) pidetään yleensä parempana tulevaisuuden ennustajana kuin todellisia maaleja.

Kun kohinaa saadaan vähennettyä mahdollisimman paljon, pystytään paremmin kartoittamaan varsinaisia toistettavia taitoja, joista seuraa maaleja. On virhe lisätä jo tapahtuneita maaleja joukkueen piilevään kykyyn tilanteessa, jossa on huomattavasti kohinaa. Tämän huomioiminen avaa tutkittavaksi paljon uusia alueita mallin parantamisessa.

Opiksi otettavaa #1: Etsi tapoja vähentää kohinaa tilastoistasi suhteessa tavoitetulokseen.

Mieti mallin oletuksia

Jokaisessa tehdyssä mallissa on oletuksia. Kun malli epäonnistuu, on usein hyödyllistä tunnistaa ja kyseenalaistaa nämä oletukset, jotta voit etsiä mahdollisuuksia parantaa niitä. Ensimmäinen tekemämme oletus oli, että todelliset maalit osoittavat joukkueen voimaa ja piilevää taitoa. Meillä on syytä uskoa, että tämä ei ole paras lähestymistapa, ja olemme kirjanneet sen tutkittavaksi alueeksi.

Mitä muita sellaisia oletuksia olemme tahtomattamme tehneet, joita ehkä kannattaisi kyseenalaistaa?

Mietitään Poissonin jakaumaa. Se vaikutti sopivan varsin hyvin tietoihimme, mutta kun teimme alkuperäisen analyysin maalikeskiarvoista ja niiden varianssista, huomasimme jotakin kiinnostavaa: koti- ja vierasjoukkueiden keskiarvot ja varianssit eivät olleet samat.

Molemmissa tapauksissa tuntuu tapahtuvan jonkinmoista alihajontaa. Tämä on mahdollinen ongelma, koska yksi perusolettamuksista Poissonin jakauman sopivuuden kannalta on se, että tietojen odotusarvon ja varianssin pitäisi olla sama.

Jos varianssi ylittää odotusarvon, kannattaa yleensä miettiä esimerkiksi negatiivista binomijakaumaa. Jos varianssi on pienempi kuin odotusarvo, kannattaa ehkä harkita Conway-Maxwell-Poisson-jakaumaa.

Saatamme myös havaita suuremmalla otoskoolla, että NHL-maalien odotusarvo ja varianssi lähestyvät toisiaan. Tarkoitus on sanoa, että jokin muu jakauma saattaa sopia paremmin tarkoitusperiimme. On tärkeää olla henkisesti joustava eikä vain hyväksyä ratkaisua miettimättä muita mahdollisuuksia.

Opiksi otettavaa #2: Haasta mallisi oletukset tiedon, jakaumien ja funktioiden suhteen.

Harkitse varianssin lähteitä, joita ei ole vielä huomioitu

Lopuksi kannattaa harkita tuloksissa olevia varianssin lähteitä, joita ei ole vielä otettu huomioon. Kelpaisivatko esimerkit? Ensinnäkin olemme olettaneet, että joukkueen voima on erottelematon massa. Tämä tarkoittaa, että emme ota huomioon avainloukkaantumisia tai pelaajavaihtoja. Pystyykö Edmonton Oilers pärjäämään samalla tasolla riippumatta siitä, pelaako Connor McDavid ei? Tämä varmasti vaikuttaisi merkittävästi, mutta mallimme ei sitä huomioi.

Olemme myös olettaneet, että joukkueen päästetyt maalit ovat samat riippumatta siitä, kuka aloittaa maalilla. Tämäkään ei ole erityisen avulias oletus, sillä aloitusmaalivahdilla ja varamaalivahdilla on erilaiset torjuntaprosentit, jotka voivat poiketa selvästikin. Molemmat näistä edustavat mahdollisia varianssilähteitä, joita mallimme ei ota huomioon mutta jotka voisivat auttaa terävöittämään mallimme kuvaa.

Voisimme myös miettiä aikataulua, väsymystä, tuomareita, korkeutta ja monia muita tekijöitä, joita mallimme ei tällä hetkellä ota huomioon. Suunnan etsimiseen paras lähde on alan tietämys. Mallimme ei tiedä, että toisella joukkueella on peräkkäinen peli, varamaalivahti aloituksessa ja 2 avainpelaajaa loukkaantuneena – mutta sinä tiedät.

Opiksi otettavaa #3: Käytä tietämystäsi alasta, kun etsit syitä huomiotta jääneeseen varianssiin.

Maalaisjärjellä, ripauksella alan tuntemusta ja miettimällä aivoriihessä mahdollisia syitä ennustavuuden heikkouteen olemme alkaneet saada käsitystä siitä, miten tätä mallia voitaisiin parantaa. Voimme tarkistaa tietojamme, jakaumaamme ja oletuksiamme ja löytää alueita, jotka ovat täynnä mahdollisuuksia mallimme parantamiseen. Tämän prosessin hidas rakentaminen ja vastoinkäymisten ylittäminen on polku tuottavuuteen.

Näin mallin epäonnistumiset voivat johtaa sinua tiellä lopulliseen onnistumiseen, kunhan opit virheistäsi etkä luovuta. 

Tässä artikkelissa käytetty Excel-taulukko on saatavilla pyynnöstä. Lähetä sähköpostia osoitteeseen [email protected] lisätietoja varten.

Vedonlyöntiresurssit auttavat vedonlyönnissä

Pinnaclen Vedonlyöntiresurssit-osio on yksi netin kattavimmista asiantuntevan vedonlyöntineuvonnan kokoelmista. Tavoitteenamme on auttaa kaikentasoisia vedonlyöjiä parantamaan tietämystään.