tammi 10, 2020
tammi 10, 2020

Osa yksi: Bayes-tekijän käyttäminen vedonlyöntitaitojen arvioimiseen

Mikä on Bayes-tekijä?

Kuinka Bayes-tekijää tulkitaan

Bayes-tekijöiden käyttäminen vedonlyöntiskenaarioissa

Osa yksi: Bayes-tekijän käyttäminen vedonlyöntitaitojen arvioimiseen

Miten tiedämme, milloin vedonlyöntitulokset ovat onnen ansiota ja milloin taidon ansiota? On useita ehdotuksia, joilla tähän vastaukseen yritetään vastata, mutta ne johtavat usein väittelyyn. Uusimmassa artikkelissaan Joseph Buchdahl selittää, kuinka Bayes-tekijää voidaan käyttää vedonlyöntitaitojen testaamiseen. Lue lisää tästä.

Bayes-tekijä vertaa kunkin hypoteesin suhteellisia ansioita sanomatta mitään niiden ansioista suhteessa todelliseen kruunien odotusarvoon.

Minulta kysytään usein, kuinka suuri vedonlyöntien otos vaaditaan ennen kuin voidaan olla varmoja, että nähty todella heijastaa vedonlyöjän kykyjä ennustajana eikä vain osoita onnea? Tämä vastaa monin tavoin kysymystä siitä, kuinka pitkä langan pätkä on. Muutaman viime vuoden aikana olen kuitenkin etsinyt vastauksia tähän kysymykseen.

Yleinen lähestymistapa on laskea sattuman todennäköisyys vedonlyöntiotoksessa näkemällemme tuottavuudelle, eli oletamme, että vedonlyöjällä ei ole lainkaan taitoja. Tämä on frekvenssitulkintaan eli p-arvoon perustuva menetelmä. Kun todennäköisyys on pieni (tyypillisesti alle 5 %, tai 1 % jos olemme vaativampia), voimme subjektiivisesti esittää, että kyseessä on oltava jotakin muuta kuin sattumaa, esimerkiksi juuri taitoa.

Huonona puolena tässä lähestymistavassa on se, ettei se kerro meille todennäköisyyttä sille, että me olemme taitavia. Se vain laskee tietojen todennäköisyyden sillä hypoteesilla, että me emme ole taitavia. Kun vedonlyöjiä on riittävän suuri määrä, löydämme aina joitakin erittäin pieniä p-arvoja, jotka antavat illuusion taidosta.

Vaihtoehtoinen menetelmä käyttää bayesilaista teoreemaa arvioimaan havaittujen tietojen pohjalta todennäköisyyttä hypoteesille, että olemme taitavia. Lisäksi jokaisen uuden tiedon (esimerkiksi uuden vedonlyönnin tuloksen) myötä voimme päivittää aiemman todennäköisyyden ja luoda uuden (posterioritodennäköisyyden) iteratiivista päivitysketjua varten.

Selkeä haittapuoli bayesilaisessa teoreemassa on kuitenkin se, että johtopäätöksiin vaikuttaa herkästi alkuperäisen prioritodennäköisyyden valinta, eli tässä tilanteessa se, että kuvittelemme olevamme taitava vedonlyöjä ennen ”vedonlyöntiuran” aloittamista.

Mikä on Bayes-tekijä?

Olen aiemmin vertaillut frekvenssitulkintaa ja bayesilaista menetelmää vedonlyöjän taitojen testaamisessa. Tässä artikkelissa haluan käsitellä näitä ideoita uudelleen Bayes-tekijää käyttämällä. Mielestäni Bayes-tekijä tarjoaa yhdistelmän molempia lähestymistapoja laskemalla todennäköisyyssuhteen kahdelle kilpailevalle hypoteesille tai mallille (esimerkiksi ”olen taitava” vastaan ”en ole taitava”) vertaamalla annettujen tietojen mukaisia todennäköisyyksiä molemmille hypoteeseille. 

Bayes-tekijän tavoite on selvittää, kuinka paljon parempi yksi hypoteesi on toiseen verrattuna riippumatta siitä, onko kumpikaan hypoteesi oikea. Matemaattisesti Bayes-tekijä esitetään yleisesti seuraavasti:

bayes-skill-formula1.png

missä P = todennäköisyys, D = tiedot, H1 on mallihypoteesi, esim. ”Odotusarvoni on +5 % taitojeni ansiosta”, ja H0 on nollahypoteesi, esim. ”Minulla ei ole taitoja ja odotusarvoni on vedonlyöjän katteen mukaisesti -2,5 %”. P(D|H) on matemaattinen tapa ilmaista ”annettujen tietojen havaitsemisen todennäköisyys, mikäli hypoteesi on oikeassa.”

Bayes-tekijän ymmärtäminen: yksinkertainen esimerkki

Oletetaan, että meillä on kolikko. Luulemme, että se saattaa olla painotettu, mutta emme tiedä varmaksi. Olemme heittäneet sitä aiemmin 10 kertaa ja saaneet seitsemän kruunaa, joten hypoteesimme (H1) on, että kolikko on painotettu kruunaa kohden suhteessa 70 % – 30 %. Painottamattomalla kolikolla (H0) kruunien ja klaavojen todennäköisyydet ovat 50 % ja 50 %. Heitämme sitä nyt 100 kertaa ja saamme 60 kruunaa. Kumpi hypoteesi on oikeassa?

Frekvenssitulkinnalla p-arvolle lasketaan todennäköisyydeksi 60 tai useamman kruunan saamiselle 50:50-oletuksella vain 1,76 %, mikä on riittävän pieni sille, että akateemikot voisivat julkaista tutkimuksen painotetusta kolikosta. Ongelma on kuitenkin siinä, että voisimme julkaista myös toisen tutkimuksen siitä, että kolikko on reilu, koska todennäköisyys 60 tai harvemman kruunan saamiseen 70:30-painotuksella on vain 2,10 %. Molemmat luvut ovat tilastollisesti merkittäviä 95 %:n luottamustasolla.

Bayes-tekijä vertaa kunkin hypoteesin suhteellisia ansioita sanomatta mitään niiden ansioista suhteessa todelliseen kruunien odotusarvoon. Edellä olevan kaavan mukaan Bayes-tekijä voidaan laskea molempien hypoteesien mukaisen 60 kruunan saamisen todennäköisyyksien suhteesta. Exceliä käyttämällä saamme:

bayes-skill-formula2.png

Kuinka Bayes-tekijää tulkitaan

 

Mitä luku 0,783 todellisuudessa tarkoittaa? Kahden edellä olevan todennäköisyyden vertaamisen pitäisi intuitiivisesti kertoa, että 60 kruunan saamisen pitäisi olla jotakuinkin yhtä todennäköistä molemmissa hypoteeseissa. Lähellä yhtä oleva Bayes-tekijä kertoo, että kummallekaan hypoteesille ei ole lainkaan tai juuri tukea toiseen nähden. Tässä tilanteessa, jossa se on alle 1, saattaisimme pitää hypoteesia H0 (painottamaton kolikko) marginaalisesti todennäköisempänä kuin hypoteesia H1 (painotettu kolikko). 

Harold Jeffreys, 1900-luvun monitietäjä, ehdotti tulkitsemisskaalaa Bayes-tekijälle. Yhden ja kolmen välillä olevat arvot osoittavat anekdoottista todistusaineistoa H1:lle verrattuna H0:aan (1–1/3 H0:lle verrattuna H1:een). Arvo kolmesta kymmeneen osoittaa kohtalaista todistusaineistoa H1:lle verrattuna H0:aan (ja arvo 1/3–1/10 H0:lle verrattuna H1:een). 10–30 (ja 1/10–1/30) osoittaa melkein merkitsevää todistusaineistoa, 30–100 (ja 1/30–1/100) merkitsevää todistusaineistoa ja yli 100 (alle 1/100) erittäin merkitsevää todistusaineistoa. 

Oletetaanpa, että kruunia olisi ollut 65. Kuinka tämä muuttaa Bayes-tekijää? Edellä olevan suhteen laskeminen uudelleen:

bayes-skill-formula3.png

Tämä olisi paljon merkittävämpää todistusaineistoa kolikon painotukselle. 

Tässä tapauksessa meidän tulisi muistuttaa itsellemme, että Bayes-tekijä ei itse asiassa kerro kuinka todennäköisesti H1 on totta vaan ainoastaan sen, kuinka paljon todennäköisemmin se on totta kuin H0. Ajatellaan 90 kruunan saamista. Bayes-tekijä olisi 85,7 miljoonaa, mutta koska 90 kruunan todennäköisyys 70:30-vinoumalla olisi alle yksi 2,5 miljoonasta, on epätodennäköistä, että uskomuksemme 70:30-vinoumasta olisi oikea. 

Seuraava taulukko näyttää kuinka Bayes-tekijä muuttuu (logaritmisesti) havaittujen kruunien määrän mukaan.

bayes-factor-in-article-1.jpg

Mitä jos hypoteesien odotukset ovat epävarmoja?

Kolikonheittoesimerkissä oletin kiinteän todennäköisyyden kruunien todennäköisyydelle sekä hypoteesissa H0 (50 %) että H1 (70 %). Se on järkevää painottamattomalle kolikolle, koska on yleinen todennäköisyyssääntö, että painottamattomalla kolikolla on yhtä suuri todennäköisyys antaa kruuna tai klaava. [Tosiasiassa se on hieman sitä monimutkaisempaa, ja asiasta kiinnostuneille siitä on tutkimus.] Mutta onko tämä totta hypoteesille H1, painotetulle kolikolle. 

Jos emme tiedä tarkasti kruunien odotusarvoa, eikö olisi järkevämpää olettaa sen olevan jollakin alueella kuin määrittää sille tarkka arvo?

Bayes-tekijä vertaa kunkin hypoteesin suhteellisia ansioita sanomatta mitään niiden ansioista suhteessa todelliseen kruunien odotusarvoon.

Itse asiassa tämä on juuri miten todelliset Bayes-tekijät lasketaan. Tähän asti olen puhunut todennäköisyyssuhdetestistä, jossa H1 (70 ) ja H0 (50 %) ovat enimmäistodennäköisyysarvioita.

Kun hypoteesin odotusarvot ovat epävarmoja, Bayes-tekijä on todennäköisyyksien kokonaislukujen suhde verrattuna mahdollisten kruunien odotusarvojen täyteen jakaumaan. Saatamme esimerkiksi olettaa, että vaikka 70 %:n kruunien odotusarvo on todennäköisin hypoteesille H1, mahdollisten odotusarvojen alue saattaa olla normaalijakautunut 5 %:n keskihajonnalla.

Exceliä ei ole varustettu tällaisia integraalilaskuja varten, mutta arviointi on mahdollista käyttämällä odotettujen kruunien mahdollisten arvojen painotettua keskiarvoa.

Jos oletetaan normaalijakauma 70 %:n enimmäistodennäköisyydellä ja 5 %:n keskihajonnalla, alkuperäinen Bayes-tekijän arvo 0,783 kasvaa 1,26:een. Nyt H1 (painotettu kolikko) on marginaalisesti todennäköisempi hypoteesi. Syy tähän on se, että mahdollisten kruunien odotusarvojen – joista osa on alle 70 %:n ja osa lähempänä 60 %:a (joka oli havaittu kruunien prosenttiosuus) – jakaumaa käytetään painotettuun laskelmaan.

Bayes-tekijöiden käyttäminen monimutkaisemmissa vedonlyöntiskenaarioissa

Edellä oleva kolikonheittoesimerkki esittää yksinkertaisen tilanteen, jossa jokaisella heitolla on sama todennäköisyys. Vedonlyönnissä tilanne ei kuitenkaan ole oikeastaan ikinä tämä edes pistejakauman ja aasialaisen tasoituksen vedonlyöjille. Kun kertoimet vaihtelevat, on käytännössä mahdotonta käyttää binomijakaumaa tietyn vedonlyöntitulosten sarjan todennäköisyyden laskemiseen. 

Onneksi noin 30 otoksen jälkeen normaalijakauma antaa riittävän korvikkeen. Lisäksi keskimääräisten kertoimien käyttäminen otoksessa tarjoaa jykevän mitan todennäköisyyksille, vaikka yksittäisten vetojen kertoimet vaihtelisivatkin huomattavasti, kunhan panokset ovat samoja.

Bayes-tekijän (tosiasiassa todennäköisyyssuhteen) yksinkertaisesta versiosta voidaan täten tehdä seuraavanlainen lasku.

bayes-skill-formula4.png

missä y = todellinen tuotto, evH1 = ennustemallin tai vedonlyöntijärjestelmän odotusarvo (millaista tuloa odotat saavasi), evH0 on nollahypoteesi odotusarvo (esimerkiksi vedonvälittäjän kate), σH1 on evH1:n keskihajonta ja σH0 on evH0:n keskihajonta. 

Helmikuussa 2019 näytin, miten voimme mallintaa mahdollisten tuottojen jakauman keskihajonnalla. Näytin erityisesti miten seuraavaa kaavaa voidaan käyttää: 

bayes-skill-formula5.png

missä p on ”todellinen” voiton todennäköisyys, o on vedonlyöntikerroin ja n on vetojen määrä. 

Pienellä uudelleenjärjestelyllä voimme havaita, että:

bayes-skill-formula6.png

missä r on tuotto sijoitukselle (tai y + 1). 

Jos rH1 = evH1 + 1 ja rH0 = evH0 + 1, silloin: 

bayes-skill-formula7.png

ja

bayes-skill-formula8.png

Excelin NORMDIST-funktion tuntevat voivat tietää, että kun sitä käytetään tunnisteen FALSE kanssa, tulos on todennäköisyyden tiheysfunktio yksinkertaisen todennäköisyyden sijaan. Hämmentävämpää voi olla, että todennäköisyyden tiheysfunktion arvo voi joissakin tilanteissa olla yli 1, kun taas todennäköisyys ei luonnollisestikaan voi olla. 

Todellisuudessa todennäköisyyden tiheysfunktio vastaa yksikkökohtaista todennäköisyyttä (tässä esimerkissä todennäköisyys tuottoa kohden) ja vielä tarkemmin yksikkökohtaista todennäköisyyttä äärettömän pienellä intervallialalla (derivaatta).

Meidän ei tarvitse murehtia tästä nyt. Onneksi kuitenkin on niin, että koska me jaamme yhden todennäköisyyden tiheysfunktion toisella, yksikkökohtaisuudet kumoavat toisensa, jolloin jäljelle jää vain todennäköisyyssuhde, mikä Bayes-tekijä on. 

Tähän artikkelin ensimmäisen osan pitäisi antaa riittävä esittely Bayes-tekijästä ja siitä, miten sitä käytetään vedonlyönnin yhteydessä. Osassa kaksi tutkin, voimmeko käyttää Bayes-tekijää testaamaan todisteita taidosta vedonlyönnissä, ja muita malliskenaarioita.

Vedonlyöntiresurssit auttavat vedonlyönnissä

Pinnaclen Vedonlyöntiresurssit-osio on yksi netin kattavimmista asiantuntevan vedonlyöntineuvonnan kokoelmista. Tavoitteenamme on auttaa kaikentasoisia vedonlyöjiä parantamaan tietämystään.