tammi 10, 2020
tammi 10, 2020

Osa kaksi: Bayes-tekijän käyttäminen vedonlyöntitaitojen arvioimiseen

Bayes-tekijän käyttäminen vedonlyöntihistorian analysoimiseen

Bayes-tekijä ja sulkemislinjan arvohypoteesi

Bayes-tekijän heikkoudet

Osa kaksi: Bayes-tekijän käyttäminen vedonlyöntitaitojen arvioimiseen
Tämän artikkelin ensimmäisessä osassa Joseph Buchdahl esitteli idean Bayes-tekijän käytöstä vedonlyöntitaitojen testaamisessa. Nyt hän käyttää todellisia vedonlyöntihistorioita näyttämään, kuinka voimme testata, ovatko tulokset onnea vai taitoa. Lue lisää tästä.

Kaksiosaisen artikkelin ensimmäisessä osassa esittelin Bayes-tekijän mittarina, jota voidaan käyttää vertaamaan kahden kilpailevan tilastollisen hypoteesin suhteellista voimaa. Tällä on luonnollisesti käyttökohteita vedonlyönnin analysoinnissa.

Nyt osassa kaksi tutkin kolmea esimerkkiä siitä, miten Bayes-kerrointa voidaan käyttää tässä yhteydessä, ja erityisesti sitä, miten voimme arvioida onko vedonlyöjällä taitoa voiton saamiseen.

Bayes-tekijän käyttäminen vedonlyöntihistorian analysoimiseen

Ehkä selkein tapa vedonlyöjän mahdollisten taitojen määrittämiseen on verrata niitä siihen, mitä hän uskoo voivansa saavuttaa ennustusmenetelmällään verrattuna siihen, mitä vedonvälittäjä odottaa hänen saavuttavan. Oletuksena vedonvälittäjä odottaa tai vähintäänkin toivoo, että jokainen vedonlyöjä häviää vedonvälittäjän katteen verran. Pinnaclen suosituissa kohteissa tämä on tyypillisesti -2,5 %.

Voimme käyttää Bayes-tekijää arvioimaan todennäköisyyden sille, että vedonlyöjä, joka uskoo pärjäävänsä tätä paremmin, osoittaa taitoa.

Seuraava taulukko käyttää Excelin NORMDIST-funktiota ensimmäisessä osassa kuvatulla tavalla ja näyttää todennäköisyyssuhteet (LR) ja Bayes-tekijät (BF) aasialaiselle tasoituksen tai pistejakauman vedonlyöjälle, joka lyö 1 000 vetoa kertoimella 1,95 ja odotusarvolla +5 % (H1). Kun marginaali on -2,5 %, johdettu reilu kerroin ja voittotodennäköisyys jokaiselle vedolle ovat 2,00 ja 50 % (H0). 

Taulukko näyttää, kuinka LR ja BF vaihtelevat havaitun tuoton mukaan.

bayes-factor-in-article-2.jpg

Jos vedonlyöjä saavuttaa odottamansa +5 %:n tuoton, BF = 13,7 ja LR = 19,3. Jeffreysin mukaan tämä tarkoittaa merkitsevää muttei erittäin merkitsevää todistetta sille, että tämä on taitoa onnen sijaan. Vertaa tätä p-arvoon 0,75 % (eli 1:133).

Selvästi Bayes-tekijän analyysi tekee konservatiivisempia päätöksiä kuin vastaava p-arvo, mille on syynsä. Liian usein vedonlyöjät uskovat virheellisesti alhaisten p-arvojen tarkoittavan taitoa, vaikka se kertoisikin vain todennäköisyyden jonkin tapahtumiselle, jos mitään taitoa ei oleteta olevan.

Jos voitat reilun sulkemiskertoimen +5 %:lla, tuotto-odotus on 5 % ja jalkapallo-otteluiden kerrointietojen suurten otosten testaaminen on paljastanut, että voitat tyypillisesti +5 %.

Jotta todisteet olisivat erittäin merkitseviä +5 %:n taidolle, vedonlyöjän tuoton pitäisi olla noin +7,4 % 1 000 vedon jälkeen. Jos he olisivat suoriutuneet niin hyvin, voisimme mieluummin testata H1:n eri versiota (esimerkiksi H1 = 7,4 %), ja voisimme testata sitä vaikka alkuperäistä hypoteesia H1 = +5 % tai jopa hypoteesia H0 = -2,5 % vastaan. Muista, että Bayes-tekijän analyysi vertaa vain kahden hypoteesin suhteellisia todennäköisyyksiä eikä sitä, onko kumpikaan niistä ”totuus”.

Jotta saavutettaisiin erittäin merkitsevä todistuksen taso (BF = 100) sille, että havaittu tuotto vastaa odotettua +5 %:n etua vedonvälittäjän katteella -2,5 %, vaaditaan noin 1 675 vetoa. Siinä tilanteessa p-arvo olisi 0,08 % eli yksi 1 250:stä. Tilastotieteilijät suosittelevat yhä useammin kovempia p-arvoja ennen tilastollisen merkittävyyden julistamista. Esimerkiksi Nassim Taleb, kirjojen Fooled by Randomness ja The Black Swan kirjoittaja, on suositellut p-arvolle vähimmäisarvoa 0,1 %. Tässä esimerkissä se vastaisi noin 100:n Bayes-tekijää.

Seuraava taulukko osoittaa, kuinka LF ja BF vaihtelevat vetojen otoskoon mukaan tässä skenaariossa, missä H0 = -2,5 %, H1 = +5 %, ja havaittu suoritus vastaa tarkalleen H1:tä. BF on tyypillisesti pienempi kuin LR, kun H1 ja havainto ovat lähellä toisiaan, koska todennäköisyysjakaumaa käytetään kuvaamaan H1:tä. Tämä lisää epävarmuutta ja vähentää luottamusta suhteessa tietyn H1:n arvon käyttöön puhtaassa todennäköisyyssuhteen testissä.

Kun H1 on kauempana havainnosta, BF voi olla suurempi kuin LR, minkä edellä oleva taulukko osoittaa selkeästi ja mikä tapahtui ensimmäisen osan kolikonheittoesimerkissä.

bayes-factor-in-article-3.jpg

Kertoimien muuttaminen muuttaa luonnollisesti lukuja dramaattisesti. Kertoimella 5,00, +5 %:n havaitulla suorituksella ja arvoilla H1 = +5 % ja H0 = -2,5 % Bayes-tekijä on 1 000 vedolla vain 2,89. Suuremmat kertoimet: suurempi vaihtelu, suurempi epävarmuus.

Onnea on mahdotonta sulkea pois, mutta p-arvolla 4,57 % osa havainnoijista saattaisi tehdä niin. Tarvitsisimme noin 3 500 vetoa, jotta saavuttaisimme arvon BF = 100. Vastaava p-arvo on taas 0,08 % eli yksi 1 250:stä. Kertoimella 7 tarvitsemme 10 400 vetoa erittäin merkitseviä H1-todisteita varten, ja p-arvo on jälleen 0,08% (yksi 1 250:stä). Taleb ja Jeffreys ajattelevat selvästi samalla tavalla.

Bayes-tekijän käyttäminen yhteensopivuuden varmistamiseen

Voimme käyttää Bayes-tekijää eräänlaisena yhteensopivuuden varmistuksen testinä. Tällaisessa testissä, kun varsinaiset tulokset vastaavat tarkasti etukäteen ennustettua (odotettua) tulosta, tämä osoittaa, että mallimme tekee mitä sen pitäisikin tehdä.

Elokuusta 2015 alkaen olen julkaissut joukkoälymenetelmään pohjautuvia arvovedonlyöntivalintoja, joissa käytetään Pinnaclen jalkapallo-otteluiden vedonlyöntikertoimien älyä (tehokkuutta) ”todellisten” tulostodennäköisyyksien pohjana.

Menetelmän hypoteesi on, että toisen vedonvälittäjän kertoimien suhde Pinnaclen kertoimiin, joista on poistettu kate, antaa odotetun arvon. Jos esimerkiksi bet365 antaa kertoimen 2,5 Liverpoolille Manchester Cityn voittamiseen ja Pinnaclen reilu hinta on 2,4 kertoimen poistamisen jälkeen, odotettu arvo kyseiselle vedolle on 2,5/2,4 = 4,17 %. Useiden vetojen otoksen perusteella odotettu arvo on yksinkertaisesti kyseisten vetojen odotusarvon keskiarvo.

Kun vedonlyöntihistorian odotusarvo (H0) tiedetään, voimme verrata sitä suoraan todelliseen tuottoon (H1) kunkin vedon jälkeen. Mitä lähempänä odotettu tuotto ja todellinen tuotto ovat, sitä todennäköisemmin menetelmä toimii odotetulla tavalla. Bayes-tekijän avulla voimme tehdä yhteensopivuusvertailun. Mitä lähempänä yhtä arvo on, sitä paremmin odotus ja suoritus sopivat yhteen.

Aikasarja osoittaa todennäköisyyssuhteiden kehittymisen ja Bayes-tekijän aikasarjan kunkin vedon jälkeen.

Heikompi esitys ensimmäisen 1 000 vedon aikana tarkoitti, että Bayes-tekijän analyysi ei voinut sulkea pois sitä, että mallissani on jotakin vikaa, koska oli kohtalaista todistusaineistoa sille, että odotettu suoritus (H0) poikkesi huomattavasti todellisesta suorituksesta (H1). Sen jälkeen suoritus läheni odotettua keskiarvoa ja sekä LR että BF pysyivät lähellä lukua yksi. 9 681 ottelun jälkeen odotettu tuotto oli 4,18 % kun taas todellinen tuotto oli 4,02 %.

bayes-factor-in-article-4.jpg

Bayes-tekijän käyttäminen sulkemiskertoimen arvohypoteesiin

Tekstejäni tuntevat lukijat tietävät, että kannatan sulkemiskertoimen arvon (CLV) hypoteesia. Se on idea siitä, että sulkemiskerroin eli sulkemislinja (ennen katetta) on paras voittotodennäköisyyden mitta erityisesti 1X2-jalkapallokohteissa, joissa se on loistava todellisen vedonlyöntituoton ennustaja.

Liian usein vedonlyöjät uskovat virheellisesti alhaisten p-arvojen tarkoittavan taitoa, vaikka se kertoisikin vain todennäköisyyden jonkin tapahtumiselle, jos mitään taitoa ei oleteta olevan.

Jos voitat reilun sulkemiskertoimen +5 %:lla, tuotto-odotus on 5 % ja jalkapallo-otteluiden kerrointietojen suurten otosten testaaminen on paljastanut, että voitat tyypillisesti +5 %.

Tästä huolimatta olen avoin mahdollisuudelle, että tämä hypoteesi ei aina ole tarkka. Syyskuussa 2019 tutkin tenniskohteiden tehottomuutta ja tarkastelin nimellä @nishikoripicks tunnetun tennisvetovihjaajan suoritusta, joka näytti +8,6 %:n tuottoa, vaikka CLV-odotus oli -0,3 %. Tällainen poikkeavuus viittaa suuresti siihen, että CLV-hypoteesissa voi olla jotakin vikaa, ainakin tenniksen kohdalla. Voimme käyttää Bayes-tekijää selvittämään kuinka suuresti.

Olen laskenut ensimmäisessä osassa kuvaamani metodologian mukaan jatkuvan todennäköisyyssuhteen ja Bayes-tekijän kaikille vedoille @nishikoripicks-vetovihjaajan historiassa ja esittänyt ne seuraavassa taulukossa.

Tätä varten evH0:n oletetaan olevan kumulatiivinen odotettu sulkemiskertoimen arvo. Jokaista vetoa kohden lasketaan sulkemiskertoimen arvo vedonlyöntikertoimella, jonka @nishikoripicks neuvoi, suhteessa sulkemiskertoimeen, josta on poistettu Pinnaclen kate. Jos hänellä on esimerkiksi veto kertoimella 2,5 ja katteen poistamisen jälkeinen sulkemiskerroin on 2,45, hänen odotettu sulkemiskertoimen arvonsa on silloin (2,5/2,45) – 1 = 2,041 %.

Kumulatiivinen odotettu sulkemiskertoimen arvo on silloin kaikkien edeltävien vetojen keskiarvo. evH1:n oletettiin vastaavan nykyistä tuottoa kunkin vedon jälkeen, jolloin se päivitettiin vastaavasti jokaisen vedon jälkeen niin kuin evH0. Toisin sanoen @nishikoripicksin nykyistä tuottoa kunkin vedon jälkeen pidettiin parhaana mittana hänen todelliselle odotetulle arvolleen.

bayes-factor-in-article-5.jpg

Vaikka Bayes-tekijä on yleensä konservatiivisempi kuin todennäköisyyssuhde (kuten huomasimme aiemmin, kun katsoimme H1:n tietoja), ne ovat vastaavia. Noin 2 000 vedon jälkeen mallien välillä on pysyvä, erittäin merkitsevä ero sen suhteen, mitä voimme odottaa @nishikoripicksin tuotoksi. 

Hänen historiansa lopussa BF = 1 912 ja LR = 2 704. Jos oletetaan, että @nishikoripicksin todellinen tuotto on tarkka mitta hänen odotetulle tuotolleen, tämä viittaisi siihen, että sulkemiskertoimen arvon hypoteesi on erittäin todennäköisesti oikeassa tässä tapauksessa. 

Tämä Bayes-tekijän analyysi ei tietenkään kerro meille, että @nishikoripicksin todellinen tuotto on tarkka mitta hänen odotetusta tuotostaan, me vain odotimme sitä tässä analyysissa. Se vain kertoo meille, että jos näin on, se on selkeästi parempi kuin sulkemiskertoimen arvon hypoteesi.

Voi kuitenkin olla, että hän on vain ollut odotettua onnekkaampi. Ehkä hänen todellinen odotettu tuotto onkin 5 %. Tässä tilanteessa mallien H1 = +5 % ja H0 = -0,3 % vertailu näyttäisi BF:ksi vain 11,8.

Lisäksi on mahdollisuus, että Pinnacle ei vastaa @nishikoripicksin kohdetoimintaan muista syistä kuin markkinoiden tehottomuudesta johtuen. Niin kauan kuin emme tiedä, missä määrin hän lyö vetoa, missä määrin hänen asiakkaansa lyövät vetoa tai lyövätkö hänen asiakkaansa edes vetoa Pinnaclella, on mahdollista, että kertoimet eivät liiku oletetusti (eli 8,6 % + kate), koska toimintaa ei ole riittävästi niiden liikuttamiseen siinä määrin. 

Siinä missä @nishikoripicks ei liikuta kertoimia sulkemislinjan arvon hypoteesin mukaisesti, toinen vedonlyöjä, jonka historiaa analysoin artikkelissani sulkemislinjan käyttämisestä oman vedonlyöntiosaamisen testaamiseen, näyttää kertoimien liikkuvan jotakuinkin hypoteesin mukaisesti.

Tämän henkilön vuoden 2019 tennisvedonlyönnin tilastot koostuvat 2 223 vedosta, jotka näyttävät sulkemiskertoimen arvoa 2,96 % ja todellista tasaisen panoksen tuottoa 4,37 % (vaikka hänen todellinen tuottonsa olikin hieman vähemmän vaihtelevan panoskoon takia). Jos H1 = 4,37 % ja H0 = 2,96 %, silloin LR = 1,22 ja BF = 0,86, mikä viittaa siihen, ettei kumpikaan malli ole toista parempi.

Kun hänen muut lajinsa otetaan myös huomioon, hänen tilastonsa vuodelle 2019 ovat seuraavanlaiset: vetoja = 14 333; odotettu tuotto = 2,92 %, todellinen tasaisten panosten tuotto = 3,51 %, LR = 1,25, BF = 0,88.

Koska tämän vedonlyöjän näkemät kertoimien liikkumiset eivät voi esiintyä pelkästään sattumalta, nämä luvut ovat yhdenmukaisia sen suhteen, että sulkemiskertoimen arvon hypoteesi (CLVH) olisi oikeassa. Vaikka @nishikoripicks kohtaakin jonkin verran kertoimien pienemistä (noin 3 %), avoimeksi jää, miksi sitä ei näy enempää hänen todellisten tuottojensa mukaisesti.

Bayes-tekijän heikkoudet

Mielestäni Bayes-tekijän merkittävä heikkous on se, että se vastaa edelleen paljon p-arvoa, sillä se pohjautuu esiintyvien tietojen todennäköisyyksille, mikäli hypoteesi tai malli on oikeassa. Bayesilaisen tilaston todellinen onnistuminen on siinä, että se tunnistaa käänteisen tilanteen – todennäköisyyden sille, että hypoteesi on totta, näkemiemme tietojen perusteella.

Ehkä tämä hieman aliarvioi Bayes-tekijää. Alla näytetään täydempi kaava, joka pohjautuu hypoteesien oikeassa olemisen todennäköisyyteen

bayes-skill-formula9.png

P(H0) ja P(H1) ovat prioritodennäköisyydet sille, että kumpikin hypoteesi on totta, kun taas P(H1|D) ja P(H0|D) ovat posterioritodennäköisyydet sille, että H1 ja H0 ovat totta, kun havaittuja tietoja sovelletaan.

Kun P(H1) = P(H0), Bayes-tekijä on nimenomaisesti posterioritodennäköisyyksien suhde ja todennäköisyys sille, että toinen malli on toista todempi.

Bayesilaisen tilastotieteen ongelma on kuitenkin se, että usein emme tiedä, mitkä ovat prioritodennäköisyydet mallien olemiselle oikeassa. Mikä on prioritodennäköisyys sille, että sulkemiskertoimen arvon hypoteesi on oikeassa? Onko se sama kuin prioritodennäköisyys sille, että @nishikoripicksin todellinen suoritus on hyvä arvio hänen odotusarvostaan? 

Vaikka prioritodennäköisyydestä on epävarmuutta, bayesilainen analyysi on aina rajoittunut. Epäily ja epävarmuus ovat kuitenkin bayesilaisen tilastotieteen ytimessä, jossa ”totuus” ei ole absoluuttinen vaan todennäköisyyksien mukaan toimiva ja aina uusilla tiedoilla päivitettävissä. Mitä enemmän tietoa saamme, sitä lähemmäs ”totuutta” pääsemme.

Mitä olemme oppineet Bayes-tekijästä ja vedonlyöntitaidoista?

Tämä artikkelipari kertoi, kuinka Bayes-tekijää voidaan käyttää kilpailevien hypoteesien testaamiseen. Vedonlyöjä voi käyttää tätä suorituksensa arvioimiseen, esimerkiksi taito vastaan onni, miksi näin tapahtuu ja vastaako se odotusarvoa. Se tarjoaa vedonlyöjän arsenaaliin uuden työkalun, joka auttaa tunnistamaan, onko vedonlyöjällä taitoa.

Useimmille vedonlyönnin suorituksille todennäköisyyssuhde riittää varsin hyvin laskennallisesti monimutkaisemman Bayes-tekijän sijaan.

Vedonlyöntiresurssit auttavat vedonlyönnissä

Pinnaclen Vedonlyöntiresurssit-osio on yksi netin kattavimmista asiantuntevan vedonlyöntineuvonnan kokoelmista. Tavoitteenamme on auttaa kaikentasoisia vedonlyöjiä parantamaan tietämystään.