jan 15, 2019
jan 15, 2019

En ny titt på tilfeldighet i tipping

Hvilke kilder er det til usikkerhet?

Vi tester tilfeldighet med en ekte tippemodell

Måle avvik fra forventningene

En ny titt på tilfeldighet i tipping
Sportstippere som ikke forstår tilfeldighetenes effekt i tipping, er dømt til å tape på sikt. Hvordan finner vi tilfeldigheter i tipping, og hvordan kan du teste hvor stor del av resultatene som skyldes tilfeldigheter? Les videre for å finne det ut.

I en av de første artiklene jeg skrev for Pinnacle, for nesten tre år siden, gikk jeg gjennom konseptet tilfeldighet i tippesammenheng. I denne artikkelen skal jeg ta en ny titt på dette.

Tipping handler selvsagt først og fremst om resultater, men fortjenester og tap seiler på en sjø av sannsynlighetsregning. Oddsene til en bookmaker gjenspeiler den underliggende sannsynligheten – sjansen for at noe skal skje. Tippespillere prøver alltid å lage bedre prognoser, og målet er å finne positiv forventet verdi.

Likevel, som Pinnacles tradingdirektør Marco Blume minte oss på i en nylig Pinnacle-sponset podcast om tipping, vet du bare om du har vunnet eller tapt. Du vet egentlig aldri om prognosen din var god eller dårlig, i det minste for enkeltspill.

Kilder til usikkerhet

Det sies at det finnes to kilder til usikkerhet i tipping. Først og fremst kan modellen din gi en sannsynlighetsberegning som er presis, men resultatet kan kun bli binært. Er du heldig, vinner du, er du uheldig, taper du. 

Den franske matematikeren Pierre-Simon Laplace mente at flaks og hell kun gjenspeiler manglende kunnskap om noe. Tilfeldigheter er derfor bare en illusjon. Han hevdet at hvis man «hadde presis kunnskap om alle naturkreftene og alle posisjonene til alle naturens bestanddeler», ville ingenting være ukjent og alle sannsynlighetsberegninger ville blitt redusert til nuller eller ettall. Dette gir relativt god mening, logisk sett. 

Hvis du vinner/taper mer enn du mener at du burde gjøre, kan det skyldes at du har hatt flaks/uflaks, at modellen din er dårlig eller en kombinasjon av begge deler.

Dette tankesettet er grunnlaget for Brier score-metoden, et forsøk på å evaluere hvor gode prognoser er. Praktisk sett derimot, er sportskonkurranser så kompliserte systemer at det er umulig å utføre dataanalysene som trengs for å oppfylle drømmen til Laplace. Kaosteorien hevder at små variasjoner i utgangspunktet kan føre til enormt store forskjeller i resultatene. Det er umulig å ha nok informasjon til å være sikker.

Men ikke bare det, fysikkens regler for svært små ting (på atomisk og subatomisk nivå) er så kompliserte at dette ikke bare er praktisk umulig å gjennomføre, det er fundamentalt umulig. Heisenbergs usikkerhetsprinsipp forteller oss at det er fysisk umulig å fastslå både posisjonen og bevegelsen til et element samtidig. Ikke bare fordi du mangler informasjon, men fordi det er slik virkeligheten fungerer på et grunnleggende nivå.

Hvis det er umulig å vite med sikkerhet hvilken tilstand et element er i nå, hvordan kan man da klare å forutsi hva som vil skje med det i fremtiden? Man kan kanskje påstå at den subatomiske verden ikke har så mye å gjøre med hva som skjer i tipping. Siden verdenen vi lever i er basert på dette, er det likevel ikke så dumt å innse at effekten er betydelig. Det finnes også visse forskere som allerede har gjort det.

Gitt disse praktiske og teoretiske begrensningene, er det fullstendig akseptabelt å tenke på tilfeldigheter og flaks som iboende i systemet som skal analyseres, og at genuint ikke-binære sannsynlighetsgrader er et nyttig konsept.

Den andre kilden til usikkerhet er validiteten til selve prognosemodellen. Hvordan kan du egentlig vite om din vurdering av sannsynligheten for et resultat var korrekt? Som Marco hintet til kan man ikke besvare det spørsmålet basert på om man vinner eller taper enkeltspill.

Det føles kanskje bra å vinne et spill med 2,00 i odds, men resultatet betyr ikke nødvendigvis at vår prognose på 55 % vinnersjanse var korrekt. Hva om du spilte 1000 slike spill og vant 45 % av dem? Da er det rimelig å hevde at i gjennomsnitt var prognosene dine dårlige. Hva om du vant 65 % av disse 1000 spillene? Du vinner riktig nok stort, men modellen er vel akkurat like dårlig?

Det er relativt umulig å skille mellom disse to kildene til usikkerhet. Hvis du vinner/taper mer enn du mener at du burde gjøre, kan det skyldes at du har hatt flaks/uflaks, at modellen din er dårlig eller en kombinasjon av begge deler. I resten av artikkelen skal jeg på nytt gå gjennom hva dette innebærer for hvordan vi tenker på vår egen tippehistorikk.

En ekte tippemodell

De av leserne som følger meg på Twitter, er nok kjent med mitt Wisdom of the Crowds-tippesystem. Dette er ikke et sofistikert system som gir smarte tippetips. Det er rett og slett så enkelt som å anta at Pinnacle vet best når det gjelder tippeodds. Hvis vi så fjerner marginen deres, får vi det som kan kalles sanne odds, som gjenspeiler de faktiske sannsynlighetsgradene for resultatene av fotballkamper. 

Teorien om at en tippemodell, selv en som fungerer bra, skal klare å matche forventningene til enhver tid, eller selv av og til, bør være lagt permanent død.

I mine siste par artikler har jeg innrømmet at Pinnacle ikke alltid har rett, fordi oddsene deres ikke er 100 % effektive. I gjennomsnitt derimot, for utvalg av odds, er det gode grunner til å hevde at de har det. Hvis vi vet hva de sanne oddsene er, handler det bare om å finne odds et annet sted som er lengre. Hvis modellen er korrekt i det lange løp, bør vi oppnå en fortjeneste som tilsvarer fordelen vi har. La oss se på dataene.

Siden jeg begynte å publisere forslag til verdifulle valg i august 2015, har det vært 7432 av disse, med 3,91 i gjennomsnittlige odds (minimum 1,11, maksimum 67, median 2,99) og 4,17 % i gjennomsnittlig forventet verdi (noe som antyder 104,17 % avkastning på investeringen).

Fortjenestehistorikken under viser hvordan de faktiske resultatene har vært sammenlignet med forventningene, basert på faste innsatser med én enhet per spill.

revisiting-randomness-in-article-1.jpg

Den faktiske utviklingen til fortjenesten bekrefter, om det skulle være nødvendig, at de små talls lov kan være ganske misvisende, selv når de små «små» tallene det dreier seg om, faktisk er ganske store. Flere ganger underveis kunne man argumentert for at det var lurt å kaste inn håndkleet. Den største reduksjonen i midten varte faktisk i over 2000 spill. Likevel, til tross for en del oppturer og nedturer over forskjellige tidsskalaer, ligger resultatet som helhet faktisk ganske nært forventningen. Den reelle avkastningen er 103,80 %.

Dette antyder at modellen fungerer i gjennomsnitt. På kort sikt derimot, kan vi ikke være sikre på at modellen fungerer som den skal. Som vi forklarte tidligere, kan vi likevel ikke skille mellom tilfeldig flaks og uflaks og tilfeldig variasjon i over- og underprestasjoner fra prognosemodellen. La oss ta en titt på hvordan de reelle resultatene avviker fra forventningene.

Måle avvik fra forventningene

Den enkleste måten å måle avvik fra forventninger på (altså skille mellom den blå og den røde linjen hvor som helst i tippehistorikken) er å regne ut forskjellen mellom forventet fortjeneste og faktisk fortjeneste.

For enkeltspill er ikke dette så nyttig, da vi vet om de vinner (fortjeneste = odds – 1) eller taper (fortjeneste = –1). Det hadde rett og slett blitt for mye variasjon til at det hadde gitt mening. For større utvalg derimot, begynner vi å se mønstre. Her er historikken for avvik fra forventningene for en gjennomsnittlig serie på 100 spill.

revisiting-randomness-in-article-2.jpg

Det ser ganske kaotisk ut, for å si det mildt. Det er store mengder over- og underprestasjoner på over ± 20 % for perioder med 100 spill, i ett tilfelle over 70 %.

Som nevnt vet vi ikke hvor mye av denne variansen skyldes at modellen avviker fra det den burde gjøre for denne tidsperioden og hvor mye som bare skyldes flaks og uflaks. Det eneste vi kan si med sikkerhet, er at det er mye varians, og sannsynligvis skyldes alt tilfeldigheter. 

Hvordan ser det ut for en lengre periode? Her er samme data for spillserier på 1000 spill. 

revisiting-randomness-in-article-3.jpg

Ikke overraskende er det mindre varians, og avvikene er mindre, men det er likevel betydelige mengder varians, og perioder med under- og overprestasjoner som varer flere tusen spill. Maksimal overprestasjon for 1000 spill er 15 %, mens maksimal underprestasjon er –11%

Hva er sannsynligheten for at disse avvikene skal oppstå? Hvis vi kaster en mynt 100 ganger, forventer vi at det blir 50 mynt og 50 kron, siden dette er det mest sannsynlige resultatet. Det er enkelt å beregne sannsynligheten for at det blir 40 mynt og 60 kron, eller omvendt. Vi kan gjøre det samme for tippehistorikken vår.

Jeg brukte min versjon av t-testenfor å måle sannsynligheten for avvik fra forventningene, men det kan like gjerne gjøres med Monte Carlo-simuleringen. Jeg gjorde faktisk begge deler, og resultatene var tilsvarende. Først tidsserien for 100 spill i løpende gjennomsnitt. Sannsynlighetene presenteres som 1-til-X sannsynlig, og skalaen er logaritmisk.

revisiting-randomness-in-article-4.jpg

Igjen ser vi en god del variasjon, og av og til er avvikene ganske ekstreme. Det skjedde flere ganger at et utvalg på 100 spill hadde så stort avvik fra forventningene at det teoretisk sett bare skulle skjedd 1 av 100 ganger. I ett av utvalgene var faktisk avviket hele 1 til 5000. Likevel er det sannsynlig at alt dette bare skyldes tilfeldigheter.

Her er samme data for spillseriene på 1000 spill.

revisiting-randomness-in-article-5.jpg

Teorien om at en tippemodell, selv en som fungerer bra, skal klare å matche forventningene til enhver tid, eller selv av og til, bør være lagt permanent død. For det meste gjør den ikke det, ofte i meget stor grad. 

Smarte tippespillere vet selvfølgelig at tipping er en langsiktig affære, der snittet på lang sikt er det eneste som betyr noe. De holder ut perioder med tilfeldigheter, enten det gjelder flaks og uflaks eller lyter i modeller, på kort sikt. Forhåpentligvis har jeg nok en gang fått til å vise, som i min første artikkel om tilfeldighet, at dette dreier seg om perioder ikke bare med 10 eller 100 spill, men selv mange tusen.

Tipperessurser – Bli en bedre spiller

Pinnacles Tipperessurser er en av nettets mest omfattende samlinger av ekspertråd for tipping. Passer for alle erfaringsnivåer, og formålet er ganske enkelt å gi kundene våre støtten de trenger for å bli bedre spillere.