Tipping påvirkes ofte av hell. Noen ganger har vi flaks, andre ganger sliter vi med uflaksen. Det er viktig å forstå hvilken rolle flaks kan ha i tipping, men hvor går egentlig skillelinjen mellom flaks og uflaks? Les videre for å finne det ut.
Sportstipping handler stort sett bare om tilfeldigheter. De som vinner, gjør det nesten bare på grunn av flaks. Bookmakerens margin og de store talls lov tar knekken på nesten alle i det lange løp. De av dere som har lest artiklene mine opp gjennom årene, vet at jeg alltid er tydelig på at tippespillere sannsynligvis ikke kan tjene penger på lang sikt. Jeg har ikke egentlig behov for at dere skal være enige, siden alle tippespillere må finne sin egen balanse mellom håp og realisme.
Som svar på denne tanken, har Pinnacle lansert Tipperessurser for å lære tippespillere å bli dyktigere til å lage prognoser. For de som faktisk klarer å oppnå forventning om langsiktig lønnsomhet, gjelder likevel sannsynlighetens regler. I denne artikkelen ser jeg nærmere på hva dette innebærer. Spesifikt vil jeg illustrere hvor lite som skiller mellom flaks og uflaks.
Det klassiske myntkastet
Alle vet at myntkast handler om 50–50 sannsynlighet: mynt eller kron. Vi vet også at hvis vi kaster 20 ganger, blir det ikke alltid 10 mynt og 10 kron, selv om det er det mest sannsynlige resultatet. Noen ganger blir det 12 mynt og 8 kron, andre ganger det motsatte. En sjelden gang kan det ende opp veldig ujevnt, for eksempel 5 mynt og 15 kron. Vi kan bruke den binomiske fordelingen for å fastslå de nøyaktige sannsynlighetene for alle de mulige resultatene. For 20 myntkast ser det slik ut.

De fleste sannsynlige resultatene ligger mellom 5 mynt / 15 kron og 15 mynt / 5 kron. Hva om vi ser på 100 myntkast? Da ser fordelingen slik ut.

Denne gangen er det større variasjonsbredde i resultatene. For 20 myntkast er det mellom 5 og 15 mynt, 10 i differanse. For 100 myntkast blir variasjonsbredden omtrent dobbelt så stor, mellom 40 og 60 mynt. Betyr det at når utvalgsstørrelsen for myntkast blir større, vokser også variasjonsbredden for mulige resultater? Vel, både ja og nei.
Da matematikeren Jacob Bernoulli eksperimenterte med et slikt scenario, observerte han at til tross for at den absolutte differansen mellom antall mynt og antall kron blir større når utvalgets størrelse øker, beveger prosentandelen mynt seg mot 50 %. 5 mynt på 20 kast er 25 %, mens 40 mynt av 100 kast faktisk er 40 %. Denne andre forklaringen, som er grunnlaget for de store talls lov, er et viktig aspekt av tippespilleres forståelse av sannsynlighet.
Det binomiske standardavviket
Vi kan bruke standardavviket for å måle variasjonsbredden eller spredningen i en fordeling. For en binomisk fordeling gis normalfordelingen, σ, av følgende enkle ligning.
n er antallet binære repetisjoner (f.eks. myntkast), p er sannsynligheten for suksess (mynt), og q er sannsynligheten for fiasko (kron). Siden p + q = 1:
I tilfelle p = q (altså 0,5):
For 20 myntkast er σ = 2,24, og for 100 myntkast er σ = 5.
Standardavviket gir oss variasjonsbredden for de mest sannsynlige resultatene. Hvis vi bruker 100 myntkast som et eksempel, vil litt mer enn to tredjedeler av utvalgene ligge mellom ±1σ, altså mellom 45 og 55 mynt.
Vi har bekreftet det første funnet til Bernoulli: jo større utvalget er, desto større blir den absolutte spredningen. Men hva om vi ser på prosentandelen mynt i stedet for absolutte tall? For å beregne prosentandelen mynt deler vi antallet mynt på det totale antallet myntkast, n. For å beregne standardavviket i prosent må vi dele på n.
For enkle 50–50-situasjoner blir det slik:
For 20 myntkast er standardavviket for prosentandelen mynt 0,11 (eller 11 %), men for 100 myntkast er det bare 0,05 (eller 5 %).
De store talls lov
Ifølge de store talls lov skal gjennomsnittsresultatet man får fra en serie forsøk, bevege seg mot den forventede verdien etter hvert som man utfører flere forsøk. For myntkast betyr dette at jo flere ganger vi kaster mynten, desto nærmere vil prosentandelen mynt være den forventede verdien 50 %.
Siden standardavviket i prosent er proporsjonalt med kvadratroten av antallet myntkast, har disse to variablene derfor et potensforhold, der standardavviket varierer basert på logaritmen for antallet myntkast. I et log-log-diagram vises dette forholdet som en rett linje. Hver gang man kvadrerer n, halveres verdien av σ.
Dette potensforholdet betyr at hvis man ser på proporsjonene, oppstår mesteparten av fallet i standardavviket i de første to-tre forsøkene. Fra σ = 0,5 etter 1 myntkast, faller det til bare 0,1 etter bare 25 kast, fire femtedeler av avstanden mot grenseverdien 0 (som man når etter et uendelig antall kast). Dette viser tydelig hvor raskt de store talls lov egentlig fungerer. Hvis vi tegner diagrammet over på nytt i lineær skala, ser vi denne hastigheten tydeligere.
Gevinster og tap i tipping
Gevinster og tap i tipping har mye til felles med mynt og kron i myntkast. Et veddemål er i bunn og grunn et binært forhold: Man enten vinner eller taper. For de enkleste tippestatistikkene, der det alltid er samme forventede sannsynlighet for hvert spill, blir også de mulige resultatene fordelt binomisk.
Et åpenlyst eksempel på et slikt binært forhold er poengspredning-spill på et sportsmarked i USA eller et asiatisk handikap-spill på fotball der man bruker et handikap på et av lagene for å forvandle spillet til et 50–50-spill med 2,00 i rettferdige odds.
Det er likevel ikke nødvendig å begrense oss til 50–50-spill. Tenk på ligningen over, der vi så på standardavviket i prosent. En mer generell versjon der du kan se på andre mulige forventede vinnersjanser, ser slik ut.
Selv for dyktige tippespillere som klarer å oppnå langsiktig, positiv forventet verdi, blir mesteparten av aktiviteten tilfeldig støy rundt et relativt svakt signal, fordi det er så mye iboende variasjon i komplekse systemer som sportsarrangementer.
I virkelighetens verden klarer mindre dyktige tippespillere selvfølgelig ikke å gå i pluss ved å nå forventningene. Når man tar med bookmakerens margin i beregningen, er det stort sett uunngåelig at man ligger i minus etter 1000 spill.
Tenk deg en tippespiller som spiller 50–50-spill og vinner 55 % av dem på lang sikt. De har forskjøvet forventet vinnersjanse fra 50 % til 55 % ved å bli dyktigere til å lage prognoser, men de samme, binomiske reglene for varians gjelder fremdeles.
Med ligningen over kunne vi vise at standardavviket i gevinstraten for spillene deres skal være 3 % etter 275 spill, noe som antyder med omtrent to tredjedelers sikkerhet at gevinstraten deres blir på mellom 52 % og 58 % for det antallet spill.
Gitt at vi fortsetter å spille ukompliserte spill med samme forventede gevinstrate (odds) for hvert spill, kan vi bruke den binomiske fordelingen til å fastslå med relativt stor sikkerhet hvor sannsynlig det er at noe skjer (I Excel kan dette gjøres med funksjonen BINOM.FORDELING på norsk eller BINOMDIST på engelsk).
Jeg har illustrert dette nedenfor for et utvalg tippehistorikker. Den første består av bare 20 spill. De numeriske verdiene som er plottet, viser den akkumulerte sannsynligheten for at den reelle gevinstraten er høyere enn en spesifikk verdi. For eksempel er det omtrent 9 % sjanse for at du vinner flere enn seks spill (30 %) hvis den langsiktige forventningen er 20 %. Det er omtrent 1 % sjanse for å vinne 20 av 20 hvis du normalt sett forventer å vinne 16.
De røde og grønne sonene, generelt sett, er sonene for henholdsvis tap og fortjeneste når oddsene er rettferdige. Det er ikke overraskende at hvis du taper flere spill en du forventer, taper du penger totalt sett, men du ser at det ikke er så vanlig å oppleve betydelig lavere resultater enn normalt.
Selv etter bare 20 stykk 50–50-spill kan du forvente å vinne minst ni av spillene i tre fjerdedeler av tilfellene. De store talls lov er på din side, og beskytter deg mot muligheten for betydelige prosentvise tap.
Det omvendte er også sant. Hvis du vinner flere spill en du forventer, oppnår du fortjeneste, men det er usannsynlig at du vil tjene store penger. Selv om du er en dyktig tippespiller som kan oppnå 55 % gevinstrate for 50–50-spill i det lange løp, er det uansett bare 13 % sjanse for at du vinner 14 eller flere av 20. Nå motarbeides du av de store talls lov, så du får ikke muligheten til å oppnå store prosentvise økninger.
Det gule området viser mer eller mindre det området der tippespillere går i null. Det interessante er å se hvor smal sonen mellom flaks og uflaks egentlig er, og hvor de fleste tipperesultatene vil ende opp.
Se hva som skjer med det gule området etter 100 spill.
Sjansen for at du ender opp med betydelig differanse fra den langsiktige forventningen, har blitt betydelig redusert. Hva med etter 1000 spill?
I virkelighetens verden klarer mindre dyktige tippespillere selvfølgelig ikke å gå i pluss ved å nå forventningene. Når man tar med bookmakerens margin i beregningen, er det stort sett uunngåelig at man ligger i minus etter 1000 spill. De store talls lov har knust deg fullstendig. For dyktige tippespillere derimot, ser ting helt annerledes ut.
Hvis du forventer å vinne 55 % av 1000 stykk 50–50-spill, vinner du nesten alltid minst 50 %. Gitt at bookmakerens margin er mindre enn differansen mellom gevinstraten som du forventer å ha, og gevinstraten som bookmakeren forventer, har du gode sjanser til å oppnå fortjeneste på lang sikt. Det respekterte nettstedet ProfessionalGambler.com får virkelig frem poenget:
«Det er ganske liten forskjell mellom hvor mange prosent av spillene sine en vellykket sportstipper vinner, og hvor mange prosent av spillene sine en kronisk tapende sportstipper vinner.»
Nå ser du hvor liten den egentlig er. De store talls lov har virkelig potensiale til både å bli en forbannelse og en velsignelse for en tippespiller.
Selvfølgelig er som oftest det mer kompliserte situasjoner når folk tipper i virkeligheten, enn det som vises i denne artikkelen. Tippespillere velger et mye bredere utvalg odds og innsatser. For å analysere disse, må vi bruke betydelig mer sofistikerte regnestykker, eller prøve vår gamle venn Monte Carlo-simuleringen når dette blir for komplisert.
Jeg har heller ikke sett på variansen i faktisk fortjeneste og tap, som også er et interessant emne. Jeg har sett på dette i tidligere artikler (jo lengre oddsene er, desto større blir variansen i fortjeneste og tap).
Formålet med denne artikkelen er uansett å vise hvor raskt de store talls lov trer i kraft og hvor stor betydning den har, og hvor lite som skiller mellom forventede og faktiske resultater og flaks og uflaks.
Teste påliteligheten til tippehistorikker
Før jeg går videre, vil jeg gjerne vise hvordan man kan bruke informasjon om standardavviket for faktiske gevinstrater for å teste påliteligheten til tippehistorikkene som presenteres av tipperådgivere som ønsker å selge deg valgene sine.
Vi kan bruke et firma som tilbyr en «ærlig og åpen tilnærming» til «handikapmetodene» sine, som eksempel. Firmaet er tydeligvis klar over at tilfeldigheter spiller en rolle i tipping, siden de forklarer kundene sine at det ikke finnes garanterte vinnere og at «det er alltid et element av flaks i alle konkurranser». Likevel har de tydeligvis klart å overliste denne effekten, når de har en publisert gevinstrate på 76 % av over 11 000 valg.
Ifølge de store talls lov skal gjennomsnittsresultatet man får fra en serie forsøk, bevege seg mot den forventede verdien etter hvert som man utfører flere forsøk.
Hvis vi ser nærmere på resultatene de har publisert frem til dags dato, ser vi faktisk en gevinstrate på 75 % basert på 10 312 valg (det mangler tydeligvis noen resultater). Selv om det finnes noen spill med korte og lange odds, har 94 % av spillene mellom 1,67 og 2,50 i odds (altså 60 % og 40 % antydet vinnersjanse). Den gjennomsnittlige antydede vinnersjansen for hele utvalget, er 52,2 %. Etter at bookmakerens margin er fjernet, er dette så tett på 50-50-spill at det omtrent er det samme.
Ved å fordele resultatene på 56 månedlige utvalg (fra mars 2014 til oktober 2018) ser vi at gjennomsnittlig antall spill per måned er 184, og at det ble spilt mellom 140 og 224 spill i over halvparten av månedene. Hva bør de månedlige gevinstratene variere med hvis vi antar at langsiktig forventet gevinstrate er 75 %? Ved å bruke den tidligere nevnte ligningen til å beregne forventet standardavvik for gevinstraten for et utvalg på 184 spill, finner vi at svaret er litt over 3 %. Litt over to tredjedeler av utvalgene bør ligge mellom 72 % og 78 %, og 95 % av utvalgene bør ligge mellom 69 % og 81 %.
Standardavviket for månedlige gevinstrater er faktisk 8,6 % høyere enn det bør være. Færre enn 40 % av verdiene ligger innenfor ±1σ av 75 %, og bare halvparten ligger innenfor ±2σ. Det er rett og slett alt for mye varians. Selv om vi antok at det bare var 32 spill hver måned, resultatet fra måneden med færrest spill, ville standardavviket fremdeles bare vært 7,7 %.
Et standardavvik på 8,6 % for månedlige gevinstrater er det man forventer av et utvalg for 25 spill, ikke 184. I desember 2014 var det 151 spill, og gjennomsnittlig forventet gevinstrate var 51,4 %. Gevinstraten på 46,4 % skal i teorien oppstå én gang i løpet av en million milliarder år. I oktober 2015 var det 168 spill (gjennomsnittlig forventet gevinstrate var 48,5 %), og 154 av dem var vinnere (91,7 %). En dyktig tippetipser kan normalt sett bare forvente å oppnå dette omtrent én gang på en million år.
Jeg tror du selv kan tenke deg frem til hva disse funnene antyder. Kanskje det viser at dyktighetsnivåer kan variere dramatisk i løpet av korte perioder. Kanskje det beviser noe annet. Gitt hva jeg tidligere har sagt om begrensningene til forventet fortjeneste derimot, tror jeg nok du allerede var klar over at en handikap-gevinstrate på 76 % er relativt latterlig.