close
nov 30, 2018
nov 30, 2018

Slik løser man problemer som effektivitet: Del én

Hva er markedseffektivitet?

Hvor effektive er sluttoddsene til Pinnacle?

Modellere markedseffektivitet

Slik løser man problemer som effektivitet: Del én

Alle som er interessert i å vurdere om prognoser er effektive nok til å konsistent slå tippemarkedet, er kjent med bruken av sluttoddsene til Pinnacle. Hvor effektive er oddsene til Pinnacle, og hvordan modellerer man markedseffektivitet? Les denne artikkelen for å finne det ut.

Pinnacles Head of Trading, Marco Blume, har forklart at en av de beste indikatorene på om en tippespiller faktisk har langsiktig, positiv forventet verdi – altså om de er dyktige eller ikke – er hvorvidt de klarer å slå sluttoddsene.

Det er vanlig å anta at markedets sluttodds er de mest effektive av alle tippeodds, siden de er basert på absolutt all den tilgjengelige informasjonen om kampen. Hvis disse oddsene, etter at bookmakerens margin er tatt med i beregningen, gjenspeiler den «sanne» sannsynligheten for at noe skjer, er marginen som du slår dem med, et mål på den forventede fordelen du har.

Klarer du å slå dem med 10 %, så kan du forvente å oppnå 10 % fortjeneste på lang sikt. Andre har derimot hevdet at selv om det å slå sluttoddsene er et viktig tegn på dyktighet, er det ikke nødvendigvis obligatorisk for å lykkes. Hvis dette skal fungere, innebærer det også at sluttprisene ikke alltid er 100 % effektive.

I denne artikkelen ønsker jeg å slå sammen disse to synspunktene. Jeg vil ta en ny titt på effektivitet generelt, og spesifikt på bruken av Pinnacles sluttodds for å komme til en konklusjon. Jeg må nesten advare om at dette kan bli forvirrende lesning, siden det er et dypdykk inn i mitt statistiske tankeeksperiment.

Da jeg startet var jeg ikke sikker på hva jeg ville finne. Konklusjonene er uklare selv nå når jeg er ferdig, men prøv å holde tritt. Det blir neppe like spennende som et besøk på sjokoladefabrikken, men forhåpentligvis blir dette en produktiv reise for de som ønsker å bli dyktigere tippespillere. 

Hva er markedseffektivitet?

De siste årene har jeg snakket ganske mye om konseptet markedseffektivitet. I tippesammenheng er et marked effektivt hvis tippeoddsene gjenspeiler de reelle, underliggende sannsynlighetene for resultatene det gjelder. Hvis for eksempel den sanne sannsynligheten for at Manchester City skal ydmyke rivalen Manchester United, er 70 %, tilsier det at odds på 1,429 (ekskl. bookmakerens margin) er effektive. 

Tippemarkeder er tross alt effektive bayesianske prosessorer som kontinuerlig finpusser, oppdaterer og forbedrer sine prognoser for hvor sannsynlig det er at noe skal skje.

For en enkeltkamp er det bare to mulige resultater, og et spill på at Manchester City vinner, ender enten med gevinst eller tap. Hvis man derimot gjentar dette hundrevis eller til og med tusenvis av ganger, kanselleres effekten flaks og uflaks har på enkeltspill (de store talls lov). Derfor er det likevel meningsfullt å snakke om den sanne sannsynligheten for et gitt resultat, selv om det i praksis er umulig å vite med sikkerhet. Det er tross alt dette tippeoddsene gjenspeiler.

Markedseffektivitet er et interessant konsept når det brukes på store utvalg. For enkelthendelser blir det derimot vanskelig å finne ut hvor effektiv tippeoddsen egentlig var, siden vi ikke kan vite den sanne sannsynligheten for et gitt resultat. 

Vi kan enkelt teste et stort utvalg spill, for eksempel med 2,00 i rettferdige odds. Hvis det ender med gevinst i 50 % av dem, viser det at gjennomsnittlig vinnersjanse for de spillene sannsynligvis var 50 %, altså lå oddsene for de spillene i gjennomsnitt tett på de reelle vinnersjansene. Dette forteller oss likevel ikke noe om vinnersjansene i de enkeltspillene som gjennomsnittet er basert på. Et marked kan være effektivt som helhet, men likevel skjule underliggende ineffektivitet for enkeltspill.

Hvor effektive er sluttoddsene til Pinnacle?

I juli 2016 publiserte Pinnacle min artikkel som avslørte hvor effektive (eller presise) oddsene deres på fotballkamper er. Dette gjelder spesielt sluttoddsen, den siste oppdateringen av oddsen før kampstart.

Jeg viste at når marginen er trukket fra, vinner man omtrent 50 % av gangene man spiller på 2,00 i odds, 33 % av gangene når man spiller på 3,00 i odds, 25 % av gangene når man spiller med 4,00 i odds og så videre. Som nevnt tidligere gir dette selvsagt ingen informasjon om den reelle sannsynligheten for resultater i enkeltkamper, alt vi kan fastslå er at oddsene var relativt presise i gjennomsnitt.

Videre påpekte jeg at forholdet mellom start- og sluttoddsen til Pinnacle er en svært pålitelig indikator på lønnsomhet, noe som antyder at sluttoddsene deres er meget effektive. For eksempel ser vi at lag som startet til 2,20 (uten margin) og endte opp med 2,00 i sluttodds, vant omtrent 50 % av gangene, og at med faste innsatser ble resultatet 10 % avkastning basert på startoddsen (2,20/2,00 – 1) og 0 % basert på sluttoddsen.

På den annen side vant lag som startet til 1,80 og endte på 2,00, omtrent 50 % av gangene og hadde 10 % tap basert på startoddsen (1,80/2,00 – 1) og 0 % basert på sluttoddsen. Jeg har gjentatt denne analysen med enda større utvalgsstørrelse, hele 158 092 kamper og 474 278 tippeodds for hjemme/borte/uavgjort, og resultatene og konklusjonene er stort sett de samme. Dette vises i diagrammet nedenfor.

in-article-solve-a-problem-like-efficiency-3.jpg

Hvert datapunkt viser faktisk avkastning basert på forholdet mellom startodds/sluttodds og intervaller på 1 %. Blå punkter er avkastningen fra startodds, og røde punkter er avkastningen fra sluttodds. Det finnes tydeligvis noen underliggende variasjoner, men trendene er tydelige. Jeg har vist frem trendlinjene og ligningene for dem. Jeg valgte å sette krysningspunktene til null (kanskje et greit valg når marginen er fjernet).

Dette bekrefter nok en gang den opprinnelige hypotesen min nesten helt perfekt. Forholdet mellom startodds og sluttodds (x i diagrammet) er en meget god indikator på lønnsomheten til startoddsene (y i diagrammet), og, mer generelt sett, sluttoddsene til Pinnacle er meget effektive.

Proporsjonalitetskoeffisienten for forholdet mellom startodds og sluttodds (minus 1) og lønnsomheten (eller avkastningen) er verdien for gradienten til trendlinjen. Verdien 1 betyr perfekt proporsjonalitet. For enkelthets skyld kaller jeg denne koeffisienten OCRYCOP i resten av denne artikkelen.

Nok en gang kan vi kun vite at dette er sant når vi ser på aggregerte tall. Vi har fremdeles like lite innsikt i hvor effektive de enkelte sluttoddsene er. Hvert av datapunktene i tabellen er basert på data fra tusenvis av kamper.

Modellere markedseffektivitet

For å finne ut hvordan man kan lage et slikt OCRYCOP-diagram som viser sluttoddsenes effektivitet laget jeg en enkel modell som simulerer endringen fra startodds til sluttodds. Modellen besto av 10 000 spill med startodds/sluttodds. 

For å prøve å gjenskape usikkerheten rundt den sanne sannsynligheten for resultatene, valgte jeg å tilfeldiggjøre startoddsene med 2,00 som gjennomsnitt og 0,15 som standardavvik (σ) (noe som innebærer at omtrent to tredjedeler lå mellom 1,85 og 2,15 og omtrent 95 % lå mellom 1,70 og 2,30). 

Den sanne oddsen for hvert av spillene var dermed 2,00, men startoddsene som den hypotetiske bookmakeren i modellen min tilbød, hadde små variasjoner rundt dette snittet. Jeg valgte 0,15 som standardavvik fordi dette er omtrent det vi ser for endring mellom startodds og sluttodds i virkelige tippemarkeder når oddsen ligger på rundt 2,00.

Hvis standardavviket var 0,05, ville det antydet at for 95 % av oddsene på rundt 2,00 som ble tilbudt, ville det bare vært ±5 % avvik i nøyaktigheten. Dette virker usannsynlig lite, gitt hvor mye oddsene faktisk pleier å bevege seg. Hvis tallet var 0,3 eller høyere, ville det vist at bookmakerne var generelt dårlige til å lage odds, noe vi vet ikke er sant. 

Markedseffektivitet er et interessant konsept når det brukes på store utvalg. For enkelthendelser blir det derimot vanskelig å finne ut hvor effektiv tippeoddsen egentlig var, siden vi ikke kan vite den sanne sannsynligheten for et gitt resultat.

Det er svært usannsynlig at en bookmaker ville tilbudt 3,00 i odds hvis den sanne oddsen var 2,00. Ja, det kan faktisk skje, men det er vanligvis en åpenlys feil eller resultatet av uventet og viktig informasjon som ikke var tilgjengelig da oddsene ble laget. I slike tilfeller er det selvsagt også helt legitimt å påstå at den sanne oddsen også endrer seg. Uansett. Vi fortsetter med modellen. Jeg har laget startodds, men hva med sluttoddsen?

I teorien er sluttoddsen basert på meningene til alle som har plassert innsatser. La oss anta at til tross for at disse meningene gjenspeiler en akkumulert informasjon om den sanne sannsynligheten for resultatet, er effekten av iboende tilfeldigheter fremdeles like sterk. Dette virker åpenlyst urealistisk. Tippemarkeder er tross alt effektive bayesianske prosessorer som kontinuerlig finpusser, oppdaterer og forbedrer sine prognoser for hvor sannsynlig det er at noe skal skje, og dermed reduserer usikkerheten rundt prognosen.

For modellen vår bruker vi nok en gang 2,00 og 0,15 som henholdsvis snittodds og standardavvik. Vi kan nå beregne et forholdstall (start/slutt) for hvert sett med startodds/sluttodds. Når vi vet hva den sanne sannsynligheten er (50 %) kan vi også beregne forventet avkastning for både startodds og sluttodds for hver av de 10 000 kampene. Til slutt kan vi plotte inn hvordan forventet avkastning fra både startodds og sluttodds varierer når forholdet mellom startodds og sluttodds endres, slik jeg også gjorde for Pinnacle-kampoddsene tidligere.

Det første av de seks diagrammene nedenfor viser resultatene fra modellen. De blå og røde linjene viser 50-kampers gjennomsnittlig forventet avkastning med faste innsatser (y-aksen) for henholdsvis startoddsene og sluttoddsene, etter å ha sortert de 10 000 spillene basert på startodds/sluttodds – 1 (x-aksen). Dette ser helt annerledes ut enn Pinnacle-dataene ovenfor.

Selv om både start- og sluttoddsene jeg har satt sammen i teorien er effektive, siden de begge matcher den sanne oddsen, kan forholdet mellom startodds/sluttodds kun forklare halvparten av den forventede fortjenesten (OCRYCOP = 0,5). Hvis for eksempel forholdet er 110 %, blir resultatet 105 % (5 % avkastning) ved spill til startoddsene og 95 % (5 % tap) ved spill til sluttoddsene. 

in-article-solve-a-problem-like-efficiency-2.jpg

Det ser ut til at forholdet mellom startodds og sluttodds i dette tilfellet ikke er en god indikator for lønnsomhet, noe som viser at sluttoddsene våre ikke kan være særlig effektive. Det er en enkel forklaring på dette. Først og fremst vet vi at sluttoddsene våre ikke er effektive enkeltvis. De ligger ikke alle på den sanne prisen 2,00, siden jeg med vilje valgte å fordele dem tilfeldig rundt det tallet.

I tillegg oppstår de største avvikene mellom startodds og sluttodds når oddsgeneratoren min tilfeldig genererer lange startodds og korte sluttodds. Det største avviket som ble generert her, var 1,55 (2,27 i startodds og 1,46 i sluttodds). Når startoddsene er 2,27 og den sanne sannsynligheten er 2,00, vil forventet fortjeneste faktisk være 2,27/2,00 – 1 = 0,135 eller 13,5 %, ikke 55 % som vi fikk fra den opprinnelige hypotesen.

De andre fem diagrammene over gjentar den samme modellen, men med gradvis redusert variabilitet (standardavvik) for sluttoddsene, i intervaller på 0,03 (fortsatt med samme variasjon i startoddsene). Vi ser at når variabiliteten i sluttoddsene for den sanne oddsen 2,00 krymper, beveger verdien av OCRYCOP seg mot 1. På den ytterste enden av skalaen, der alle sluttodds er 2,00 og dermed perfekt effektive enkeltvis, er korrelasjonen 1:1.

Ta en ny titt på diagrammet fra tidligere, det med tippeodds fra Pinnacle. Trendlinjene (og ligningene for dem) passer ganske godt med eksempelet i modellen vår for perfekt korrelasjon. Vi kan likevel se at det fortsatt finnes underliggende variabilitet – noen av prikkene ligger utenfor trendlinjene. Noe av dette vil selvfølgelig skyldes effekten flaks og uflaks har på virkelige resultater (modellen min bruker forventet fortjeneste, så flaks og uflaks blir eliminert). 

Det er uansett fullstendig urealistisk at alle sluttodds skal stemme perfekt overens med de sanne oddsene. Problemet er at hvis ikke hver eneste sluttodds er perfekt effektiv, må vi godta redusert korrelasjon mellom forholdet mellom startodds og sluttodds og forventet avkastning (OCRYCOP < 1). Kan man løse dette? Det skal jeg se nærmere på i del to av denne artikkelen.

Tipperessurser – Bli en bedre spiller

Pinnacles Tipperessurser er en av nettets mest omfattende samlinger av ekspertråd for tipping. Passer for alle erfaringsnivåer, og formålet er ganske enkelt å gi kundene våre støtten de trenger for å bli bedre spillere.