apr 4, 2017
apr 4, 2017

Å bli en vellykket spiller: Et spørsmål om flaks eller dyktighet

Flaks og dyktighetens paradoks

Mennesker og roboter mot flaks: Hvem vinner?

Når går tipping over til å handle om dyktighet?

Å bli en vellykket spiller: Et spørsmål om flaks eller dyktighet

Tipping handler om å sikre positiv forventet verdi for å skape konsistent fortjeneste. I denne prosessen må tippespillerne evaluere hvilken effekt tilfeldigheter og flaks har på resultatet for enhver hendelse. Denne artikkelen tar for seg hvorvidt suksess i tipping er et spørsmål om flaks eller dyktighet. Les videre for å finne ut mer.

Målet med Squares & Sharps, Suckers & Sharks var å se på hvorvidt og hvordan noen tippespillere er flinkere til å oppnå fortjeneste enn andre er. Mirio Mella har tidligere vist hvordan folk fra visse bakgrunner har bedre sjanser til å bli vellykkede tippespillere enn andre, for eksempel aktuarer, finansmeglere og profesjonelle gamere. I denne artikkelen skal vi skape et mer generelt overblikk over hvorvidt evnen til å lykkes som tippespiller handler om flaks eller er en egenskap som kan trenes opp.

Flaks og dyktighetens paradoks

Det meste av det som foregår i spillmarkeder handler om tilfeldighet. Dette er jo ikke akkurat det en tippespiller ønsker å tro. Greit nok, kasinospill som rulett og terning er rent flaksdrevne spill, som er underlagt enkle sannsynlighetseffekter. Men i sportsgrener der sannsynligheten for de forskjellige resultatene i utgangspunktet er ukjente, må det vel finnes muligheter for forventet lønnsomhet, eller hva? Joda, teknisk sett så gjør det det, siden det er mulig å være bedre til å finne og behandle nyheter og informasjon enn det andre er. I realiteten, derimot, er dette kun mulig for et lite antall spillere, på grunn av en effekt som kalles dyktighetens paradoks.

Generelt sett kan man si at jo færre poeng/mål det er i sporten og jo flere spillere som deltar, desto større rolle spiller flaksen.

Når prognosejobben forvandles til et våpenkappløp mellom spillere som bruker stadig mer sofistikerte prognosemetoder for fremtidige sportsarrangementer, blir kanskje dyktighetsnivået høyere generelt sett, men relativt sett står man likevel på stedet hvil.

Fra et absolutt perspektiv blir prognoseevnene bedre, men forskjellen mellom de dårligste og de beste blir faktisk mindre. Tipping er en arena der dyktighet og flaks kombineres, så hvis variansen i dyktighetsnivåene synker, blir flaksens rolle viktigere. Når man så tar med kostnaden for spillet (bookmakerens margin) i beregningen, ser man at de fleste av oss sannsynligvis vil ende opp i minus i det lange løp.

Tipperoboter mot tilfeldighet

Fotballprognosetjenesten Botprediction.com har en fin metode for å vise effekten av tilfeldighet i tipping. De driver over 40 000 tippeprognoseroboter for tippemarkedet for totalt antall mål, og ser på dem som en stor gruppe tippespillere.

"Statistisk sett ser man alltid store vinnere og store tapere i den gruppen. Prognoseprogramvaren vår lar deg følge de få av vinnerne som har seiersandel på over 70 %"

For noen år siden fant jeg ut at jeg skulle analysere resultatfordelingene for disse robotene for en 5-ukersperiode. Dette ble resultatet.

luck-skill-inarticle1.png

I bunn og grunn var det ingen forskjell mellom det robotene gjorde og resultatene fra tilfeldige myntkast. Ideen om at man kan følge en av de robotene som gjør det best og forvente at den skal fortsette å prestere på samme nivå er bare tull. Det finnes ingen som helst konsistens mellom ytelesen for forskjellige 5-ukersperioder. Robotenes suksessrater vil rett og slett ha regresjon til middelverdien. Alt som skjer baseres kun på tilfeldighet.

Mennesker mot tilfeldighet

Hvis robotene bare velger tilfeldige resultater å spille på, kan vi selvfølgelig ikke vente noe annet enn dette resultatet. La oss derfor erstatte robotene med mennesker, for en gangs skyld! Det virker logisk at vi får et annet resultat, siden mennesker ikke velger tilfeldig.

I tillegg til analysen over har jeg også analysert en stor gruppe tippespillere (6044) som plasserer innsatser (1 073 029 til sammen) på sportstippingsfellesskapet Pyckio.com. Ved å analysere resultatene i forhold til verdien t-poeng, et statistisk mål for forholdet mellom tipperesultater og markedets forventning basert på oddsene til Pinnacle, ser man at resultatene fordeler seg slik.

luck-skill-inarticle2.png

Vi ser en normalfordeling i tipperesultatene, et klart tegn på at det vi analyserer stort sett er tilfeldig. Joda, det finnes gode og dårlige tippespillere, men fordelingen er svært lik den vi hadde fått om vi rett og slett hadde bedt dem om å bruke myntkast for å velge hva de skal spille på, selv om de alle og enhver ville hevdet at de brukte sine egne, sofistikerte metoder for å velge ut spillene sine.

En dyktig, men uheldig pokerspiller kan ende opp i minus selv etter 100 000 runder, som tilsvarer 40 timer pokerspill i uken i nesten to år.

De fleste av spillerne som analyseres, er altså bare heldige eller uheldige, ikke dyktige eller dårlige. For å fremheve dette poenget enda mer fordelte jeg resultatene til de 249 spillerne som har flere enn 1000 spill i historikken, inn i to like store grupper og korrelerte resultatene fra den første gruppen med resultatene fra den andre.

Hvis det var tegn til at tippespillerne var dyktigere enn det man kan forvente fra tilfeldighet og flaks, skulle resultatene ha holdt seg på samme nivå. Hvis en dyktig tippespiller hadde 3 t-poeng for de første 500 spillene sine, er forventningen omtrent 3 t-poeng også for de neste 500 spillene. Slik ser korrelasjonene ut i en spredningsgraf.

luck-skill-inarticle3.png

En R2 på 0,0019 betyr at bare 0,19 % av variasjonene i resultatene til den andre halvdelen av disse 249 tippespillerne kan forklares av variasjonen i den første halvdelen. Implikasjonen er at alt som gjenstår, skyldes tilfeldighet. Samlet sett ser vi ikke konsistente prestasjonsnivåer fra disse tippespillerne. Akkurat som Botpredictions robot er det kun snakk om regresjon til middelverdien. Det betyr ikke nødvendigvis at det ikke finnes noen dyktige tippespillere, men heller kanskje at de få spillerne som virkelig er dyktige, forsvinner blant støyen av tilfeldighet.

Forholdet mellom flaks og dyktighet

I boken The Success Equation: Untangling Skill and Luck in Business, Sports, and Investing, definerer Michael Mauboussin forholdet mellom flaks og dyktighet som en skala der man kan plassere forskjellige aktiviteter. Ytterst på flaks-siden av skalaen finner vi ting som rulett og lotterier. På den andre enden av skalaen finner vi rene dyktighetsspill, som sjakk. De fleste lagidretter befinner seg et sted på midten.

Generelt sett kan man si at jo færre poeng/mål det er i sporten og jo flere spillere som deltar, desto større rolle spiller flaksen. Hva med gambling? Mauboussin plasserer ting som investering, tipping og poker mye nærmere flaks-siden enn dyktighet-siden. Fordelingen av resultatene til tippespillere som vises over, støtter opp om dette valget. 

Dyktighetsfremmende forhold

Oppbygging av ekspertise og dyktighet er ofte basert på det som kalles "naturalistisk beslutningstaking", der datasett og datamønstre memoriseres og hentes frem periodisk gjennom en langvarig prosess med øvelse og tilbakemelding. For at dette skal fungere, må forholdene være stabile og regelmessige nok til at de blir forutsigbare, slik at man kan gjøre en meningsfull kobling mellom årsak og effekt. Det er åpenlyst at man finner slike forhold i situasjoner der folk trener på tennis eller øver seg på sjakk. Kan man si det samme om sportstipping?

Når man konkurrerer under forhold der flaksen dominerer, bør man fokusere på prosessen man bruker for å fatte beslutninger, ikke på selve resultatene.

Problemet med å øve seg på å lage prognoser er at innen tipping blir man ikke nødvendigvis belønnet for å gjøre dette. Det er kanskje sant at jo mer tid og innsats jeg legger i utvikling av prognoser for sportsresultater, desto dyktigere blir jeg til dette. For sportstipping handler dessverre dyktighet ikke bare om å velge vinnere, men også om hvorvidt vi er flinkere til å velge vinnere enn alle andre er.

Dyktighetens paradoks viser at tipping er en nullsum-aktivitet der relativ dyktighet er nøkkelen. Når tippespillere konkurrerer mot hverandre i et marked, er det viktigste aspektet det å evaluere hvorvidt den tilgjengelige informasjonen allerede er tatt med i beregningen av de tilgjengelige oddsene, og dette må gjøres konsistent.

Hvis andre tippespillere som er like dyktige allerede har presset oddsen til en pris som virkelig representerer den "sanne" sannsynligheten for et gitt resultat (en prosess som kalles "prissøking"), slik at hvorvidt man vinner eller taper kun handler om tilfeldighet. Hvis tippemarkeder stort sett er effektive, altså at de gjenspeiler de "sanne" sannsynlighetene for resultatene, er det tydeligvis svært begrensede muligheter for å slå den såkalte mengdens visdom

Nullsum-forhold?

Validitet er et mål på hvorvidt vi tror at årsaken faktisk er den sanne årsaken og hvorvidt målene våre gjentatte ganger peker mot den konklusjonen. Samlet sett bestod ikke analysen vi gjorde av sport-tippespillere tidligere, de grunnleggende testene av konsistens og validitet. Dette peker sterkt mot at forholdene – altså tippemarkedet – som sport-tippespillere gambler i, verken er stabilt eller forutsigbart, men rett og slett domineres av tilfeldighet. 

I situasjoner der mye tilfeldighet bryter sammenhengen mellom dyktighet (årsaker) og fortjeneste (effekter), kan en dyktig spiller tape penger mens en (relativt sett) dårlig spiller kan oppnå fortjeneste.

Tippemarkeder er komplekse og stort sett tilfeldige, siden nyhetene som driver oddsbevegelsene når markedet på tilfeldige måter. Hvis det ikke var tilfeldig, ville det ikke vært nyhetsverdig. Denne typen tilfeldighet bryter korrelasjonen mellom årsak (noe tippespilleren gjør for å prøve å vinne penger) og effekt (en faktisk økning i tippespillerens gevinster).

Konsekvensen av dette er at det er begrensede muligheter for tilbakemelding. Siden tilbakemeldinger er oljen som smører maskineriet til bevisst øving, er det lite sannsynlig at man kan bygge seg opp ekspertise ved å bygge opp tippeerfaring. For å sette dette i perspektiv, kan du se for deg hvordan det er å øve på rulett.

Dette peker sterkt mot at forholdene – altså tippemarkedet – som sport-tippespillere gambler i, verken er stabilt eller forutsigbart, men rett og slett domineres av tilfeldighet.

På samme måte, i tipping, innebærer den prissøkende prosessen som er implisitt i balanseringen av meninger om et resultat i sport, nødvendigvis at det å etablere årsakssammenhenger mellom beslutninger og resultater stort sett er gjetting. Daniel Kahneman, Nobelprisvinner og forfatter av boken Thinking, Fast & Slow, beskriver dette som nullsum-forhold. Dette påvirker selvsagt ikke den oppfatningen de fleste tippespillere har av at fortjenesten de får, skyldes tingene de gjorde. Denne typen overdreven selvtillit (en av de mange grunnene til at vi gambler) er i hovedsak resultatet av en illusjon om validitet.

Når går tipping over til å handle om dyktighet?

Kanskje vi har stilt feil spørsmål. Kanskje det egentlig ikke er et spørsmål om hvorvidt et spill handler om dyktighet, men heller om på hvilket punkt det går over til å handle om dyktighet. Når både flaks og dyktighet er tilstede i spill som involverer repetisjon, øker den relative betydningen av dyktighet med antallet repetisjoner.

Tennis er et åpenlyst eksempel på en sportsgren med mange repetisjoner. 53 % sjanse for å vinne ett enkelt poeng betyr 85 % sjanse for å vinne en kamp med fem sett. Poker er et annet. Hvilke kort du får tildelt og hvilke felles kort som dealeren deler ut, skyldes kun flaks, og det kan hevdes at dette er den viktigste faktoren i hvordan det går med en enkelt hånd. Når man ser på mange runder, derimot, blir flaks og uflaks utbalansert, mens forskjellene i hvor dyktige spillerne er til å bløffe og lese motstanderne – egenskaper som utvikles ved gjentatte spill – mer og mer viktig.

Jeg kan kanskje klare å tippe 9 av 10 resultater riktig i løpet av en helg, men hvis personen jeg spiller mot klarer å tippe alle 10 riktig, taper jeg likevel.

Nate Silver, forfatteren av boken The Signal and the Noise, hevder at en dyktig, men uheldig pokerspiller kan ende opp i minus selv etter 100 000 runder, noe som tilsvarer 40 timer pokerspill i uken i nesten to år. Se for deg to sportstippere som spiller et spill mot hverandre med 50/50-sjanse. Hvis en av dem har en 2 % fordel over motstanderen, altså en suksessrate for prognosene på 51 %, kan det også ta svært lang tid å oppnå suksess basert på det som faktisk er en reell fordel. Etter 1000 spill kan den dårligere spilleren likevel ha vunnet 25 % flere ganger.

Å overliste tilfeldigheten, og dyktighetens paradoks

Hvis tippemarkeder er så godt som nullverdi-situasjoner der det omtrent ikke finnes mulighet til å vinne frem med dyktighet, har man egentlig sjanse til å gjøre noe med det? Jeg presenterer min egen løsning og de tre forslagene fra Michael Mauboussin, samlet i listen under.

Spill i markeder med større varians i dyktigheten

For å si det enkelt så resulterer dette i tippemarkeder som både flertallet av deltakerne og bookmakeren er mindre kjent med, og der det er mindre tilgjengelig informasjon og nyheter man kan basere prognoser på. Jo større forskjellen er mellom de dårligste og de beste prognosemakerne, desto mindre viktig er flaksen.

Tenk relativt, ikke absolutt

Når det finnes konkurranse og flaks, er det kun relative prestasjoner som teller. Jeg kan kanskje klare å tippe 9 av 10 resultater riktig i løpet av en helg, men hvis personen jeg spiller mot klarer å tippe alle 10 riktig, taper jeg likevel. Som Nate Silver sier om poker: "Du kan gjøre riktig valg 95 % av gangene og likevel tape skjorta ved et bord der de andre spillerne velger riktig 99 % av gangene". I denne konteksten er det også viktig å huske at det ikke egentlig er bookmakeren du prøver å slå, men alle de andre tippespillerne. 

Fokuser på prosessen, ikke resultatet

Når man konkurrerer under forhold der flaksen dominerer, bør man fokusere på prosessen man bruker for å fatte beslutninger, ikke på selve resultatene. I tipping bør du analysere metodene du bruker for å lage prognoser, ikke saldoen din. I situasjoner der mye tilfeldighet bryter sammenhengen mellom dyktighet (årsaker) og fortjeneste (effekter), kan en dyktig spiller tape penger mens en (relativt sett) dårlig spiller kan oppnå fortjeneste.

Studer sluttodsene

Det er en etablert sannhet at sluttoddsene til Pinnacle er ett av de beste målene som finnes på den sanne sannsynligheten. Hvor mye du konsekvent slår disse oddsene med er en veldig god indikator på hvor stor fortjeneste du kan forvente å oppnå. Hvis du konsekvent slår sluttoddsene med et tall som er høyere enn marginen til Pinnacle, antyder dette at du er betydelig dyktigere enn mange av konkurrentene.

Tipperessurser – Bli en bedre spiller

Pinnacles Tipperessurser er en av nettets mest omfattende samlinger av ekspertråd for tipping. Passer for alle erfaringsnivåer, og formålet er ganske enkelt å gi kundene våre støtten de trenger for å bli bedre spillere.