des 12, 2016
des 12, 2016

Loven om små tall (forhastet generalisering) i sportstipping

Loven om små tall (forhastet generalisering) i sportstipping

Loven om små tall er en kognitiv bias der folk tror at relativt få observasjoner gjenspeiler den generelle befolkningen. Les videre for å teste logikken med sykehusquizen og finne ut hvordan grafer kan være villedende og hva du kan gjøre for å unngå tap når du bruker statistikk for å plassere innsatsen. 

Sykehusquizen

I 1974 introduserte de to psykologene Daniel Kahneman og Amos Tversky forsøkspersonene sine for følgende scenario, etterfulgt av et spørsmål. En by betjenes av to sykehus. Ved det største sykehuset fødes det daglig rundt 45 babyer, og ved det minste fødes det daglig rundt 15 babyer.

Som vi vet er rundt 50 % av alle babyer gutter. Den eksakte prosentandelen varierer derimot fra dag til dag. Noen ganger er den høyere enn 50 %, andre ganger lavere. I løpet av ett år registrerte hvert sykehus de dagene der mer enn 60 % av babyene var gutter. Hvilket sykehus tror du registrerte flest slike dager?

  •        Det største sykehuset
  •        Det minste sykehuset
  •        Omtrent likt (mindre enn 5 % differanse)

Ifølge binomisk teorivil antall dager der det fødes flere gutter enn jenter med minst seks mot fire være nesten tre ganger større ved det minste sykehuset sammenlignet med det største, ganske enkelt på grunn av større svingninger i fødselsraten. Det er mindre sannsynlig at et større utvalg varierer mye fra 50 %. Allikevel svarte bare 22 % av de spurte riktig.

Hva er heuristikk?

Kahneman og Tversky beskrev denne feilen som troen på loven om små tall. For å si det enkelt: bedømmelser man gjør basert på små utvalg blir ofte feilaktig oppfattet til å være representative for befolkningen som helhet. For eksempel kan et lite utvalg som fordeler seg tilfeldig, forsterke troen på at flertallet der utvalget er tatt også vil fordeles tilfeldig. 

Sykehusquizen: Det er mindre sannsynlig at et større utvalg varierer mye fra 50 %. Allikevel svarte bare 22 % av de spurte riktig.

Derimot vil et lite utvalg som viser et tilsynelatende meningsfylt mønster, for eksempel ni kronesider fra ti myntkast, føre til at observatøren tror at flertallet vil vise samme meningsfylte mønster. I dette tilfellet vil man anta at mynten er forutinntatt. Fenomenet å oppfatte mønstre i tilfeldige eller meningsløse data kalles apophenia.

Troen på loven om små tall er en del av flere mentale snarveier som folk tar når de tar avgjørelser i uvisshet. Kahneman og Tversky kalte disse snarveiene heuristikk. Å generalisere basert på små utvalg er eksempler på representativitetsheuristikk, der folk vurderer sannsynligheten for en bestemt hendelse basert utelukkende på generalisering av tidligere lignende hendelser som det er lett å sammenligne med.

Et annet eksempel på representativitetsheuristikk er uttrykket gamblerens feilslutning. En slik skjevhet oppstår fra troen på loven om små tall. Som Kahneman og Tversky sier:

Kjernen av gamblerens feilslutning er en misforståelse av rettferdigheten av sannsynlighetslovene. Gambleren føler at myntens "rettferdighet" gir ham rett til å forvente at ethvert avvik i én retning snart vil balanseres ut av et tilsvarende avvik i den neste. Forsøkspersonene opptrer som om hvert segment i tilfeldig rekkefølge må avspeile den sanne andelen. Hvis sekvensen avviker fra flertallets andel, forventes det en korrigerende skjevhet i den andre retningen.

Lese grafer fra utvalgsstørrelser med skjevheter

De som driver med sportstipping kan være spesielt utsatt for feil mønstergjenkjenning via en feilplassert tro på loven om små tall. Mistolking av lønnsomheten fra små innsatseksempler som representative for en avvik fra vilkårlighet og bevis for forutsigbar ferdighet, kan gi ubehagelige økonomiske konsekvenser på lengre sikt. Ta en titt på diagrammet over hypotetisk lønnsomhet av 100 innsatser påNFL-poengspredning nedenfor. Hver av innsatsene er gjort til prisen 1,95. Imponerende, ikke sant?

 gr-small-numbers-1.jpg

Hva om jeg fortalte at denne registreringen kommer fra en anerkjent, amerikansk ekspert innen sportshandikap? Med en anstendig veksttrend og avkastning på 15 % kan du bli tilgitt for å tro meg. Det er selvfølgelig ikke sant. Det neste diagrammet på 1000 innsatser avslører det store bildet.

gr-small-numbers-2.jpg


Egentlig var det ingen langsiktig lønnsomhet i det hele tatt. Årsaken var at dette bare ble produsert av en tilfeldig nummergenerator som antok en 50 % sjanse for en individuell premie og en
forventning om gevinst på mindre enn 2,5 %. Det første diagrammet viser bare de første 100 innsatsene av det andre.

Men selv i den andre lange tidsserien opprettholdt lønnsomheten seg over flere hundre innsatser. Til tross for et samlet tap ser mønsteret av tidsserien alt annet enn tilfeldig ut, med et nokså konsekvent bølgelignende mønster.

Men som Kahneman og Tversky fant ut, er det langt mer sannsynlig at vi oppfatter sekvenser av lignende resultater som ikke-tilfeldige, selv om det ikke er noen underliggende mekanisme bak dem. Hvilke av de to binære sekvensene under ser tilfeldig ut?

0, 0, 0, 0 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1
 
0, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1

 

De fleste vil velge sekvens nummer to. Den første ble faktisk generert tilfeldig i Excel. Den andre fant jeg opp bevisst med kortere sekvenser av ettall og nuller. Når vi lager tilfeldige sekvenser som disse, vil mange av oss bytte fra 1 til 0 eller motsatt hvis vi føler at ett av tallene forekommer for ofte.

Ta nå en titt på følgende diagrammer for 1000 innsatser. Alle ble tilfeldig generert. Det store utvalget av mulige utfall gir deg en smakebit på hvor enkelt det er å bli lurt av tilsynelatende meningsfulle mønstre.


gr-small-numbers-3.jpg
Husk at dette ikke er serier av 100 innsatser, men 1000. Se på det midterste diagrammet. Det har alle kjennetegnene til en ekspertprognosemaker eller -tipper, med 5 % utbytte og solid resultatvekst i alle tippingene, noe de beste handikapekspertene kan opprettholde på lang sikt. Og allikevel skjedde det helt tilfeldig.

Ved bruk av binomisk fordeling kan vi finne sannsynligheten for fortsatt gevinst etter en periode med tipping til tross for at forventningen er mindre enn 2,5 %.

Antall innsatser (odds 1,95 og 50 % vinnersjanse)

Minimum antall gevinster

Sjanse for gevinst

100

52

38, 22 %

250

129

32,90 %

500

257

28,05 %

1000

513

21,46 %

2500

1283

9,68 %

5000

2565

3,40 %

10000

5129

0,51 %


Etter 1000 innsatser har vi fortsatt over 20 % sjanse for å gå i pluss, til tross for at tippingen vår er helt tilfeldig. Hvis vi plasserte en handikaptipping på hvert NFL-spill, ville dette gjelde i nesten fire sesonger. Det er lenge å tro vi ikke har noe annet enn flaks.

Hvor lite er lite?

Loven om små tall er en kognitiv bias der folk tror at relativt få observasjoner gjenspeiler den generelle befolkningen. Dette eksempelet har vist at små ting av og til kan ha stor effekt. Fenomenet eksisterer fordi folk foretrekker sikkerhet fremfor tvil, kunnskap fremfor uvitenhet, årsakssammenheng fremfor assosiasjon, mønstre fremfor tilfeldighet og ferdighet (spesielt egosentrisk ferdighet) fremfor sannsynlighet. For de som driver med sportstipping kan det bli dyrt å ikke forstå betydningen av dette. 

Tipperessurser – Bli en bedre spiller

Pinnacles Tipperessurser er en av nettets mest omfattende samlinger av ekspertråd for tipping. Passer for alle erfaringsnivåer, og formålet er ganske enkelt å gi kundene våre støtten de trenger for å bli bedre spillere.