close
feb 20, 2017
feb 20, 2017

Slik tester du troverdigheten til en tipsers merittliste

Metode 1: Studer sluttprisene

Metode 2: Wald-Wolfowitz-serietesten for tilfeldighet

Slik tester du troverdigheten til en tipsers merittliste
Alle tipsere lover deg gode tips og store gevinster. Men for spillere som vurderer å bruke dem er det ett viktig spørsmål som må besvares før man satser penger. Er tipseren heldig eller dyktig? I denne artikkelen gir Joseph Buchdahl deg to metoder du kan bruke for å besvare dette spørsmålet. Les videre for å finne ut hvilken som passer best for deg.

Pinnacle har tidligere undersøkt hvordan man evaluerer dyktigheten til en tipser og hvordan man tester historiske tipperesultater for å se om de er basert på flaks eller dyktighet. Men når du så endelig har funnet en tipser som ser ut til å være troverdig, hvordan vet du at det faktisk er et godt tilbud, som du bør investere penger i? La oss finne det ut.

En ny kikk på T-testen

Vi har tidligere sett på hvordan T-testen kan hjelpe deg med å finne bevis på at en tipser er dyktig ved å finne ut hvor sannsynlig det er at resultatene fra en serie veddemål kunne oppstått tilfeldig. Jo mindre sannsynlig det er at det er tilfeldig, desto mer sannsynlig er det at noe annet, som dyktighet, er årsaken. Men når tippehistorikken ser for god ut til å være sann, kan vi også ende opp med en annen konklusjon: at den er manipulert.

Som eksempel har vi en historie fra en fotballtipser som har spesialisert seg på markedene for over/under- og kampodds og som tilbyr kundene sine "kvalitetstips, fantastiske odds og store gevinster". Fra august 2013 til oktober 2014, før han sendte inn statistikken sin til en velkjent evalueringstjeneste for tipsere (som i ettertid har blitt avviklet på grunn av anklager om uregelmessigheter) var det 296 av dem. Gjennomsnittlig sannsynlighet for seier var 50 % og snittoddsen var 2,04. 220 av tipsene var vinnertips, noe som gir suksessrate på 74 % og avkastning på 151 %. Fortjenestediagrammet ser slik ut:


tipsters-evalution-1.jpg

Dette gir et T-resultat på 9,3, noe som innebærer at så gode resultater ville oppstått tilfeldig omtrent én av en million billioner ganger. Når sannsynligheten er så lav og fortjenestetrenden er tilnærmet perfekt, bør man nok vurdere om det faktisk er for godt til å være sant. Likevel, et så godt resultat er ikke ugjendrivelig bevis på at tipseren har jukset. Det er også mulig at han bare er verdens dyktigste tipser. Hvordan kan vi så teste denne hypotesen?

Metode 1: Studer sluttprisene

Mirio Mella har tidligere snakket om betydningen av markedets bevegelser. Prisene justeres etter hvert som spillerne sier hva de mener ved å satse penger. Markedet gjenspeiler den tilgjengelige informasjonen om lag og spillere. Jo mer interesse det er for en spiller eller et lag, desto større sjanse er det for at oddsene på dem synker. Dafni Serdari forklarer også hvorfor sluttprisene er så viktige.

"Oddsen som tilbys rett før kampen starter kalles sluttoddsen, og gjenspeiler all statistikk, alle nyheter, all spilleaktivitet og markedets sentiment. Sluttoddsen skal være markedet på sitt mest effektive, og er derfor den mest nøyaktige vurderingen av den underliggende sannsynligheten."

Spillere som jevnlig slår sluttprisene regnes for å være dyktige. De bringer informasjon til markedet, og dette vises ved at de klarer å få bedre odds. Når de konsekvent slår sluttprisene med mer enn marginen, er det et tegn på positiv forventning og bidrar til å skille mellom dyktige og dårlige spillere, eller "sharps" fra "squares".

Jeg har tidligere analysert et stort utvalg start- og sluttpriser. Dette viser tydelig at marginen du slår sluttprisen med er et godt grunnlag for å beregne forventet fortjeneste. Hvis du for eksempel plasserer en innsats til 2,20 på et lag som har 2,00 i sluttpris, er den forventede fordelen din 10 % (minus marginen).

Klarer "mestertipseren" vår konsekvent å slå sluttprisen? Når fortjenesteforventningen er 51 %, kan man forvente at odds på 2,00 synker med 51 % pluss marginen og ender opp på ca. 1,30. Når vi ser på tipserens siste 20 tippetips i forbindelse med Pinnacle, finner vi følgende.

  •        8 priser synker (snittet er 6,7 %, maks er 19,5 %)
  •        7 priser stiger (snittet er 3,5 %, maks er 7,1 %)
  •        5 forblir like
  •        Snittbevegelsen er reduksjon på 1,5 %
  •        Typisk margin er 2 %

Det er ingen statistisk signifikant forskjell mellom dette og tilfeldighet. Tipseren beveger ikke markedet til Pinnacle på en systematisk måte. Han klarer faktisk ikke engang å dekke marginen. Det ser ut til at Pinnacle ikke var spesielt interessert i tipsene hans.

Metode 2: Wald-Wolfowitz-serietesten for tilfeldighet

En annen metode vi kan bruke for å teste hvor troverdig merittlisten til en tipser er, er Wald-Wolfowitz-serietesten for tilfeldighet. Testen er oppkalt etter Abraham Wald (statistikeren som oppdaget overlevelsesbias) og Jacob Wolfowitz og brukes for å fastslå om en binær datasekvens stammer fra en tilfeldig prosess.

Uavhengig av effekten av tipserens dyktighet skal sekvenser av seire eller tap uansett gjenspeile den underliggende, tilfeldige støyen i historien, siden hvert av resultatene i en sekvens er uavhengig av det forrige. En tipser som gir råd om 50/50-spill uten noen kunnskaper vil få resultater som ligner på resultatene fra en serie myntkast. En tipser med 74 % treffrate vil tilsvare en vektet mynt der 74 av hundre myntkast-resultater blir mynt. Det vil bli tre ganger så mange mynt som kron, men sekvensfordelingen vil uansett være tilfeldig.

Tenk på den følgende sekvensen med gevinster og tap:

G G T T G T G G G G T G G T T T T T G G

Det er 11 gevinster, 9 tap og 9 observerte serier (So), der en serie er definert som en rekke påfølgende gevinster eller tap (1 enkeltstående gevinst eller tap regnes også som en serie). Hvis vi skal finne ut om denne sekvensen er tilfeldig eller ikke, må vi beregne forventet antall serier fra 11 gevinster og 9 tap og sammenligne dette med det observerte tallet. Jo større forskjellen er, desto mindre sannsynlig er det at sekvensen er tilfeldig. For nullhypotesen om at sekvensen er tilfeldig, beregnes forventet antall serier (Sf) slik:

tipster-evaluation-2.png

Der G står for antall gevinster og T står for antall tap. Distribusjonen av mulige serier er omtrent normal, og standardavviket, (σ), beregnes slik:

tipster-evaluation-3.png

 

Deretter beregner vi test-statistikken (Z) slik:

tipster-evaluation-4.png

Til slutt gjør vi om dette til sannsynligheten (s-verdien) for at differansen mellom observert og forventet antall serier kunne oppstått tilfeldig. I Excel kan man gjøre dette med funksjonen NORMSDIST, slik jeg har gjort det med min egen serietest-kalkulator. Jo mindre s-verdien er, desto mer sannsynlig er det at man kan avvise hypotesen om at gevinst/tap-sekvensen er tilfeldig og statistisk uavhengig. Dette skjer vanligvis ved s-verdien = 5 % (Z = 1,96) eller noen ganger 1 % (Z = 2,58).

For sekvensen over er Sf = 10,9, Z = 0,88 og s-verdien = 38 %, altså kan vi konkludere med at sekvensen er tilfeldig.

Vellykket bruk av serie-testen avhenger av at sannsynligheten for hvert av resultatene er like stor (som ved et myntkast). Selv om dette vanligvis ikke er tilfelle når oddsen for tips varierer, bør det ikke avvike for mye når de er ganske like.

Dette fungerer best for asiatisk handikap og poengspredning, der oddsen som oftest ligger ganske nærme 2,00. For tipseren vi analyserer hadde 96 % av tipsene hans gevinst-sannsynlighet på mellom 40 % og 60 %, med 78 % av dem mellom 45 % og 55 %. Så hva sier serie-testen om statistikken hans?

  •        Antall tips (t) = 296
  •        Gevinster (G) = 220
  •        Tap (T) = 76
  •        Observerte serier (So) = 135
  •        Forventede serier (Sf) = 114
  •        Z = 3,21
  •        S-verdi = 0,1 %

Basert på disse resultatene kan vi trygt avvise hypotesen om at sekvensen er tilfeldig. Det er rett og slett for mange serier i forhold til hva man forventer for en tipser med 74 % treffrate og snittodds på ca. 2,00. En nærmere kikk viser hvorfor tilfeldighetstesten mislyktes: for mange korte serier og for få lange serier. 

tipster_5.jpg

(Forventet antall serier med minst x gevinster kan beregnes omtrentlig med nqpx der p = sannsynlighet for gevinst (74 %) og q = 1 – p (26 %)). 

For eksempel er det 67 serier med minst 2 gevinster på rad, mens forventet resultat er 56. I tillegg er det bare 2 serier med 8 eller flere gevinster, mens forventet resultat er 7. 

Lurt av tilfeldighetene 

Hva betyr det at tipshistorikken ikke er tilfeldig? Den enkleste forklaringen er at resultatene har blitt manipulert. Gitt det store antallet korte serier med gevinster er det sannsynlig at tipseren for ofte har lagt inn et tap for å bryte opp lange serier med gevinster. Hvorfor? 

Vi påvirkes av et kognitivt bias som kalles klynge-illusjonen, en feilaktig tendens til å tro at de uunngåelige lange seriene eller store klyngene som oppstår i tilfeldige distribusjoner er betydningsfulle. Konsekvensen av dette er at når man blir bedt om å forfalske tilfeldige, binære sekvenser, vil de fleste av oss bytte for ofte mellom gevinst og tap fordi vi føler at det er rart med for mange av samme på rad.

Tipseren har sannsynligvis tenkt at lange serier med seire vil se unaturlig ut, mens sannheten faktisk er det motsatte. For et utvalg av 296 tips og forventning om 74 % gevinster skal det nomalt sett være minst én serie på 15 gevinster. Hans største var 11, den neste var 9 og så to på 7. 

For godt til å være sant?

Hvis statistikken til en tipser ser for god ut til å være sann, er den nok det. Før du kjøper historien deres, bør du utføre tester for å se etter bevis på at de gjør det bedre enn sluttoddsen og at sekvensene de presenterer faktisk er tilfeldige. Hvis dette ikke stemmer, bør du beholde pengene dine og lete videre.

Angående denne "supertipseren" viser en annen analyse av sluttprisene for de nyeste tipsene hans at han fremdeles ikke påvirker markedet til Pinnacle i det hele tatt. I tillegg har vi nå vist at han har manipulert historikken for tidligere tips ved å sette inn en rekke tapende tips, trolig for å få det til å se mindre usannsynlig ut. En ny runde med Wald-Wolfowitz-serietesten vil vise om han fortsatt blir lurt av tilfeldighetene. Hvis resultatet blir det samme, bør du sørge for at hvert fall ikke du blir det.

Tipperessurser – Bli en bedre spiller

Pinnacles Tipperessurser er en av nettets mest omfattende samlinger av ekspertråd for tipping. Passer for alle erfaringsnivåer, og formålet er ganske enkelt å gi kundene våre støtten de trenger for å bli bedre spillere.