close
mai 2, 2018
mai 2, 2018

Grunnen til at VM-tipping er et datamareritt

Problemet med en databasert VM-strategi

Begrensningene ved en kvalitativ tilnærming

Finnes det en løsning på VM-problemet?

Grunnen til at VM-tipping er et datamareritt

VM er uten tvil verdens viktigste fotballarrangement. VM arrangeres hvert fjerde år, og i år skal verdenseliten møtes over 64 kamper i løpet av én måned i Russland. Men for tippespillere kan turneringen ofte by på store problemer. Hvorfor er det egentlig så vanskelig å tippe på VM? Les videre for å finne det ut.

I en tidligere artikkel forklarte Mark Taylor hvordan han prøver å lage presise prognoser for fotball-VM 2018 (inkludert å forutsi vinneren) mens han også diskuterer begrensningene ved en slik tilnærming. I denne artikkelen skal jeg fokusere på sistnevnte. Her diskuterer jeg begrensningene ved kvantitative og kvalitative tilnærminger. 

Resultatene i modellen din bestemmes av prosessen

Modellbygging er en gjentagende prosess som krever testing og overvåking av resultater. Vi har forklart dette i en tidligere artikkel der det ble foreslått at en liten dose kreativitet og dømmekraft er en viktig del av enhver modellbyggeprosess.

Det er begrensede muligheter for å teste og overvåke et VM-scenario, siden turneringen bare avholdes hvert 4. år. Kvantitative prosesser handler ikke om å få perfekte, 100 % korrekte resultater – dette er kreative prosesser der resultater simuleres eller forklares ved hjelp av tall.

En kvantitativ modell baseres på en rekke antagelser, samt historiske data. Problemet med VM er at selv om dataene stammer fra årets kvalifiseringsstadium, er de likevel delvis foreldede.

La oss tenke oss et tilfelle der vi baserer oss på historiske lagprestasjoner. Dataene fra kvalifiseringsstadiet er ikke så relevante, siden lagene møter lag med andre forutsetninger. Panama slo kanskje USA for å gå videre i CONCACAF-kvaliken, men hvordan ville laget ha klart seg i UEFA-gruppen?

Mangelen på data innebærer at algoritme-baserte tilnærminger (som det finnes svært mange av i omløp) ikke er like nyttige her som for vanlige fotballigaer.

Målet er ikke å hevde at det er vanskeligere å kvalifisere seg i Europa – det er bare veldig annerledes enn i et gruppestadium. Kvalifiseringskampene foregår også over to år, slik at det er mye rom for store variasjoner i laget. Spillere har neppe akkurat like god form hele året, og det kan ha oppstått skader underveis.

Man kan velge å unngå disse fluktuasjonene ved å bruke FIFAs lagrangeringer, men disse er kjent for å være urealistiske. Jeg tror en simulering for FIFA 2018 ville gitt et mye bedre grunnlag.

Noen avanserte modeller prøver å basere seg på spillerspesifikke parametere. Disse modellene er ofte meget komplekse og gir muligens bedre prognoser. Men spillernes prestasjoner er sterkt knyttet til lagets struktur, de kan gjøre det veldig bra i klubblagets struktur men slite på landslaget.

Messi er under stort press for å skape resultater under VM, og mangelen på lagkamerater fra Barcelona gjør ikke saken noe bedre. Mohammed Salah har gjort det utrolig bra denne sesongen, men det er ingen garanti for at det går like bra sammen med Egypt (personlig håper jeg det går bra for laget hans).

Av samme grunn ville det vært katastrofalt å bruke historiske VM-data for lagspesifikke parametere (som skåringsfrekvens). Lagene endrer seg svært mye over fire år, det vises tydelig når et lag når finalen eller til og med vinner ett år, og gjør det elendig i neste VM. Over tid blir også både trenere og spillestiler byttet ut.

Begrensningene ved en kvalitativ tilnærming

Påminnelser om legendariske lag som Brasil i 1970, Nederland i 1974 (selv om de ikke vant) og Spania i 2010 påvirker også andre tilnærminger, også kvalitative prognoser.

I en akademisk artikkel jeg publiserte for noen måneder siden (A Public (Mis)interpretation of Brazil’s World Cup Performance) evaluerte vi oddsene til Brasil under VM 2014. Hvis du vil slippe å lese hele artikkelen, kan den oppsummeres ved å si at oddsene på langtidsspill på Brasil etter kampen, var høyere enn oddsene før kampen.

Lagene endrer seg svært mye over fire år, det vises tydelig når et lag når finalen eller til og med vinner ett år, og gjør det elendig i neste VM.

Artikkelen jeg var medforfatter for, fastslo at mens Brasil hadde 25 % sjanse for å vinne VM før VM startet, var sannsynligheten bare 18 % etter kampen mot Kamerun og kvalifiseringen fra gruppestadiet. Dette steg til 27 % ved avspark i den første kampen i utslagsrunden.

I etterpåklokskapens lys ser vi at det Brasil som deltok i forrige VM var langt fra å være det legendariske laget vi har sett i tidligere år. Likevel ser det ut som at tippespillerne slet med forankringsbias og la alt for stor vekt på førsteinntrykket.

Dette biaset ble utfordret hver gang Brasil spilte en kamp (noe som forklarer at oddsene var høyere etter kamper), men ble raskt glemt før starten av neste kamp.

Det finnes enda en faktor som kan ligge til grunn for disse unøyaktighetene. Teknisk sett kalles det overdreven selvsikkerhet-bias, men vi kan like godt bare kalle det å være kjepphøy. Det er svært mange tippespillere, både dyktige og dårlige, som har alt for stor tro på egne evner – sannsynligvis gjelder det meg også.

Vi har alle overhørt (og kanskje deltatt i) alt for mange diskusjoner (der en meget selvsikker person har stått for det meste av praten) om ting som «Leicester kan umulig vinne ligaen» eller «Chelsea ender blant de fire beste i år, garantert» eller «Juventus kommer til å vinne Champions League». Dette er ikke bare irriterende, det er også bevis på dette overdreven selvsikkerhet-biaset.

Finnes det en løsning på VM-problemet?

Hvis den kvantitative tilnærmingen har begrensninger og den kvalitative tilnærmingen er sårbar for bias, betyr det at det ikke er mulig å lage vitenskapelig baserte VM-prognoser?

Problemet med VM er at selv om dataene stammer fra årets kvalifiseringsstadium, er de likevel delvis foreldede.

Nei, dette er sannsynligvis en fordel. Mangelen på data innebærer at algoritme-baserte tilnærminger (som det finnes svært mange av i omløp) ikke er like nyttige her som for vanlige fotballigaer. VM er også en inngangsport for hobbyspillere som baserer seg mer på magefølelse.

Målet med prognoser er å være relativt nøyaktig, ikke 100 % nøyaktig. Hvis det f.eks. er snakk om en tippeklubb på jobben (bruk gjerne Excel-filen på Scoragol.com), foreslår jeg at man er litt kreativ, men ikke for mye.

Hvis du vet at halvparten av tippespillerne kommer til å satse på Tyskland som vinner, er det best å ikke gjøre det (men det betyr ikke at du skal satse på Panama isteden). Når du prøver å slå markedet, er det lurt å tenkte på flere «hva om»-scenarioer. Ikke bruk bare ett sett parametere for utdataene dine hvis du bruker en kvalitativ modell, du må også teste hvor sensitiv den er for fluktuasjoner.

Få de beste oddsene på VM 2018 og tipperådene for fotball-VM hos Pinnacle.

Tipperessurser – Bli en bedre spiller

Pinnacles Tipperessurser er en av nettets mest omfattende samlinger av ekspertråd for tipping. Passer for alle erfaringsnivåer, og formålet er ganske enkelt å gi kundene våre støtten de trenger for å bli bedre spillere.