apr 12, 2018
apr 12, 2018

Därför är det vanskligt att basera sina VM-tips på data

Problemet med en databaserad insatsstrategi under VM

Därför är en kvalitativ modell begränsad

Har vi någon lösning på VM-problematiken?

Därför är det vanskligt att basera sina VM-tips på data

VM är utan jämförelse världens största fotbollsevenemang. Under en månads tid var fjärde år får fotbollssupportrar världen över njuta av 64 matcher. Oddsspelare däremot får ofta bara gråa hårstrån av turneringen. Varför är det så svårt att tippa på VM? Läs vidare för att få reda på det.

I en tidigare artikel beskrev Mark Taylor hur han går tillväga för att försöka göra precisa förutsägelser under VM 2018 (inklusive vinnaren) samtidigt som han belyste svårigheterna med att använda en sådan modell. I denna artikel fokuserar jag på det senare. Här behandlar jag begränsningarna för både kvantitativa och kvalitativa modeller. 

Din metod avgör utfallet

Att bygga en modell är en iterativ process som innebär att man testar och följer upp resultaten. Det här berördes i en tidigare artikel där det föreslogs att man bör använda ett visst mått av egen bedömning och kreativitet när man utformar en modell.

Möjligheten till att testa och följa upp resultat i VM är begränsad eftersom turneringen bara äger rum en gång var fjärde år. Kvantitativa modeller handlar inte främst om att få fram de sanna resultaten – det är mer av en kreativ process genom vilken riktiga utfall simuleras eller förklaras i siffror.

En kvantitativ modell baseras emellertid fortfarande på en serie antaganden och i viss mån därmed också på tidigare data. Problemet med data från tidigare VM-turneringar är att den är lätt förrädisk. Samma gäller för data som samlats in under kvalrundan.

Om vi tänker oss ett scenario där vi använder ett lags tidigare resultat. Datan vi hämtar från kvalrundan är inte lika viktig eftersom lagen ställts mot motståndare med vitt skilda kvaliteter. Panama, till exempel, kanske slog ut USA när man tog sig vidare från CONMEBOL, men hade de avancerat även från en grupp i UEFA-kvalet?

Bristen på data innebär att algoritmbaserade modeller – det finns en hel del av dem – inte har samma fördel som för fotbollsligor med matcher varje vecka.

Syftet var inte att antyda att Europakvalet är svårare – det går bara inte att jämföra de olika kvalrundorna. Dessutom varierar ett lags prestationsnivå under en kvalrunda som spänner över en tvåårsperiod. Spelares form går upp och ner, och skador förändrar lagets konkurrenskraft.

Man kan titta på FIFA:s lagrankning för att få försöka få rätsida på lagens varierande prestationsnivå, men den är känd för att ha lite med verkligheten att göra. Jag skulle tippa på att en simulering på FIFA 2018 hade kommit med en bättre förutsägelse.

En del avancerade modeller försöker använda sig av spelarspecifika parametrar. Dessa modeller brukar vara komplexa och ger möjligtvis mer verklighetstrogna utfall. En spelares prestationsnivå är emellertid avhängig medspelare och taktik. I landslaget kan förutsättningarna vara helt annorlunda jämfört med de spelaren har i sitt klubblag.

Pressen Messi har på sina axlar i VM förvärras bara av det faktum att han saknar lagkamrater från Barcelona i det argentinska landslaget. Även om Mohammed Salah har varit fullständigt magisk den här säsongen betyder inte det att han kan leverera på samma nivå med det egyptiska landslaget (även om jag personligen hoppas att det går bra för dem).

Av samma anledning skulle det vara katastrofalt att använda data från tidigare VM för specifika parametrar som t.ex. målskörd. Under åren har vi vid ett antal tillfällen sett tidigare vinnare eller finalister göra uselt ifrån sig i nästa VM. En delförklaring är att lagen hinner förändras mycket på fyra år. Över tid byts lagets tränare ut och taktiken förändras.

Därför är en kvalitativ modell begränsad

Att vi minns legendariska lag som Brasilien 1970, Nederländerna 1974 (även om de inte vann) och Spanien 2010 påverkar också andra aspekter, däribland kvalitativa förutsägelser.

För ett par månader sedan publicerade jag tillsammans med en medförfattare en artikel med namnet "A Public (Mis)interpretation of Brazil’s World Cup Performance" där vi analyserade Brasiliens odds under VM 2014. För att spara dig tid kan jag sammanfatta vad vi kom fram till: oddset på Brasilien som VM-vinnare var högre efter match än innan.

Under åren har vi vid ett antal tillfällen sett tidigare vinnare eller finalister göra uselt ifrån sig i nästa VM. En delförklaring är att lagen hinner förändras mycket på fyra år.

I artikeln som jag var med och skrev kom vi fram till att Brasiliens chanser att vinna VM innan det hade startat uppskattades till 25 % men var nere i 18 % efter matchen mot Kamerun då man var klara för slutspel. Siffran steg till 27 % innan avspark i första utslagsrundan.

Med facit i hand var Brasiliens senaste VM-lag inte på samma nivå som tidigare legendariska upplagor. Många oddsspelare verkar alltså ha drabbats av den kognitiva biasen förankringseffekt och la för stor vikt vid första intrycket.

Denna förutfattade mening ifrågasattes varje gång Brasilien spelade match (därav högre odds efter matcherna) men glömdes fort bort lagom till nästa.

Det finns en annan faktor som kan ha gett upphov till dessa felaktigheter. Den akademiska termen är "over-confidence bias" men vi kan nöja oss med att kalla det kaxighet. Vad många oddsspelare har gemensamt är att de har en överdriven tro på sin egen förmåga – en grupp jag förmodligen tillhör.

Vi har alla hört och kanske även varit delaktiga i diskussioner som mynnat ut i självsäkra konstateranden i linje med “Leicester kan inte vinna Premier League”, “Chelsea topp fyra är ett säkert spel" och "Juventus vinner Champions League" – nyanserna åker ut genom fönstret och vi drabbas av överdrivet självförtroende.

Har vi någon lösning på VM-problematiken?

Om den kvantitativa metoden är begränsad och den kvalitativa metoden bygger på förutfattade meningar – innebär det att det inte går att göra fullgoda förutsägelser för VM på vetenskaplig grund?

Problemet med data från tidigare VM-turneringar är att den är lätt förrädisk. Samma gäller för data som samlats in under kvalrundan.

Förmodligen är det en fördel. Bristen på data innebär att algoritmbaserade modeller – det finns en hel del av dem – inte har samma fördel som för fotbollsligor med matcher varje vecka. Dessutom innebär VM att fler spelar – och att många gör det med hjärtat.

Syftet med alla förutsägelser är att de ska vara hyfsat men inte helt exakta i sin träffsäkerhet. Om vi tar VM-tipset på kontoret som exempel (använd gärna den kostnadsfria Excelfilen på Scoragol.com), så föreslår jag att man är lite mer kreativ än vanligt.

Om du vet med dig att hälften av alla deltagare kommer tippa Tyskland som segrare – välj något annat (även om du inte behöver överdriva och tippa Panama). Om du vill slå marknaden ska du föreställa dig olika "tänk om"-scenarior. Använd flera parametrar om du tillämpar en kvalitativ modell men testkör dess känslighet inför fluktuationer.

Hos Pinnacle får du de bästa VM-oddsen och VM-speltipsen.

Oddsresurser: Bli en bättre spelare

Pinnacles avdelning Oddsresurser är en av nätets mest omfattande artikelsamlingar med spelråd från experter. Vi tillgodoser behoven hos både nybörjare och proffs – vårt mål är helt enkelt att öka våra spelares kunskaper.