jan 24, 2023
jan 24, 2023

Skrällar – hur överraskande var VM 2022?

Hur överraskande var VM 2022?

Monte Carlo-sannolikhet

Högoddsare i VM 2022

Skrällar – del ett

Skrällar – hur överraskande var VM 2022?

Hur chockerande var VM 2022? Var Japans seger mot Tyskland lika oväntad som den framstod? Joseph Buchdahl analyserar siffrorna för att ta reda på om stora skrällar i jätteturneringar är lika oväntade som man kan tro.

Enligt Gracenotes (ett företag som sysslar med sportmetadata) definition bjöd fotbolls-VM 2022 på 15 skrällar – den högsta procentuella andelen på 64 år.

VM i Qatar var det mest skrällfyllda världsmästerskapet på 64 år

Men hur överraskande är egentligen en sådan siffra och hur kommer man fram till vad som egentligen är en skräll?

Japans och Saudiarabiens segrar mot Spanien respektive Tyskland framstod onekligen som skrällar. Men om de verkligen kan klassas som det beror på hur man bedömde lagens vinstsannolikheter på förhand.

På ett intuitivt plan kan en skräll kännas uppenbar men man bör alltid vara beredd att omvärdera den bilden eftersom det är omöjligt att exakt bedöma de faktiska sannolikheterna.

När ett fotbollsresultat verkar överraskande beror det antingen på att högoddsaren (som verkligen var en högoddsare enligt en träffsäker prediktiv modell) hade tur eller att laget egentligen inte var någon högoddsare och att modellen hade fel.

Filosofiskt sett är det en intressant frågeställning som är svår att besvara. Här har vi att göra med två olika typer av osäkerhet.

Osäkerhet eller fel i den prediktiva modellens giltighet kallas epistemisk osäkerhet och i teorin kan den reduceras med bättre modeller.

Den andra sorten är inneboende och kallas aleatorisk osäkerhet (det vill säga slump eller tur).

Denna osäkerhet kan inte reduceras. Det kan vara svårt att separera epistemisk och aleatorisk osäkerhet. Men i de här två artiklarna för Pinnacle hoppas jag komma en bit på vägen. I denna första artikel ska jag försöka analysera överraskningsfaktorn i VM som helhet.

I den andra artikeln går jag in på vad fynden kan säga oss om hur träffsäkra spelbolagens odds är och giltigheten i den prediktiva modell som ligger till grund för oddsen. Jag granskar träffsäkerheten utifrån resultaten i fotbolls-VM.

Multipelsannolikheter för 64 matcher

Om vi uppskattar sannolikheterna för alla tre möjliga 1X2-resultat (efter 90 minuter) för varje VM-match kan vi få fram en multipelsannolikhet för varje möjlig kombination av utfall för samtliga 64 matcher. Men vilka utfallssannolikheter bör vi använda?

De flesta ambitiösa spelare har egna metoder för att beräkna dem, men för att spara tid använder jag de sannolikheter som impliceras av Pinnacles stängningsodds (som vi vet har mycket hög träffsäkerhet).

Jag har flera gånger förklarat varför Pinnacles stängningsodds är en synnerligen bra utgångspunkt när man vill få fram faktiska utfallssannolikheter.

Pinnacle tillämpar givetvis en marginal på sina odds och därför måste jag avlägsna den först. För det använder jag en egen kalkylator.

Sedan kan vi använda dessa multipla sannolikheter för att försöka besvara frågan: hur överraskande var egentligen resultaten i VM 2022?

Ett falskt narrativ

Man måste komma ihåg att sannolikheten att inga skrällar inträffar på 64 VM-matcher är försvinnande liten.

Sannolikheten att alla favoriter vinner är 11 %

Baserat på Pinnacles stängningsodds har jag räknat fram att den sannolikheten (när det gäller resultat efter 90 minuter) är 6,5 × 10-17, det vill säga drygt en på en miljon biljon.

Om det hade inträffat hade det varit en av de mest otroliga händelserna i mänsklighetens historia.

Ändå tvivlar jag på att någon annan än statistiker hade reagerat på det (annat än att kanske ta det som ett tecken på att det var ett särdeles tråkigt VM).

Varje annan multipel för 64 matcher har lägre sannolikhet. Och det finns ganska många sådana – 3 433 683 820 292 512 484 657 849 089 281 för att vara exakt.

Varenda en innehåller skrällar (om vi definierar en skräll som att det förväntade resultatet inte inträffar). Och ju mindre sannolikheten för en viss multipel är, desto större är antalet skrällar.

Men det finns bara ett sätt att bli av med alla skrällar och det är att alla förväntade resultat inträffar. Däremot finns det många olika sätt som skrällar kan inträffa på. Individuellt sett är sådana multiplar mindre sannolika men sammantaget är de mycket mer sannolika än att inte en enda skräll sker.

Låt oss ta ett enkelt binomialt exempel på tio matcher med två möjliga utfall där varje favorit har 80 % chans att vinna och varje högoddsare har 20 % chans.

Det finns cirka 11 % chans att alla favoriter vinner men 20 % chans att tre högoddsare vinner. Det finns till och med 9 % chans att fyra högoddsare gör det.

Varför är de siffrorna så höga? Individuellt sett är sannolikheterna bara 0,17 % och 0,04 % (för en given uppsättning av tre respektive fyra högoddsare) men det finns väldigt många sätt för dem att inträffa – 120 för tre högoddsare och 210 för fyra.

Med andra ord är skrällar inte oväntade. Ändå är den mänskliga hjärnan benägen att skapa simplistiska och ibland bristfälliga narrativ baserade på observerade resultat. Det beror på att vi ser oväntade utfall som mer oväntade än de faktiskt är.

När Japan förlorar mot Spanien och Tyskland finns det ingen som höjer på ögonbrynen men statistiken säger att skrällar i praktiken är garanterade ur en statistisk synvinkel. Det är ett exempel på ett falskt narrativ.

En Monte Carlo-sannolikhetsfördelning

Det finns bara ett sätt att betrakta en 64-matchmultipel med en sannolikhet på 6,5 × 10-17. Den minst troliga multipeln där alla högoddsare vinner landar på 1,5 × 10-51 och det finns bara ett sätt som det kan hända på. Men på hur många sätt kan man betrakta multipelsannolikheter på till exempel 10-25 eller 10-30?

Att hantera den typen av beräkningar algoritmiskt är alldeles för komplext. För att göra det lättare kan man använda sig av en Monte Carlo-simulering.

Genom att slumpa matchutfallen i enlighet med de Pinnacle-baserade sannolikheterna kan vi få fram en slumpmässigt genererad multipelsannolikhet för 64 matcher.

Genom att upprepa det ett stort antal gånger och räkna hur många gånger varje instans av en definierad sannolikhet inträffar kan vi få fram sannolikhetsfördelningen. Det vill säga spannet och sannolikheten för möjliga utfallshistoriker för de 64 matcherna i ett VM.

På ett intuitivt plan är det emellertid svårt att handskas med små sannolikhetsvärden. Men vi kan göra dem mycket mer kognitivt greppbara genom att beräkna deras logaritm.

Logaritmen (bas: 10) för 0,001 är till exempel -3, för 0,000001 är den -6 och för 0,000000000001 är den -12. Faktum är att jag tänker använda den naturliga logaritmen (ln) för mina ändamål (bas: e) och kapa minustecknet.

Min Monte Carlo-simulering kördes 100 000 gånger för 100 000 värden av den naturliga logaritmen för varje slumpad multipelsannolikhet (minustecknet är borttaget) för 64 matcher.

Genom att undergruppera dessa har jag sedan plottat dem på följande frekvensdiagram (sannolikhetsdiagram).

Shock-WC.png
Hela intervallet på det här diagrammets x-axel sträcker sig från 37,3 (att alla 64 favoriter vinner) till 117,1 (att alla högoddsare vinner), men som vi redan vet är deras sannolikheter försvinnande små.

Faktum är att det bara är nödvändigt att visa de mest troliga utfallen för att få en förståelse för sannolikhetsspannet. Av diagrammet framgår att det är mycket troligt att en multipel har ett x-värde på mellan 45 och 75.

Det motsvarar multipelsannolikheter på cirka 3 × 10-20 respektive 3 × 10-33.

Multipelsannolikheten minskar i takt med att vi rör oss åt höger på x-axeln. Det genomsnittliga (mest observerade) multipelutfallet har en x-axelsiffra på cirka 60 vilket motsvarar en multipelsannolikhet på 7,5 × 10-27.

Den vertikala svarta linjen på diagrammet visar de faktiska multipelutfallen i VM. X-axelvärdet är 63,5 (och multipelsannolikheten är 2,7 × 10-28).

Det är cirka 28 gånger mindre än det mest troliga multipelutfallet.

Det kan låta mycket men diagrammet talar ett annat språk. Som du märker ligger det inte långt ifrån mitten (genomsnittet) av sannolikhetsfördelningen. Faktum är att cirka 20 % av de möjliga VM-multiplarnas sannolikheter var mindre än i verkligheten.

Statistiskt sett är det föga överraskande. För att vara överraskande skulle den vertikala linjen behöva röra sig till minst 70 på x-axeln vilket motsvarar att mindre än 1 % av alla möjliga multiplar var mindre sannolika. Det motsvarar en multipelsannolikhet på cirka 4 × 10-31 eller nära 700 gånger mindre än det som faktiskt inträffade.

För det hade vi behövt se resultat som att till exempel Qatar slog Nederländerna, Polen slog Frankrike och att Sydkorea slog Brasilien.

Var VM 2022 ett överraskande mästerskap?

Vi kan nu besvara min inledande frågeställning utifrån siffrorna jag har presenterat i den här artikeln.

Och svaret är: nej, det var inte överraskande. Det förekom visserligen överraskande resultat i enskilda matcher men nu vet vi att det är att vänta i turneringar med många matcher. Det vore faktiskt långt mer överraskande om det inte blev några skrällar.

Men vad innebär egentligen ”överraskande”? Det beror på vilka förväntningar man har på förhand.

Ponera att min prediktiva modell tippade att Wales slog England, Ghana slog Portugal, Australien slog Frankrike, Costa Rica slog Tyskland och så vidare.

Då hade jag blivit väldigt förvånad av det som faktiskt hände. Beror det på att högoddsarna (enligt min modell) hade tur eller på att min prediktiva modell var felaktig?

I det här fallet är svaret ganska givet men i vanliga fall är skillnaden mellan dem mycket mer subtil.

Pinnacles uppskattningar av matchsannolikheterna speglade inte helt perfekt det som inträffade. Beror det på otur eller fel i modellen?

Det är mycket svårare att säga. Men kanske kan vi konstatera att Pinnacles prediktiva modell inte är så pjåkig eftersom det inte fanns någon statistiskt signifikant skillnad mellan Pinnacles förväntan och de faktiska utfallen.

Med andra ord var VM 2022 (ur Pinnacles synvinkel) inget särskilt överraskande mästerskap statistiskt sett. Det var mindre troligt än det mest troliga VM-utfallet (med kanske två eller tre färre skrällar) men inte markant mindre.

Om det hade funnits en statistiskt signifikant skillnad vore det lättare att argumentera emot Pinnacles uppskattningar.

Således kan vi formulera en regel: ju större skillnad mellan förväntan och verklighet, desto större är den statistiska sannolikheten att den prediktiva modellen är felaktig. Hur står sig Pinnacles modell för VM-matcher jämfört med andra spelbolags? Det kommer jag att gå igenom i del två av den här artikelserien.

Registrera dig på Pinnacle för att få fantastiska fotbollsodds på en rad olika marknader. Fler lärorika artiklar av Joseph Buchdahl hittar du på sidan Oddsresurser.

Oddsresurser: Bli en bättre spelare

Pinnacles avdelning Oddsresurser är en av nätets mest omfattande artikelsamlingar med spelråd från experter. Vi tillgodoser behoven hos både nybörjare och proffs – vårt mål är helt enkelt att öka våra spelares kunskaper.