tammi 24, 2023
tammi 24, 2023

Sokkeja ja yllätyksiä: kuinka yllättävät jalkapallon MM-kisat 2022 olivat?

Kuinka yllättävät jalkapallon MM-kisat 2022 olivat?

Monte Carlo -todennäköisyys

Altavastaajat jalkapallon MM-kisoissa 2022

Sokkeja ja yllätyksiä: osa yksi

Sokkeja ja yllätyksiä: kuinka yllättävät jalkapallon MM-kisat 2022 olivat?

Kuinka sokeeraavat jalkapallon MM-kisat 2022 olivat? Oliko Japanin voitto Saksasta niin kovinkaan iso yllätys? Joseph Buchdahl analysoi datan perusteella, olivatko arvokisojen suurimmat yllätykset sellaisia yllätyksiä, joina niitä pidimme.

Urheilun metadatapalveluntarjoajan Gracenoten mukaan jalkapallon MM-kisat 2022 Qatarissa olivat altavastaajien juhlaa, sillä kaiken kaikkiaan 15 ottelua päättyi sen määritelmän mukaiseen yllätykseen – tämä on suurin prosenttiosuus 64 vuoteen.

Qatarin MM-kisat olivat yllättävimmät MM-kisat 64 vuoteen

Mutta miten yllättävä tämä luku oikein on? Ja miten oikein edes määritämme yllätystuloksen?

Kyllä, me kaikki varmasti pidimme Japanin voittoa Espanjasta ja Saksasta sekä Saudi-Arabian voittoa Argentiinasta yllätyksinä, mutta tämä oletus perustuu siihen, miten paikkansapitäviä ovat uskomuksemme siitä, että Espanjan, Saksan ja Argentiinan olisi pitänyt voittaa nämä ottelut.

Intuitiivisesti pidämme asiaa päivänselvänä, mutta koska todellisten tulostodennäköisyyksien täydellinen selvittäminen on mahdotonta, meidän tulisi aina huomioida virhepotentiaali.

Kun jalkapallotulos tuntuu yllättävältä, johtuuko tämä siitä, että altavastaaja – joka katsotaan perustellusti altavastaajaksi tarkan ennustemallin perusteella – oli onnekas, että altavastaaja ei todellisuudessa ollutkaan altavastaaja vai että ennustemalli oli väärässä?

Tämä on mielenkiintoinen filosofinen kysymys, johon on melko vaikea löytää vastausta. Tähän liittyy kahdenlaista epävarmuutta.

Ennustemallin pätevyyteen liittyvää epävarmuutta tai virhettä kutsutaan episteemiseksi epävarmuudeksi, ja teoriassa sitä voidaan vähentää paremmalla mallintamisella.

Toisenlainen epävarmuus on luontaista, ja sitä kutsutaan aleatoriseksi epävarmuudeksi – eli yleisemmin sattumaksi, tuuriksi, satunnaisuudeksi tai sattumanvaraisuudeksi.

Tällainen epävarmuus ei ole johdettavissa. Episteemisen ja aleatorisen epävarmuuden erottaminen toisistaan voi olla vaikeaa. Näissä Pinnaclelle kirjoittamissani artikkeleissa pyrin kuitenkin osaltaan juuri tähän. Ensimmäisessä artikkelissa tutkin yllätystekijää MM-kisoista kokonaisuudessaan.

Toisessa artikkelissa (MM-kisojen käyttö tehokkuuden testaamiseksi), kerron lisää siitä, mitä havainnot voivat kertoa meille vedonvälittäjien vedonlyöntikertoimien tarkkuudesta (tai tehokkuudesta) ja niiden luomiseen käytetyn ennustusmallin pätevyydestä.

64 ottelun monivetotodennäköisyydet

Jos arvioimme kunkin MM-ottelun 90 minuutin kolmen mahdollisen tuloksen todennäköisyydet, voimme muodostaa 64 ottelun moninvetotodennäköisyyden jokaiselle mahdolliselle tulosyhdistelmälle. Mutta mitä tulosten todennäköisyyksiä meidän pitäisi käyttää?

Useimmilla aloittelevilla vedonlyöjillä on varmaankin omat tapansa niiden laskemiseksi, mutta säästääkseni aikaa – ja koska tiedän, että ne ovat parhaat saatavilla olevat todennäköisyydet – käytän Pinnaclen vedonlyöntikertoimien perusteella laskettuja todennäköisyyksiä.

Olen käsitellyt useaan otteeseen siitä, miksi Pinnaclen sulkemiskertoimet ovat parhaita mahdollisia todellisen todennäköisyyden arvioimiseksi.

Pinnacle on tietysti lisännyt näihin kertoimiin oman katteensa, joten se pitää poistaa ensin. Minulla on oma laskin tätä varten.

Näiden moninvetotodennäköisyyksien perusteella voimme sitten yrittää vastata kysymykseen siitä, kuinka kollektiivisesti yllättäviä jalkapallon MM-kisojen 2022 tulokset olivat.

Tarinalliset virhepäätelmät

On syytä huomioida, että todennäköisyys sille, että yksikään MM-kisojen 64:stä ottelusta ei päättyisi yllätykseen, on häviävän pieni.

On 11 prosentin todennäköisyys sille, että kaikki ennakkosuosikit voittavat.

Pinnaclen sulkemiskertoimien perusteella olen laskenut tämän todennäköisyyden olevan 6,5 x 10-17 (eli hieman yli yksi miljoonasta triljoonasta) 90 minuutin tulosten perusteella.

Jos näin oli käynyt, se olisi ollut yksi ihmiskunnan historian hämmästyttävimmistä tapahtumista.

Silti epäilen, olisivatko tilastotieteilijöitä lukuun ottamatta kovinkaan monet edes kiinnittäneet asiaan huomiota muuta kuin kenties toteamalla kyseessä olleen varsin tylsät MM-kisat.

Jokaisella muulla 64 ottelun monivedolla – ja niitä on paljon, kolme potenssiin 64 eli tarkalleen ottaen 3 433 683 820 292 512 484 657 849 089 281 – on pienempi todennäköisyys.

Jokainen niistä sisältää yllätyksiä (kun määritämme yllätykseksi sen, että suosikkitulos ei toteudu). Ja mitä pienempi monivedon todennäköisyys, siitä suurempi määrä yllätyksiä.

On kuitenkin vain yksi tapa sille, että yllätyksiä ei ilmene: kaikkien suosikkitulosten täytyy toteutua. Yllätyksiä puolestaan voi ilmetä monin eri tavoin. Yksitellen niiden 64 ottelun monivetotodennäköisyys voi olla pienempi, mutta kollektiivisesti on todennäköisempää, että niitä esiintyy kuin että niitä ei esiintyisi ollenkaan.

Tarkastellaan yksinkertaista binomiaalista esimerkkiä, jossa on 10 ottelua, joissa on kaksi mahdollista lopputulosta ja joissa kullakin suosikilla on 80 prosentin voittotodennäköisyys sekä kullakin altavastaajalla 20 prosentin voittotodennäköisyys.

On noin 11 prosentin mahdollisuus, että kaikki suosikit voittavat, mutta 20 prosentin mahdollisuus, että kolme altavastaajista voittaa, ja jopa 9 prosentin mahdollisuus, että neljä altavastaajista voittaa.

Miksi niin suuri todennäköisyys? Yksittäiset todennäköisyydet ovat vain 0,17 % ja 0,04 % (kolmella tai neljällä altavastaajalla), mutta niitä voi tapahtua niin monella tavalla: 120 tavalla kolmella altavastaajalla ja 210 tavalla neljällä altavastaajalla.

Tämä kaikki on vain toinen tapa sanoa, että yllätyksiä on syytä odottaa. Silti aivan liian usein aivomme pyrkivät luomaan yksinkertaistettuja ja joskus virheellisiä tarinoita datan perusteella järkeilläksemme maailmaa, jossa yllätyksiä pidetään epätodennäköisempinä kuin ne todellisuudessa ovat.

Jos Japani ei voita Espanjaa ja Saksaa, siitä ei kirjoiteta tarinoita, mutta tilastot osoittavat meille, että nämä yllätystulokset ovat käytännössä tilastollinen varmuus. Tämä on esimerkki tarinallisesta virhepäätelmästä.

Monte Carlo -todennäköisyysjakauma

On vain yksi tapa saada oikein 64 ottelun moniveto todennäköisyydellä 6,5 x 10-17. Kaikkein epätodennäköisin moniveto, jossa kaikki altavastaajat voittavat, saa kertoimeksi 1,5 x 10-51, ja myös tämän toteutumiseen on vain yksi tapa. Mutta kuinka monella tavalla voi toteutua esimerkiksi moniveto, jonka todennäköisyys on 10-25 tai 10-30?

Tällaisen laskennan käsittely algoritmisesti on aivan liian monimutkaista. Asioiden helpottamiseksi on hyvä rakentaa Monte Carlo -simulaatio.

Satunnaistamalla ottelutulokset määriteltyjen Pinnacle-todennäköisyyksien mukaisesti voimme luoda satunnaisesti luodun 64 ottelun moninvetotodennäköisyyden.

Kun toistamme tätä tarpeeksi monta kertaa, voimme laskea, kuinka monta kertaa kukin määritelty todennäköisyys toteutuu, ja voimme määritellä todennäköisyyksien todennäköisyysjakauman. Toisin sanoen voimme siis määritellä 64 MM-kisojen ottelun mahdollisten lopputuloshistorioiden vaihteluvälin ja todennäköisyyden.

Pienten todennäköisyysarvojen käsittely on kuitenkin luonnostaan melko vaikeaa. Voimme kuitenkin soveltaa pientä muunnosta, joka tekee niistä kognitiivisesti paljon helpommin käsiteltäviä: laskemme niiden logaritmin.

Esimerkiksi 0,001:n logaritmi (kanta 10) on -3, 0,000001:n logaritmi on -6 ja 0,000000000001:n logaritmi on -12. Itse asiassa käytän tarkoituksiini luonnollista logaritmia (ln) (kanta e), ja jätän miinusmerkin pois.

Monte Carlo -simulaationi sisälsi 100 000 suorituskertaa 100 000:lle satunnaistetun 64 ottelun moninvetotodennäköisyyden luonnollisen logaritmin arvolle (miinusmerkki poistettu).

Ryhmittelin nämä alaryhmiin ja piirsin ne seuraavaan frekvenssijakaumakaavioon (tai todennäköisyysjakamaukaavioon).

Shock-WC.png
Kaavion x-akselin koko vaihteluväli on 37,3 (kaikki 64 suosikkia voittavat) – 117,1 (kaikki altavastaajat voittavat), mutta kuten tiedämme, niiden todennäköisyydet ovat mahdottoman pieniä.

Itse asiassa on tarpeen näyttää vain todennäköisimmät lopputulokset, jotta saadaan käsitys siitä, mikä on mahdollisuuksien kirjo. Kun tarkastellaan kaaviota, nähdään, että on hyvin todennäköistä, että 64 ottelun moninvedon arvo x-akselilla on jossakin 45:n ja 75:n välillä.

Nämä vastaavat karkeasti monivetotodennäköisyyksiä 3 x 10-20 ja 3 x 10-33.

Monivetotodennäköisyys pienenee x-akselilla oikealle siirryttäessä. Keskimääräisellä, eli todennäköisimmin ilmenevällä, monivetotuloksella on x-akselilla arvona noin 60, mikä vastaa monivetotodennäköisyyttä 7,5 x 10-27.

Kaaviossa on myös esitetty pystysuoralla mustalla viivalla myös MM-kisojen tulosten mukaan toteutuneen monivedon sijainti. Sen x-akselin arvo on 63,5 (ja moninvetotodennäköisyys on 2,7 x 10-28).

Tämä on noin 28 kertaa pienempi kuin todennäköisin monivetotulos.

Tämä kuulostaa isolta, mutta kaavio kertoo toisenlaista tarinaa. Näet, että se ei ole kovin kaukana todennäköisyysjakauman keskipisteestä (keskiarvosta). Itse asiassa noin 20 prosenttia MM-kisojen mahdollisista monivetotodennäköisyyksistä oli oikeasti toteutunutta pienempiä.

Tilastollisesti emme kutsuisi tätä yllättäväksi. Tätä varten haluaisimme pystysuoran viivan siirtyvän x-akselilla vähintään 70:een, mikä tarkoittaa, että alle 1 prosenttia mahdollisista monivedoista on epätodennäköisempiä. Tämä vastaisi monivetokerrointa (noin) 4 x 10-31, mikä on miltei 700 kertaa pienempi kuin toteutunut.

Tätä varten olisi esimerkiksi Qatarin pitänyt voittaa Alankomaat, Puolan voittaa Ranska ja Etelä-Korean voittaa Brasilia.

Olivatko nämä MM-kisat yllättävät?

Tässä artikkelissa esitetyn datan perusteella olemme nyt valmiita vastaamaan tähän kysymykseen.

Ei, kisat eivät olleet kovinkaan yllättävät. Kyllä, yksittäisissä otteluissa tuli yllätyksiä, mutta kuten nyt tiedämme, tämä on täysin odotettua turnauksessa, jossa on paljon otteluita. Itse asiassa olisi paljon yllättävämpää, jos yhtään yllätystuloksia ei olisi tullut.

Mutta mitä yllättävä oikein filosofisesti edes tarkoittaa? Tämä riippuu hyvin pitkälti siitä, millaiset alkuodotukset meillä on ottelun tulokselle.

Oletetaan äärimmäisenä esimerkkinä esimerkiksi vaikka, että ennustemallissani Wales olisikin ollut selvä ennakkosuosikki Englantia vastaan, Ghana Portugalia vastaan, Australia Ranskaa vastaan, Costa Rica Saksaa vastaan ja niin edelleen kaikissa 64 ottelussa.

Tässä tapauksessa olisin toki ollut hyvin yllättynyt siitä, mitä todellisuudessa tapahtui. Johtuuko tämä siis siitä, että altavastaajat, mallini mukaiset, olivat onnekkaita vai että ennustemallini oli väärässä?

Tässä tapauksessa se on melko selvää, mutta yleensä ero näiden kahden välillä on paljon hienovaraisempi.

Pinnaclen arviot otteluiden todennäköisyyksille eivät vastanneet täysin sitä, mitä todellisuudessa tapahtui. Johtuuko tämä sitten huonosta onnesta vai mallin virheestä?

Nyt tätä onkin paljon vaikeampi sanoa. Ehkä voimme kuitenkin sanoa, että koska Pinnaclen odotusten ja todellisten tapahtumien välillä ei ole tilastollisesti merkitsevää eroa, meillä on hyvät perusteet väittää, että Pinnaclen ennustemalli ei ole ollenkaan huono.

Toisin sanoen voisimme siis sanoa, että MM-kisat eivät olleet tilastollisesti (Pinnaclen näkemyksen mukaan) erityisen yllättävät. Kisojen tulos oli epätodennäköisempi kuin todennäköisin MM-kisojen lopputulos (jossa olisi nähty ehkä kaksi tai kolme yllättävää tulosta vähemmän kuin mitä todellisuudessa tapahtui), mutta ei kuitenkaan kovinkaan suurella erolla.

Jos ero olisi tilastollisesti merkittävä, Pinnaclen näkemystä olisi ollut helpompi kritisoida.

Voisimme siis muotoilla säännön: mitä suurempi ero odotusten ja todellisuuden välillä on, sitä suurempi on tilastollinen todennäköisyys sille, että ennustemallimme on väärä. Miten Pinnaclen jalkapallon MM-kisojen ennustemalli vertautuu muiden vedonvälittäjien vastaaviin? Tätä käsittelemme juttusarjan toisessa osassa.

Rekisteröidy Pinnaclella ja pelaa erinomaisin jalkapallokertoimien monipuolisia erilaisia kohteita. Muista tutustua myös muihin Joseph Buchdahlin oivaltavin artikkeleihin vedonlyöntiresursseissa.

Vedonlyöntiresurssit auttavat vedonlyönnissä

Pinnaclen Vedonlyöntiresurssit-osio on yksi netin kattavimmista asiantuntevan vedonlyöntineuvonnan kokoelmista. Tavoitteenamme on auttaa kaikentasoisia vedonlyöjiä parantamaan tietämystään.