gen 24, 2023
gen 24, 2023

Shock e ribaltoni: la Coppa del Mondo 2022 è stata davvero così sorprendente?

La Coppa del Mondo 2022 è stata davvero così sorprendente?

La probabilità di Monte Carlo

Le sfavorite nella Coppa del Mondo 2022

Shock e ribaltoni: parte prima

Shock e ribaltoni: la Coppa del Mondo 2022 è stata davvero così sorprendente?

Quanto è stata singolare la Coppa del Mondo 2022? La vittoria del Giappone contro la Germania è stata davvero un evento imprevedibile? Joseph Buchdahl analizza i dati per capire se le grandi sorprese in un torneo con così tante partite sono davvero inattese come potremmo pensare.

Secondo la società di metadati sportivi Gracenote, la Coppa del Mondo 2022 in Qatar è stata terreno fertile per le sfavorite: 15 partite hanno registrato quelle che vengono definite "sorprese", la percentuale più alta da 64 anni a questa parte.

La competizione in Qatar è stata la Coppa del Mondo più singolare degli ultimi 64 anni

Ma in che misura possiamo definirla sorprendente e come si fa a decidere cosa si intende per sorpresa?

Probabilmente tutti riteniamo che la vittoria del Giappone sulla Spagna e sulla Germania e quella dell'Arabia Saudita sull'Argentina siano state sorprendenti, ma questa premessa dipende dal fatto che Spagna, Germania e Argentina avrebbero dovuto presumibilmente vincere quelle partite.

Intuitivamente potremmo pensare che sia ovvio, ma quando è impossibile conoscere perfettamente le probabilità di risultato, dovremmo sempre essere attenti al potenziale di errore.

Quando un risultato calcistico sembra sorprendente è perché la sfavorita, giustamente considerata tale da un modello di previsione accurato, è stata fortunata o perché la sfavorita non era in realtà tale e il modello di previsione era sbagliato?

Filosoficamente, si tratta di un rompicapo interessante e di difficile risoluzione. In questo caso, abbiamo a che fare con due tipi di incertezza.

L'incertezza o l'errore nella validità del modello di previsione è definita incertezza epistemica e, in teoria, può essere ridotta con una migliore modellazione.

L'altro tipo è intrinseco e viene definita incertezza aleatoria, più comunemente nota come caso, fortuna o casualità.

Questa incertezza è irriducibile. Separare l'incertezza epistemica da quella aleatoria può essere complicato. In questi due articoli per Pinnacle, spero di offrire un piccolo contributo in tal senso. Nel primo articolo cercherò di studiare il fattore sorpresa della Coppa del Mondo nel suo complesso.

Nel secondo articolo, Utilizzo dei dati della Coppa del Mondo per testare l'efficienza, proseguirò discutendo di ciò che i risultati possono dirci sulla precisione (o sull'efficienza) delle quote delle scommesse di un bookmaker e sulla validità del modello di previsione che le costruisce.

Probabilità multiple a 64 partite

Se calcoliamo le probabilità di ciascuno dei tre possibili risultati nei 90 minuti per ciascuna partita della Coppa del Mondo, possiamo costruire una probabilità multipla a 64 partite per ogni possibile combinazione di risultati. Ma quali probabilità di risultato dobbiamo utilizzare?

La maggior parte degli aspiranti scommettitori ha senza dubbio metodi di calcolo personali, ma per risparmiare tempo e sapendo di avere a disposizione alcune delle migliori probabilità disponibili, utilizzerò quelle implicite nelle quote di chiusura delle partite di Pinnacle.

Ho discusso a lungo in diverse occasioni sul motivo per cui le quote di chiusura di Pinnacle sono tra le migliori disponibili per valutare i risultati di probabilità reali.

Pinnacle ha ovviamente un margine aggiunto a tali quote, quindi devo prima rimuoverlo. Per farlo, uso un calcolatore personale.

Possiamo in seguito utilizzare queste probabilità multiple per tentare di rispondere alla domanda: quanto sono stati sorprendenti, nel complesso, i risultati della Coppa del Mondo 2022?

Fallacia narrativa

Vale la pena fare una breve riflessione per capire che la probabilità che non si verifichino sorprese nelle 64 partite della Coppa del Mondo è irrisoria.

Esiste l'11% di possibilità che tutte le favorite vincano

Utilizzando le quote di chiusura di Pinnacle, ho calcolato che questa probabilità è di 6,5 x 10-17 o poco più di una su 1 milione di trilioni, per i risultati dopo i 90 minuti.

Se questo fosse accaduto, sarebbe stato uno degli eventi più sorprendenti nella storia dell'umanità.

Eppure, mi chiedo se molte persone, non esperte in campo statistico, vi avrebbero prestato attenzione, se non per osservare che questo dimostrava il fatto che la Coppa del Mondo era stata molto noiosa.

Ogni altra multipla a 64 partite, e ce ne sono molte, tre alla 64a o 3.433.683.820.292.512.484.657.849.089.281 per essere precisi, ha una probabilità inferiore.

Ognuna di esse prevede necessariamente sorprese (se definiamo "sorpresa" il risultato pronosticato che non si verifica) e più piccola è la probabilità multipla, maggiore è il numero di sorprese.

Tuttavia, c'è un solo modo per non avere sorprese: tutti i risultati pronosticati devono verificarsi. Al contrario, le sorprese possono avvenire in molti modi. Singolarmente, la loro probabilità multipla a 64 partite può essere minore, ma collettivamente è più probabile che si verifichino piuttosto che il contrario.

Si consideri un semplice esempio binomiale di 10 partite con due possibili risultati, in cui ciascuna favorita ha una probabilità di vittoria dell'80% e ciascuna sfavorita del 20%.

La probabilità che tutte le favorite vincano è dell'11%, ma la probabilità che vincano tre sfavorite è il 20% e la probabilità che vincano quattro sfavorite è addirittura il 9%.

Perché le probabilità sono così elevate? Singolarmente, le probabilità sono solo dello 0,17% e dello 0,04% (per uno specifico gruppo di tre o quattro sfavorite, rispettivamente), ma l'evento può verificarsi in molti modi, 120 per tre sfavorite e 210 per quattro di loro.

In pratica, le sorprese sono prevedibili. Eppure, troppo spesso siamo portati a ricavare dai dati inferenze semplici e talvolta errate per giustificare il fatto che si tendono a considerare le sconfitte più inattese di quanto siano in realtà.

Quando il Giappone non batte la Spagna e la Germania, non ce ne preoccupiamo, ma le statistiche rivelano che questi risultati sorprendenti sono effettivamente una certezza statistica. Questo è un esempio di fallacia narrativa.

Una distribuzione di probabilità Monte Carlo

C'è solo un modo per cui si può verificare una multipla a 64 partite con una probabilità di 6,5 x 10-17. La multipla meno probabile che prevede che tutte le sfavorite vincano è di 1,5 x 10-51 e anche in questo caso può verificarsi solo in un modo. Ma in quanti modi si potrebbero verificare probabilità multiple, ad esempio di 10-25 o 10-30?

Eseguire algoritmicamente questo tipo di calcolo è troppo complesso. Per semplificare, è una buona idea costruire una simulazione Monte Carlo.

Randomizzando i risultati delle partite in base alle probabilità definite da Pinnacle, possiamo creare una probabilità multipla a 64 partite generata in modo casuale.

Ripetendo questa operazione molte volte, contando quante volte si verifica una determinata probabilità, possiamo stabilire la distribuzione della probabilità di verosimiglianza. In sostanza, possiamo definire il range e la probabilità dei possibili risultati delle 64 partite della Coppa del Mondo.

Lavorare con valori di probabilità minuscoli, tuttavia, è intuitivamente piuttosto difficile. Comunque, possiamo applicare una piccola trasformazione per renderli molto più gestibili cognitivamente: calcolare il loro logaritmo.

Il logaritmo (in base 10) di 0,001, ad esempio, è -3; per 0,000001 è -6 e per 0,000000000001 è -12. In realtà, per il mio scopo userò il logaritmo naturale (ln) (base e) e toglierò il segno negativo.

La mia simulazione Monte Carlo conteneva 100.000 esecuzioni, per 100.000 valori del logaritmo naturale di ciascuna probabilità multipla di 64 partite randomizzate (togliendo il segno negativo).

Ho creato sottogruppi di questi valori, poi li ho tracciati sul seguente grafico della distribuzione di frequenza (o di verosimiglianza).

Shock-WC.png
L'intero intervallo sull'asse delle ascisse di questo grafico va da 37,3 (per tutte le 64 favorite vincenti) a 117,1 (per tutte le sfavorite vincenti), ma come sappiamo le loro probabilità sono estremamente ridotte.

Infatti, per avere un'idea dell'intervallo di possibilità si devono solo mostrare i risultati più probabili. Osservando il grafico, notiamo che è molto probabile che una multipla a 64 partite abbia un valore sull'asse delle ascisse compreso tra 45 e 75.

Questi valori corrispondono, rispettivamente, a probabilità multiple di circa 3 x 10-20 e di 3 x 10-33.

La probabilità multipla diminuisce man mano che ci si sposta a destra lungo l'asse X. Il risultato multiplo medio, o più probabilmente osservato, ha un valore sull'asse delle ascisse di circa 60, corrispondente a una probabilità multipla di 7,5 x 10-27.

Il grafico illustra anche, tramite la linea nera verticale, la posizione del risultato multiplo della Coppa del Mondo effettivamente osservato. Ha un valore sull'asse delle ascisse di 63,5 (e una probabilità multipla di 2,7 x 10-28).

Questo valore è di circa 28 volte inferiore al più probabile dei risultati multipli.

Sembra molto, ma la realtà che si può desumere dal grafico è ben diversa. Si può notare che non è così lontano dal centro (la media) della distribuzione di verosimiglianza. In effetti, circa il 20% delle possibili probabilità multiple della Coppa del Mondo era inferiore a quella che si è effettivamente verificata.

Statisticamente, non è una sorpresa. Perché lo sia, la linea verticale dovrebbe spostarsi almeno su 70 sull'asse delle ascisse, il che significa che meno dell'1% delle possibili multiple erano meno probabili. Ciò corrisponderebbe a una probabilità multipla di circa 4 x 10-31 o quasi 700 volte inferiore a quella che si è verificata.

Per questo, avremmo dovuto assistere a sorprese come una vittoria del Qatar sull'Olanda, della Polonia sulla Francia e della Corea del Sud sul Brasile.

È stata una Coppa del Mondo sorprendente?

Basandoci sui dati riportati in questo articolo, ora possiamo rispondere alla domanda iniziale.

No, non molto. Sì, si sono verificate sorprese in singole partite, ma ora sappiamo che sono prevedibili in tornei con molte partite. Anzi, sarebbe molto più sorprendente se non ce ne fossero state.

Da un punto di vista filosofico, tuttavia, come definiremmo effettivamente una sorpresa? Questo dipende in gran parte dalle nostre aspettative iniziali sui risultati delle partite.

Supponiamo, come esempio estremo, che il mio modello di previsione dia il Galles come favorito sull'Inghilterra, il Ghana sul Portogallo, l'Australia sulla Francia, la Costa Rica sulla Germania e così via per tutte le 64 partite.

Verosimilmente, sarei molto sorpreso dagli eventi. È quale sarebbe il motivo? Le sfavorite, secondo le definizioni del mio modello, sono state fortunate o il mio modello di previsione era sbagliato?

In questo caso è piuttosto ovvio, ma di solito la distinzione tra le due ipotesi è molto più sottile.

Le stime di Pinnacle per le probabilità delle partite non hanno colto perfettamente ciò che si è verificato. Dobbiamo attribuirlo alla sfortuna o a un errore del modello?

Ora è molto più difficile dirlo. Tuttavia, forse possiamo dire che, poiché non esiste una differenza statisticamente significativa tra le aspettative di Pinnacle e gli eventi del mondo reale, possiamo ragionevolmente sostenere che il modello di previsione di Pinnacle non è poi così sbagliato.

In altre parole, la Coppa del Mondo (secondo la visione di Pinnacle) non è stata, statisticamente parlando, particolarmente sorprendente. È stata meno probabile del risultato più probabile della Coppa del Mondo (nel quale ci sarebbero state forse due o tre sconfitte in meno rispetto a quelle che si sono effettivamente verificate), ma non in grande misura.

Se ci fosse stata una differenza statisticamente significativa, sarebbe stato più facile mettere in discussione il punto di vista di Pinnacle.

Dunque, potremmo formulare una regola: maggiore è differenza tra le aspettative e la realtà, maggiore è la probabilità statistica che il nostro modello di aspettative sia sbagliato. Come si colloca il modello di previsione delle partite della Coppa del Mondo di Pinnacle rispetto agli altri bookmaker? Questo è l'argomento della seconda parte di questa serie.

Apri un conto su Pinnacle per ottenere straordinarie quote sul calcio in un'ampia serie di mercati. Dai un'occhiata agli altri articoli di approfondimento di Joseph Buchdahl nelle Risorse per le scommesse.

Risorse per le scommesse - Migliora le tue scommesse

La sezione Risorse per le scommesse di Pinnacle è una delle raccolte disponibili online più complete di consigli di esperti sulle scommesse. Organizzata per tutti i livelli di esperienza, il nostro obiettivo è semplicemente quello di permettere agli scommettitori di diventare più esperti.