giu 16, 2023
giu 16, 2023

Ci si può basare sugli xG per i pronostici delle partite di calcio in modo da ricavare un profitto dalle scommesse?

Comprendere i goal previsti

Utilizzo degli xG per pronosticare i risultati del calcio

Analisi del modello Dixon-Coles

Ci si può basare sugli xG per i pronostici delle partite di calcio in modo da ricavare un profitto dalle scommesse?

La statistica dei goal previsti è uno strumento per i pronostici molto diffuso. Gli scommettitori possono utilizzare i goal previsti per determinare un risultato accurato? L'analista delle scommesse, Joseph Buchdahl, analizza i dati e spiega se è possibile pronosticare i risultati nel calcio sulla base dei goal previsti.

Nelle scommesse sportive, almeno per chi aspira a trattarle come qualcosa di più di un hobby divertente, il concetto di pronostico è noto da tempo, in particolare l'idea di valore atteso.

Le scommesse si vincono e si perdono, ma spesso gli eventi sono determinati dalla fortuna.

A lungo termine, tuttavia, conoscere il valore atteso consente allo scommettitore di stimare la vincita attesa su un campione più ampio di scommesse. "Atteso" o "Previsto" è come dire "media aritmetica" o "media".

Più recentemente, il concetto di "previsione" ha trovato spazio nel calcio grazie alla nozione di goal previsti o xG. I Goal previsti sono utilizzati come parametro di prestazione per valutare le prestazioni di squadre e giocatori di calcio, assegnando una probabilità a un'opportunità di segnare che può determinare un goal.

Il calcolo si basa sui dati storici di opportunità equivalenti e sul tasso di conversione dei goal. Pertanto, il valore di xG per un'opportunità di segnare sarà compreso tra 1 e 0.

Inoltre, sommando gli xG di una partita con un certo numero di occasioni da goal si ottiene il valore di xG della partita stessa o, più comunemente, il valore di xG di ciascuna squadra in una partita.

Gli xG offrono una rappresentazione più fedele della qualità di gioco delle squadre in una partita.

In teoria, gli xG offrono una rappresentazione più veritiera della qualità del gioco delle squadre in una partita e della superiorità di una squadra rispetto a un'altra, rispetto ai goal reali.

Segnare un goal spesso dipende dalla fortuna (per gli statistici il cosiddetto "rumore") e basarsi su un risultato effettivo per pronosticare il risultato di una squadra nella partita successiva potrebbe essere meno affidabile rispetto a fare riferimento ai suoi xG.

In un certo senso, i goal sono come le vincite e le perdite nelle scommesse, mentre i goal previsti sono come il valore atteso. In tal caso, possiamo usare gli xG invece dei goal per pronosticare il risultato delle partite di calcio e ricavare un profitto nelle scommesse?

Goal rispetto a xG

Il matematico e autore di Soccermatics: Mathematical Adventures in the Beautiful Game, David Sumpter, ha dato indicazioni sull'utilità relativa dei goal rispetto agli xG nel tentativo di pronosticare l'esito di partite future. Sumpter illustra in modo sintetico la difficoltà di trovare un segnale per un pronostico dai dati dei goal.

"Da un punto di vista statistico, nel risultato di una partita di calcio il rumore è praticamente pari al segnale. Una spiegazione matematica di questo concetto si può trovare direttamente nella distribuzione di Poisson. I goal nel calcio sono distribuiti secondo la distribuzione di Poisson e le squadre segnano in media circa 1,4 goal. La varianza e la media sono uguali nella distribuzione di Poisson. Quindi, la deviazione standard è la radice quadrata di 1,4, ovvero 1,18. Pertanto, il rumore (1,18) è solo leggermente inferiore al segnale (1,4)".

Gli xG, invece, misurano le occasioni create e quindi riflettono meglio la qualità di una squadra durante una singola partita rispetto ai goal.

In genere presentano meno rumore e più segnale. Sia per i goal che per gli xG, l'entità di rumore nei risultati delle partite diminuisce all'aumentare del numero di partite studiate. Tuttavia, la percentuale di diminuzione è inizialmente superiore per gli xG rispetto ai goal.

Sumpter sfrutta queste informazioni per consigliare il tipo di dati su cui concentrarsi quando si cerca di fare pronostici sulle partite future. Per una o due partite, è il resoconto della partita stessa a fornire le informazioni più utili.

Dall'altra parte, per campioni di oltre 15 partite o per la parte migliore della metà di una stagione, i dati sui goal saranno potenzialmente affidabili quanto gli xG.

Il rumore sarà pur sempre lievemente superiore, ma la differenza è minima. Inoltre, i goal rappresentano la realtà, ciò che è accaduto, mentre gli xG sono un modello probabilistico delle possibilità di segnare. Se è impreciso, può rivelarsi meno affidabile dei dati relativi ai goal.

Tra questi estremi si trova un'area interessante dal punto di vista dell'utilizzo degli xG come strumento di previsione. Sumpter sostiene che il rapporto sugli xG sarà più utile tra le tre e le sei partite, mentre tra le sette e le 15 partite potrebbe essere più utile un confronto tra goal e xG.

Per questo articolo, ho creato un modello di previsione degli xG basato sulle ultime sei partite giocate da una squadra per valutare se poteva essere utilizzato per realizzare un profitto nelle scommesse.

Modello Dixon-Coles

L'approccio più documentato ai pronostici sulle partite di calcio è stato pubblicato da Mark Dixon e Stuart Coles (dell'Università di Lancaster) sul Journal of Applied Statistics nel 1997.

Noto ovviamente come modello Dixon-Coles, sviluppa il concetto di forza dell'attacco e della difesa, confrontando i goal e le reti subite dalle singole squadre con le medie del campionato relative a un determinato numero di partite precedenti.

Questi dati vengono poi utilizzati per stimare il numero previsto di goal che ciascuna squadra segnerà nella partita successiva.

Infine, la distribuzione di Poisson viene utilizzata per calcolare le probabilità dei singoli goal, laddove il numero di goal previsto è la media della distribuzione. Su Pinnacle è disponibile un articolo che descrive la metodologia.

In questo caso, ho adattato il modello per utilizzare gli xG al posto dei goal, calcolando i punti di forza dell'attacco e della difesa in base alle sei partite più recenti in casa o in trasferta. Il mio set di dati comprendeva le partite giocate nei campionati principali inglese, francese, tedesco, italiano e spagnolo durante le stagioni dal 2015/16 al 2019/20.

Le probabilità di previsione per i risultati in casa, in pareggio e in trasferta sono state convertite in quote implicite di scommesse e confrontate con i prezzi di chiusura di Pinnacle.

Quando questi ultimi erano più lunghi, rappresentavano il valore teorico del modello di previsione. Le scommesse di valore sono state poi confrontate con i risultati.

Il grafico seguente mostra le serie temporali dei profitti delle 7.795 opportunità di scommesse di valore individuate dal modello, su un totale possibile di 18.006. Il profitto netto delle puntate fisse sui ricavi complessivi è stato pari a -5,0%. La perdita sarebbe stata del -4,3%, se si fosse scommesso su tutti i 18.006 risultati alla cieca con una puntata singola. Dato che il valore medio atteso per questo campione era del 38,9%, dire che si tratta di un risultato inferiore alle attese sarebbe decisamente un eufemismo.

colesdixon1.png

Potenziale inefficacia del modello

Forse il primo indizio dell'inefficacia di questo modello è il valore del valore medio atteso.

Con una quota media di 4,69, un valore di quasi il 40% per il valore medio atteso dalle scommesse che costituiscono più di un terzo di tutte le opportunità possibili suggerisce decisamente una notevole varianza delle quote implicite per scommesse eque rispetto ai prezzi effettivi di Pinnacle.

Un grafico di correlazione tra i valori xG previsti dal modello e i valori xG effettivi registrati per la partita pronosticata conferma quanto illustrato.

colesdixon.png

Il rumore presente è notevole; gli xG del modello non pronosticano in modo accurato gli xG di una partita effettiva di una squadra.

La causa dell'inefficacia del modello potrebbe essere più difficile da individuare, poiché vi sono potenzialmente almeno quattro problemi. In primo luogo, l'utilizzo di un modello Dixon-Coles per pronosticare i risultati calcistici può essere intrinsecamente difettoso. La distribuzione di Poisson presuppone che i goal segnati siano indipendenti l'uno dall'altro, ovvero che un goal non ne provochi un altro.

Tuttavia, ciò ignora l'influenza della psicologia dei giocatori e della squadra. Le squadre in svantaggio possono essere più motivate a ristabilire l'equilibrio di quanto non lo fossero in precedenza, mentre le squadre che stanno pareggiando potrebbero essere più motivate a segnare.

Se è così, si deve mettere in discussione l'idea che segnare goal sia frutto del caso.

Gli stessi Dixon e Coles hanno riferito che il loro modello di previsione originale riportava in modo insufficiente i risultati con punteggi bassi (0-0, 1-0, 0-1 e 1-1). Per confermare questo risultato, ho riordinato separatamente i dati degli xG previsti dal modello e quelli effettivi della partita, dal più basso al più alto, e li ho tracciati come una correlazione artificiale (linea continua).

È chiaro che ci sono meno punteggi effettivi con xG bassi di quelli previsti dal mio modello, mentre ci sono più punteggi con xG elevati di quelli che dovrebbero essere presenti (linea tratteggiata).

Ciò che Dixon e Coles hanno riscontrato per i goal sembra valere anche per gli xG, un risultato che non sorprende del tutto, dato che i goal e gli xG delle partite sono ben correlati in campioni di dati ampi.

colesdixon3.png

Una seconda possibile fonte di errore è il modello stesso degli xG. Per il mio campione di dati, gli xG totali sono stati il 97,8% dei goal effettivi segnati nelle partite. Anche se sembra una corrispondenza soddisfacente, è difficile sapere se questa differenza possa essere sufficiente a incidere sulla validità di un modello di previsione degli xG.

Una terza fonte di errore potrebbe essere la scelta del numero di partite recenti utilizzate per calcolare i punti di forza dell'attacco e della difesa di Dixon-Coles.

Per i motivi che ho esposto all'inizio dell'articolo, ho scelto sei partite. Forse un numero diverso, superiore o inferiore, avrebbe funzionato meglio.

Una modifica del genere sarebbe relativamente facile da implementare, anche se richiederebbe una riesecuzione completa del modello, cosa che non intendo fare in questa sede.

Inoltre, ho attribuito la stessa ponderazione a tutte e sei le partite. Dixon e Coles hanno riconosciuto che alle partite più recenti dovrebbe forse essere attribuita una ponderazione maggiore nel calcolo della forza media e hanno introdotto tale ponderazione nelle versioni successive del modello.

Anche in questo caso, si tratta di una funzione che potrei modellare personalmente, ma, poiché il processo richiede molto tempo, ho deciso di soprassedere.

Rimane un ultimo problema quando si cerca di trarre profitto dai pronostici delle partite di calcio, un problema forse più sostanziale relativo al mio modello.

A parte tutte le altre possibili fonti di errore, anche un modello xG ben congegnato, di gran lunga migliore del mio, potrebbe non riuscire a garantire un profitto non casuale, perché non ha la stessa efficacia del modello che il bookmaker utilizza per compilare le proprie quote.

Dato che Dixon-Coles è un modello ben documentato e che gli xG sono ormai una metrica ampiamente utilizzata, è possibile che tutte le informazioni che si ricavano da un simile approccio previsionale siano già integrate nelle quote dei bookmaker.

Un concorso di competenze relative

Le scommesse sportive sono molto simili agli sport competitivi su cui si basano. Si tratta di una gara di abilità relativa tra due o più parti, che si sfidano per capire chi è più efficace nel prevedere il futuro.

Quanto più capace è chi pronostica, tanto più affidabile e valida sarà la sua valutazione delle probabilità dell'esito reale (e quindi delle quote di scommessa). In caso di errore si avranno perdite finanziarie.

Pinnacle, probabilmente il miglior bookmaker di analisi dei dati del settore, avrà modelli di previsione eccezionalmente affidabili, molto migliori dei miei. Sappiamo che Pinnacle ha clienti in grado di ottenere profitti non casuali, ma ho già discusso in precedenza di quanto siano rari.

Se Pinnacle rappresenta l'Aston Villa dei modelli di previsione, questi clienti smaliziati sono più simili al Liverpool e al Manchester City.

Certo, si può avere un modello efficace, magari un Reading o un Derby, adeguato per formulare pronostici generalmente affidabili, ma l'efficacia non è sufficientemente costante per avere la meglio sui modelli migliori. Il modello che ho presentato qui probabilmente non sarebbe adatto nemmeno per l'Isthmian League.
Gli xG potrebbero anche rappresentare una risorsa utile per costruire un modello di previsione.

Per quanto riguarda la possibilità di utilizzare efficacemente gli xG per guadagnare con il mercato delle scommesse sul calcio, il problema è il seguente. Le probabilità fornite da un modello di previsione riflettono la qualità delle informazioni che lo compongono.

Gli xG potrebbero effettivamente offrire una risorsa di dati utile per costruire un modello di previsione, ma se Pinnacle sta già integrando queste informazioni nel proprio modello, oltre ad altre informazioni utili che io non possiedo, il mio modello di previsione non sarà superiore al suo.

Tutte le informazioni ricavate dai miei dati xG sono già integrate nelle sue quote. È come Canvey Island F.C. contro Aston Villa.

Se Pinnacle (e altri bookmaker) utilizzano già gli xG nei loro modelli di pronostico e di determinazione delle quote, come è probabile, visto che i dati sono ormai ampiamente disponibili da tempo, è poco probabile che, utilizzando tali dati, io possa migliorare ciò che sta già facendo.

I dati degli xG possono quindi permettermi di ricavare un profitto dalle scommesse sul calcio? Come per ogni altra forma di analisi dei dati ai fini delle scommesse, la risposta dipende dall'uso che se ne fa. E la modalità di utilizzo dovrà essere migliore di quello attuale dei bookmaker. Puoi continuare a seguire l'eccellente lavoro di Joe tramite il suo account Twitter, qui o la nostra pagina Risorse per le scommesse, qui

Quote soggette a modifica

Risorse per le scommesse - Migliora le tue scommesse

La sezione Risorse per le scommesse di Pinnacle è una delle raccolte disponibili online più complete di consigli di esperti sulle scommesse. Organizzata per tutti i livelli di esperienza, il nostro obiettivo è semplicemente quello di permettere agli scommettitori di diventare più esperti.