set 19, 2017
set 19, 2017

Le insidie dei sistemi per le scommesse sportive: correlazione contro causalità

Sistemi di scommesse sportive: cos'è l'analisi di regressione?

Utilizzare un sistema per effettuare pronostici per le scommesse

Le insidie dell'analisi di regressione

Le insidie dei sistemi per le scommesse sportive: correlazione contro causalità

Un sistema per le scommesse è essenziale quando si vuole avere un profitto a lungo termine con le scommesse. Tuttavia gli scommettitori spesso confondono la gestione del denaro e i sistemi di scommessa come anche la correlazione e la causalità quando si tratta di osservare i risultati. Cos'è un sistema per le scommesse e come si fa a conoscere la differenza tra correlazione e causalità? Scoprilo continuando a leggere.

Cos'è un sistema per le scommesse?

A differenza del metodo di puntata ,o della strategia di gestione del denaro, che propone un metodo per decidere la quantità di denaro da scommettere per ogni scommessa, un sistema per le scommesse sportive è una metodologia di previsione strutturata fondata su un'analisi quantitativa dei dati storici progettata per annullare il margine di profitto del bookmaker e trovare un valore previsto positivo.

Gli scommettitori spesso confondono la gestione del denaro e i sistemi di scommessa; cercando su Google l'espressione "sistemi per le scommesse", la maggior parte delle strategie che si trovano riguardano strategie come la Martingale, la Labouchere o la Fibonacci, ma queste riguardano una cosa completamente diversa.

La gestione del denaro cambia semplicemente la natura dei rischi associati alle scommesse, tuttavia, non può trasformare un metodo di previsione perdente in uno vincente sul lungo periodo. Un sistema di scommesse, invece, tenta di trovare le probabilità "reali" di eventi che possono accadere in una competizione sportiva.

Sistemi di scommesse sportive: l'analisi di regressione

Il metodo di gran lunga più utilizzato per creare un sistema per le scommesse sportive è l'analisi di regressione statistica. Per quelli che non hanno familiarità con i termini tecnici della statistica può sembrare qualcosa di complicato, ma non è altro che un metodo per valutare la relazione tra variabili.

L'analisi di regressione è uno strumento utile per creare un sistema per le scommesse, ma la sua debolezza implicita sta nella sua incapacità di distinguere correlazione e causalità.

Il metodo più semplice è la regressione lineare in cui si considerano solamente due variabili, per esempio il numero di goal segnati da una squadra (l'esperto in pronostici o una variabile indipendente) e la sua frequenza di vittorie (risposta o variabile dipendente). 

Nel mio primo libro Fixed Odds Sports Betting: Statistical Forecasting & Risk Management ho parlato di un semplice modello di regressione fondato sulla relativa supremazia dei goal di due squadre nelle loro ultime sei partite.

Utilizzando un grande campione di partite (in questo caso 8 stagioni dal 1993 al 2001) è possibile tracciare un grafico stabilendo un rapporto tra le valutazioni della partita calcolata (la differenza reti delle ultime sei partite della squadra di casa meno quella della squadra ospite) con la frequenza del risultato di ogni partita. Di seguito è mostrata la distribuzione della valutazione della partita (variabile indipendente) contro la frequenza di vittorie casalinghe (variabile dipendente).

correlation-and-causation-inarticle.jpg

Mentre i punti dei dati individuali nel grafico sono in qualche modo confusi, c'è una tendenza lineare evidente relativa alle due variabili: migliore è la squadra di casa in relazione a quella che gioca in trasferta per quanto riguarda la differenza reti delle ultime 6 partite, più è probabile che la squadra di casa vinca la partita.

La linea di regressione tracciata sul grafico essenzialmente descrive una relazione idealizzata tra la supremazia relativa di goal e la frequenza delle vittorie in casa una volta eliminato qualsiasi intervento casuale della buona o della cattiva sorte.

Possiamo descrivere la linea precedente con un'equazione; essendo un semplice modello di regressione lineare, la funzione è y = mx+c, dove y è la variabile dipendente (la probabilità di vittoria), x è la variabile indipendente, la valutazione della partita, m è l'inclinazione o il gradiente della linea della tendenza (e una misura della forza della relazione) e c è la costante o punto in cui la linea s'interseca con l'asse delle ascisse (vale a dire x=0). In questo esempio l'equazione è data da:

Vittoria in casa % = (1,56 x Valutazione incontro) + 46,5

Quando la valutazione dell'incontro è zero (vale a dire che le due squadre hanno una differenza reti più o meno uguale) la probabilità di vittoria è del 46,5%. Intuitivamente sembra sensato, poiché nel 46% dei casi le partite di calcio finiscono con una vittoria casalinga. Quando la squadra di casa ha una differenza reti netta superiore a dieci rispetto alla squadra che gioca in trasferta nelle ultime sei partite, il modello di regressione mostra che queste squadre solitamente vincono nel 62% dei casi. Con una superiorità di 20 punti si arriva al 78%. 

La nostra analisi di regressione ci può dire anche quanto la variabilità nelle frequenze di vittoria sia spiegata da questo modello di sistema per le scommesse. In questo caso era dell'86%. Lo si può vedere illustrato dalla bontà di adattamento della linea di tendenza sui dati. Questa ci dice che c'è una forte correlazione tra le due variabili.

Utilizzare un sistema per effettuare pronostici per le scommesse

Per trasformare il nostro modello di regressione in un sistema completamente funzionante è necessario fare delle previsioni su incontri futuri e utilizzarli per identificare scommesse in cui si ha un valore previsto positivo.

La gestione del denaro cambia semplicemente la natura dei rischi associati alle scommesse, tuttavia, non può trasformare un metodo di previsione perdente in uno vincente sul lungo periodo.

Come per la maggior parte delle metodologie utilizzate per la creazione di modelli, la premessa standard è che il passato è la chiave per interpretare il futuro. Se le partite precedenti con valutazioni delle partite di +10 si fossero concluse con una vittoria della squadra di casa nel 62% dei casi, la premessa sarebbe che una squadra di casa con una supremazia di goal di 10 punti sull'avversario avrà il 62% di probabilità di vincere la partita. 

Successivamente possiamo trasformare queste probabilità in quote "reali" e quindi trovare valore previsto con un bookmaker che offre quote più alte. Applicando questo modello alla stagione 2001/02 del campionato inglese sono riuscito ad avere un profitto del +2,1% su 526 scommesse con le migliori quote disponibili per la vittoria della squadra di casa, rispetto a una perdita del -3,7% se avessi semplicemente scommesso alla cieca su tutte le vittorie interne di quella stagione.

Correlazione contro causalità

Le scommesse di una stagione con poco più di 500 puntate non garantiscono che la profittabilità possa essere ripetuta da una stagione all'altra. Potrebbe sembrare un numero adeguato per essere sicuri di avere un sistema per le scommesse affidabile, ma un lettore regolare della sezione Risorse per le scommesse sa che non è così.

L'articolo di Pinnacle sulla legge dei piccoli numeri serve per ricordarsi che anche un campione di 1.000 scommesse può rivelarsi un modello illusorio di profittabilità perché non ha nessuna base in quanto a causalità, ma si basa solo sulla fortuna. Sfortunatamente, nelle cinque stagioni seguenti questo sistema di scommessa è risultato sempre perdente.

Mentre questo semplice modello di regressione basato sulla supremazia dei goal è efficace nel trovare quali squadre di casa hanno una maggiore probabilità di vincere, non garantisce che si trovino le squadre che hanno una maggiore probabilità di vincere rispetto alle probabilità implicite delle quote dei bookmaker.

Sfortunatamente, molti scommettitori spesso interpretano male la precisione, l'accuratezza e la validità quando studiano le loro scommesse passate, confondendo durante le fasi di analisi la correlazione e la causalità.

Il mio modello potrebbe andare bene per fare previsioni, ma non sembra essere migliore dei modelli utilizzati dai bookmaker per creare le loro quote, né di quelli utilizzati da altri scommettitori che aiutano a modificarle e a perfezionarle.

Se il mio modello replicasse semplicemente i metodi utilizzati dai bookmaker, la profittabilità non mostrerebbe alcuna persistenza e mostrerebbe semplicemente la vacuità del caso. Sembra che non sia basato su alcuna correlazione valida. Le previsioni del mio modello non hanno "causato" quei profitti perché non era più accurato di altri modelli che fanno la stessa cosa.

Precisione contro accuratezza

Ovviamente, un modello di regressione lineare a due variabili difficilmente si può considerare il più sofisticato dei sistemi di scommessa per provare a trovare un valore previsto. La regressione multipla, in cui sono introdotte un maggior numero di variabili indipendenti o predittive, offre un mezzo per aumentare la precisione delle previsioni. Tuttavia, gli analisti devono tenere in considerazione che questo non va a discapito dell'accuratezza.

Un modello preciso è un modello in cui le misure sono vicine tra loro, per esempio come illustrato dalla linea di tendenza nel mio semplice modello di regressione lineare esposto sopra. Tuttavia, la precisione non garantisce l'accuratezza. L'accuratezza è una misura di quando si sia vicini al valore "reale". La precisione è associata agli errori del caso e l'accuratezza a quelli sistematici (conosciuti anche come preconcetti). 

Affinché un sistema per le scommesse sia valido, vale a dire che sia in grado di fare quello che dovrebbe (vale a dire trovare in maniera costante valore previsto positivo), deve essere preciso e accurato. La validità implica sia la prevedibilità sia la persistenza, vale a dire una misura che valuta se quello che pensiamo sia la causa, sia la causa reale e se le nostre misurazioni puntino in maniera ripetuta a quella conclusione.

Sfortunatamente, molti scommettitori spesso interpretano male la precisione, l'accuratezza e la validità quando studiano le loro scommesse passate, confondendo durante le fasi di analisi la correlazione e la causalità. Il loro errore è quello di credere che i loro profitti siano frutto del loro sistema per le scommesse, mentre spesso si tratta di profitti realizzati grazie alla fortuna.

Le insidie dell'analisi di regressione

L'analisi di regressione è uno strumento utile per creare un sistema per le scommesse, ma la sua debolezza implicita sta nella sua incapacità di distinguere correlazione e causalità. L'analisi della regressione è efficace nell'identificare un'associazione tra le variabili, per esempio i goal segnati e quelli concessi contro la probabilità di vincere le partite, ma non è in grado di determinare se una causi l'altra.

L'analisi di regressione potrebbe mostrare che quando il Barcellona perde, Lionel Messi non segna un goal. Tuttavia, non possiamo giungere alla conclusione che la mancata marcatura di Lionel Messi sia il motivo per cui il Barcellona ha perso la partita.

Senza riuscire a stabilire la causalità e la validità nel nostro sistema di scommesse, dobbiamo tenere presente che potrebbe non essere migliore dei modelli per i pronostici utilizzati da qualsiasi altra persona. In un contesto come quello delle scommesse sportive, in cui le capacità sono importanti, non si guadagna semplicemente prevedendo il futuro, bisogna essere più bravi di chiunque altro a farlo.

Risorse per le scommesse - Migliora le tue scommesse

La sezione Risorse per le scommesse di Pinnacle è una delle raccolte disponibili online più complete di consigli di esperti sulle scommesse. Organizzata per tutti i livelli di esperienza, il nostro obiettivo è semplicemente quello di permettere agli scommettitori di diventare più esperti.