ott 18, 2017
ott 18, 2017

L'abilità nelle scommesse: l'approccio bayesiano a confronto con il frequentista

Come gli scommettitori possono valutare il loro livello di abilità?

Qual è la differenza tra l'approccio bayesiano e il frequentista?

Che cosa rivelano i gradi di casualità e le probabilità sulle abilità previste?

L'abilità nelle scommesse: l'approccio bayesiano a confronto con il frequentista

Al livello più elementare, guadagnare con le scommesse richiede due fattori. Abilità e fortuna. Pur se molti scommettitori non riconoscono l'incidenza di quest'ultima, anche la misurazione della prima viene spesso trascurata. Questo articolo spiega perché sia importante comprendere i diversi metodi di valutazione dell'abilità nelle scommesse e come i risultati possano variare a seconda dell'approccio.

Il teorema di Bayes può essere utilizzato dagli scommettitori sportivi per effettuare previsioni migliori. Può essere utilizzato anche per aiutarci a stabilire quale sia la probabilità di essere effettivamente in grado di effettuare quelle previsioni e individuare un valore previsto positivo. In precedenza ho indagato su come valutare la qualità della cronologia di uno scommettitore con un approccio frequentista (t-test). Questo articolo confronterà e individuerà le differenze tra i due approcci.

Gradi di credenza

Nella teoria della probabilità, il teorema di Bayes descrive le probabilità che un evento accada condizionata dal verificarsi di un altro evento. Ad esempio, supponete che io ritenga di avere una probabilità del 50% di essere uno scommettitore esperto, in grado di individuare valore. Se vinco la scommessa successiva, come inciderà questo evento sulla mia credenza in questa affermazione? In altre parole, come la prova della vittoria in una scommessa può incidere sulla probabilità che io sia uno scommettitore esperto? 

Il teorema di Bayes interpreta la probabilità come un "grado di credenza" in una proposizione o ipotesi e formalizza matematicamente la relazione tra il grado di credenza precedente, ovvero prima che si conosca la prova (la probabilità precedente) e il grado di credenza successivo, ovvero dopo aver tenuto conto della prova (la probabilità a posteriori). L'equazione risulta come segue:

{equation} - P(A|B)= P(A)*P(B|A)/P(B)

Nel nostro esempio specifico:

P(A) = la probabilità precedente che io sia uno scommettitore esperto

P(B) = la probabilità precedente di vincere la mia scommessa

P(B|A) = la probabilità che vinca la scommessa condizionata dalla credenza che io sia uno scommettitore esperto.

P(B|A) = la probabilità che io sia uno scommettitore esperto condizionata dalla mia vittoria nella scommessa.

Vediamo un esempio. Supponiamo che uno scommettitore esperto sia, per definizione, qualcuno in grado di raggiungere costantemente un rendimento dell'investimento del 110%. Per quote alle pari questo significherebbe 55 vincenti su 100. Ne consegue che P(B|A), la probabilità che vinca la scommessa condizionata dal fatto che io sia uno scommettitore esperto è del 55%.

Per uno scommettitore inesperto, la probabilità di vincere una scommessa con quota alla pari, P(B), sarà del 50%. Tuttavia, supponiamo che, in base alla mia credenza antecedente, io abbia una probabilità del 50-50 di essere esperto {P(A) = 50%} per cui la P(B) per tale scommettitore è del 52,5% (a metà tra il 50% e il 55%).

I migliori scommettitori del settore sono in genere in grado di ottenere circa il 57% di vittorie. Sottratto il margine del bookmaker, questo si traduce in circa il 110% di rendimento sull'investimento.

Se vincessi la scommessa, attribuire questi valori al teorema di Bayes produce una probabilità posteriore, P(A|B), del 52,38%. Vincere la scommessa mi porta a credere che esista una probabilità maggiore di prima che io sia uno scommettitore esperto.

Il teorema di Bayes può essere applicato in modo iterativo. Dopo aver vinto la mia prima scommessa e aggiornato la mia probabilità di essere uno scommettitore esperto, ora piazzo un'altra scommessa. La probabilità posteriore calcolata nel primo passaggio diventa la nuova probabilità precedente.

La nuova probabilità posteriore che io sia un giocatore esperto sarà ora condizionata dalla mia vittoria (o dalla mia sconfitta) nella mia scommessa successiva. Se vinco, la probabilità che sia esperto aumenta di nuovo; se perdo, diminuirà. In questo esempio, se vincessi la seconda scommessa, la probabilità di essere un giocatore esperto aumenterebbe sino al 54,75%. 

Questo processo può essere ripetuto all'infinito, con ciascuna probabilità condizionata aggiornata che rientra in un valore tra 0% e 100%. Ho effettuato questa iterazione 1.000 volte, vale a dire per 1.000 scommesse e la tabella che segue mostra la cronologia delle scommesse raggiunta (linea blu) accanto alle probabilità bayesiane di essere uno scommettitore esperto dopo ogni scommessa (linea rossa).

assessing-skill-In-article-1.jpg

Un problema significativo in un'interpretazione bayesiana della probabilità è che essa richiede una conoscenza o una credenza precedente in un evento o una situazione. Ma nel valutare la probabilità di essere uno scommettitore esperto abbiamo realmente tale credenza? La mia scelta del 50% in questo esempio è stata puramente arbitraria e basata esclusivamente su un'ipotesi. Guardate cosa succede se ora modifico la probabilità iniziale precedente all'1%. 

assessing-skill-In-article-2.jpg

Inoltre, è completamente arbitrario ciò che esperto in realtà significa in questo contesto. Probabilmente uno scommettitore in grado di ottenere il 105% di ritorno sull'investimento è molto esperto se riesce a ottenere questo risultato in 10.000 scommesse: potete leggere il libro Law of Small Numbers per scoprire perché il campione è significativo. Non è altrettanto chiaro come definire P(B) per ogni passaggio iterativo, dato un valore aggiornato di P(A). 

Nel mio modello bayesiano ho semplicemente presunto l'esistenza di una relazione lineare, in modo tale che se P(A) = 0%/20%/40%/60%/80%/100%, allora P(B) = 50%/51%/52%/53%/54%/55%, ma la sua validità è certamente passibile di essere discussa. Forse un aspetto ancora più importante, dato che un individuo con una probabilità di vittoria di una scommessa iniziale del 52,5% è chiaramente uno scommettitore esperto a tutti gli effetti (soltanto non esperto come l'individuo con il 55%), quello che stiamo misurando in questo caso è il grado piuttosto che la probabilità, di abilità. 

Tuttavia, questa rappresentazione grafica dell'evoluzione della probabilità bayesiana offre una misura intuitiva della probabilità (o solidità) dell'abilità di uno scommettitore nell'ottenere un profitto costante e di come ciò possa cambiare nel tempo.

Gradi di casualità

Mentre l'approccio bayesiano è incentrato sulla probabilità di un'ipotesi (il fatto che io sia uno scommettitore esperto) dato un insieme fisso di dati (i profitti e le perdite), l'approccio frequentista è incentrato sulla probabilità (o frequenza) dei dati data l'ipotesi. Questa volta l'ipotesi è fissa: che io sia un esperto è vero (probabilità del 100%) o falso (probabilità dello 0%), mentre i dati sono considerati casuali. 

A partire da una credenza precedente della probabilità dell'1% che una persona sia esperta, questa sarà salita soltanto al 20% dopo 1.000 scommesse.

Normalmente, l'approccio frequentista inizia con l'ipotesi nulla: in questo caso l'ipotesi è che io non sono esperto e che i miei risultati nelle scommesse siano tutti dettati dalla fortuna. Quindi cerca di calcolare la probabilità (di solito chiamata valore p) per mezzo di una statistica secondo la quale i dati che abbiamo osservato, in questo caso la mia cronologia di profitti e perdite, avrebbero potuto verificarsi assumendo che l'ipotesi nulla fosse vera.

Infine, questa probabilità viene confrontata con un valore di significatività accettabile (talvolta chiamato α-valore) tale che, se p < α (normalmente il 5% o l'1%), l'ipotesi nulla viene rifiutata a favore di quella valida.

La statistica che ho esaminato in precedenza nelle Risorse per le scommesse di Pinnacle è il t-score, cosiddetto perché derivato dal t-test degli studenti per la significatività statistica. Supponendo che le quote scommessa siano eque, il t-score può essere approssimato da: 

dove n = il numero di scommesse, r = il ritorno sull'investimento (espresso in decimali) e o = il punteggio medio delle quote scommessa in decimali. Il t-score viene convertito in un valore p mediante tabelle statistiche o un calcolatore online. In Excel, è possibile utilizzare la funzione TDIST. Vediamo come funziona con il nostro esempio sulla cronologia delle scommesse.

Il grafico seguente confronta la serie temporale originaria della probabilità bayesiana in evoluzione - il fatto che io sia uno scommettitore esperto con una credenza originaria precedente pari al 50% di probabilità che io lo sia (linea rossa) - con l'evoluzione del valore p frequentista - la probabilità che ciò che ho raggiunto potrebbe essere accaduto per caso supponendo di non avere alcuna abilità (linea verde), utilizzando un t-test a due code con un campione.

assessing-skill-In-article-3.jpg

In senso generalmente qualitativo le due linee sono diametralmente opposte, anche se è più probabile che sia un risultato della fortuna che altro. Non si deve tuttavia desumere che il valore p misuri la probabilità di essere poco esperto e che 1-p sia quindi pari alla probabilità di essere esperto.

Se non altro, l'analisi bayesiana e frequentista dovrebbero servire ulteriormente a ricordare allo scommettitore che scommettere per un profitto costante richiede tempo.

Una probabilità del 5% che la nostra cronologia di profitti e perdite si sia verificata per caso non è lo stesso della probabilità del 95% che si sia verificata grazie all'abilità. Significa semplicemente che assumendo l'ipotesi nulla, ovvero che le vittorie e le perdite nelle scommesse siano puramente casuali, sia vera, si potrebbe prevedere che ciò che abbiamo osservato accada per il 5% delle volte.

La debolezza dell'approccio frequentista è che tratta la verità come un assoluto. Al contrario, l'approccio bayesiano implica che la verità sia probabilistica, provvisoria e sempre falsificabile. Nonostante questa carenza, il test mediante l'ipotesi frequentista ci offre comunque uno strumento altrettanto utile per analizzare una cronologia di scommesse e accertare se sia probabile che si sia verificata a causa di qualcosa di diverso dalla fortuna.

Come possiamo confrontare i modelli frequentisti e bayesiani se quest'ultimo ha una credenza precedente soltanto dell'1% di probabilità (piuttosto del 50%) che io sia esperto?

assessing-skill-In-article-4.jpg

Questa volta è chiaro che il nostro t-test ci incoraggia a credere molto più facilmente nella nostra abilità di esperto informatore rispetto all'approccio bayesiano, che al contrario è molto più conservatore.

Questo sottolinea ulteriormente la sensibilità della probabilità bayesiana a una credenza iniziale. In questo caso, dopo quasi 700 scommesse, mentre il nostro t-test potrebbe rivelarci che la nostra storia di scommesse ha solo una probabilità del 3% di verificarsi per caso, il teorema di Bayes implica che ci sia ancora meno del 10% di probabilità di essere abbastanza esperto per ricavare un rendimento del 110% nel lungo periodo.

Essendo uno scommettitore avverso al rischio, la mia preferenza sarebbe per la credenza precedente più conservatrice nella mia capacità: a meno che non abbia ragione per dubitarne, dovrei sempre cominciare presumendo di avere poca o di non avere alcuna abilità.

Probabilità dell'abilità prevista

L'analisi sopra riportata presenta solo un esempio casuale di una serie temporale di scommesse con un rendimento sull'investimento ipotizzato del 110%. Nell'interesse della chiarezza visiva ho deliberatamente scelto una cronologia di scommesse che mi ha permesso di comunicare le idee discusse.

Per ottenere un quadro più dettagliato della previsione, però, ovvero di quello che dovremmo aspettarci che accada in media, dovremmo eseguire il modello molte volte. Chi di voi ha familiarità con le Risorse per le scommesse di Pinnacle saprà che possiamo farlo tramite una simulazione Monte Carlo.

Il primo grafico seguente mostra i risultati di una simulazione Monte Carlo su 1000 scommesse dell'evoluzione della probabilità bayesiana che io sia uno scommettitore esperto per dieci percentuali di vittoria ipotizzate: dal 51% al 60% a intervalli dell'1% (pari al valore previsto dal 102% al 120% a intervalli del 2% assumendo quote eque).

Le curve sono state costruite calcolando la mediana della probabilità bayesiana dopo ogni scommessa sequenziale nella storia delle 1.000 scommesse, che a tal fine offre una rappresentazione migliore della media (dove valori bassi ed elevati possono distorcere l'interpretazione). 

La credenza iniziale precedente nella mia abilità {p(A)} si suppone sia dell'1%. Non sorprende il fatto che, più alta è la percentuale ipotizzata di vittoria (e il valore previsto), più la credenza nella mia abilità si avvicina al 100% di probabilità. (Più la curva è scura, più la percentuale di vittoria ipotizzata è alta.) 

assessing-skill-In-article-5.jpg

I migliori scommettitori del settore sono in genere in grado di ottenere circa il 57% di vincite. Sottratto il margine del bookmaker, questo si traduce in circa il 110% di rendimento sull'investimento. Questo grafico mostra che se si aspira a diventare uno scommettitore esperto, ci vorrà il meglio di 1.000 scommesse per acquisire una solida e significativa credenza nelle proprie abilità, supponendo che naturalmente inizialmente si ritenesse di avere scarsa abilità per cominciare. 

Al contrario, se ci si trova a vincere una percentuale inferiore, il 54% dei propri spread, pur se le scommesse saranno ancora redditizie, ci vorrà molto più tempo per acquisire una reale fiducia in quello che si sta facendo. A partire da una credenza precedente della probabilità dell'1% che una persona sia esperta, questa sarà salita soltanto al 20% dopo 1.000 scommesse. 

Il grafico finale mostra un insieme simile di valori p attesi idealizzati della stessa cronologia di 1.000 scommesse e le stesse dieci percentuali di vittoria ipotizzate. Poiché abbiamo un'equazione per approssimare il t-score per qualsiasi combinazione di numero di puntate, il ritorno sull'investimento e le quote delle scommesse, non è richiesta una simulazione Monte Carlo. Ancora una volta, più scure sono le curve, maggiore è la percentuale di vittoria ipotizzata (dal 51% al 60%).

assessing-skill-In-article-6.jpg

Con una percentuale di vittoria del 57%, la significatività statistica (valore p < 5%) viene raggiunta dopo appena 200 scommesse, con una significatività statistica più solida (valore p < 1%) dopo circa 335 scommesse. Ribadiamo, tuttavia, che queste informazioni non ci dicono nulla sui nostri livelli di abilità nelle scommesse, ci rivelano semplicemente la probabilità che questa cronologia si verifichi per caso, senza assolutamente alcuna abilità. 

Inoltre, questi livelli di significatività statistica, come le probabilità iniziali bayesiane, si basano su poco più che un giudizio soggettivo. Ma come il modello bayesiano, il test statistico con il valore p dovrebbe, se si tiene conto di questi avvertimenti, offrire un metodo utile per aiutare lo scommettitore a valutare le proprie capacità nell'individuare un'aspettativa costantemente redditizia.

Se non altro, l'analisi bayesiana e frequentista dovrebbero servire ulteriormente a ricordare allo scommettitore che scommettere per un profitto costante richiede tempo. Non supporre mai che alcune vittorie implichino di sapere cosa si sta facendo.

Risorse per le scommesse - Migliora le tue scommesse

La sezione Risorse per le scommesse di Pinnacle è una delle raccolte disponibili online più complete di consigli di esperti sulle scommesse. Organizzata per tutti i livelli di esperienza, il nostro obiettivo è semplicemente quello di permettere agli scommettitori di diventare più esperti.