feb 1, 2019
feb 1, 2019

Cómo crear un modelo de posibles ganancias de apuestas

La matemática de la distribución de las ganancias de apuestas

¿Qué nos puede decir la desviación estándar de la rentabilidad?

¿Cuánto puede durar la carrera de un apostador profesional sin talento?

Cómo crear un modelo de posibles ganancias de apuestas

Los apostadores suelen centrarse en a quién le apuestan, cuánto le apuestan y cuánto pueden llegar a ganar (a veces, el orden de prioridades es diferente). Cuánto podría ganar con una apuesta es importante, pero los apostadores necesitan pensar en las ganancias relacionadas con muestras más grandes de apuestas. ¿Cómo puede crear un modelo de posibles ganancias de apuestas? Lea a continuación para descubrirlo.

Hace poco en Twitter estudié las ganancias de un famoso pronosticador de carreras de caballos. Siguiendo sus 1015 elegidos diarios (el mejor pronóstico del día) y apostando siempre el mismo monto, el retorno hubiera sido del -4,3 %.

“Me parece una buena muestra para poner a prueba su eficacia”,

comenté, sin pensarlo demasiado. Mil pronósticos, después de todo, es bastante, ¿no? El mes pasado, estaba conversando de nuevo sobre la influencia de la suerte en cuanto a los resultados de muestras de ese tamaño.

Entonces, me pareció que podía afirmar con bastante lógica que el pronosticador no estaba brindando “las mejores recomendaciones de caballos en Internet” como aseguraba él.

A uno de mis seguidores no le pareció lo mismo y me dijo: “No es que esté en desacuerdo, pero ¿1000 apuestas son suficientes para sacar conclusiones?”.

Tras pensarlo un momento, me pareció que quizás tenía razón. Le respondí:

“Tienes razón. Los dividendos de la apuesta ganadora promedio son de 2,62. Supongamos que los otros dos tercios de las apuestas perdedoras (que no tenían dividendos) tenían dividendos levemente superiores (y por eso no fueron ganadoras), digamos 3,00.

La desviación estándar esperada en el rédito de una muestra de 1015 apuestas debería ser de alrededor de 0,045 (un 4,5 %). Supongamos que la expectativa a largo plazo es del -4,5 %. Entonces, estaría cerca. Ahora supongamos que la expectativa es del 0 %. Hubiera quedado a una desviación estándar. Sin suerte, pero dentro de las variaciones naturales.

Ahora supongamos que la expectativa es del 4,5 %. Entonces, ya quedaría a dos desviaciones estándar, o alrededor del 2,5 % de probabilidad. Aún podría llegar a seguir a decir que no tuvo suerte. Para expectativas aún superiores, sin embargo, ya se hace cada vez más difícil decir que el retorno de las 1015 apuestas se debe a la mala suerte”. 

¿Cómo llegué a definir que la desviación estándar esperada era del 4,5 %? La finalidad de este artículo es justamente explicar eso, y cómo saberlo puede ayudarnos a evaluar el rendimiento apostador en relación con nuestras expectativas.

La matemática de la distribución de las ganancias de apuestas

Las apuestas son situaciones binarias: ganamos o perdemos. En noviembre de 2018, presenté cómo la distribución binomial puede usarse para conocer la posible distribución de aciertos y errores en una muestra de apuestas sujetas a los caprichos de la suerte. En una muestra de n apuestas donde cada una tiene una probabilidad de acierto “verdadera” p, la desviación estándar o la diferencia de los posibles porcentajes de acierto se determinan con la siguiente fórmula:

modelling-returns-formula1.png

Por ejemplo, si tenemos 100 apuestas con un 50 % de probabilidad de acierto, deberíamos esperar ganar el 50 % de las veces, con una desviación estándar del 5 %. En otras palabras, alrededor de dos tercios de las veces acertaríamos entre el 45 y el 55 % de las apuestas, mientras que el 95 % de las veces acertaríamos entre el 40 y el 60 % de las apuestas. 

Ahora olvidémonos de los aciertos y errores, para ver las ganancias. Solo debemos hacer una pequeña modificación en la fórmula anterior para incluir los dividendos. Si cada apuesta tiene el dividendo o, la desviación estándar de las posibles ganancias se obtendría con lo siguiente: 

modelling-returns-formula2.png

Supongamos que en este ejemplo la probabilidad de ganar “verdadera” sea del 60 % en apuestas que pagan lo apostado: un cara o cruz muy generoso. La desviación estándar de la posible rentabilidad de 100 apuestas sería del 9,798 % o una rentabilidad esperada del 20 %.

Con una probabilidad del 50 %, o = 1/p, la fórmula anterior se reduce a lo siguiente:

modelling-returns-formula3.png

Si bien este caso especial solo sirve para cuando la expectativa del apostador es una rentabilidad del 0 %, la diferencia entre o y 1/p suele ser pequeña, ya sea para los malos apostadores que sufren el margen de la casa de apuestas o para los buenos apostadores que lo superan, por lo cual se justificaría usarla por su simplicidad. Esto se ve reflejado en la siguiente imagen.

modelling-returns-in-article1.jpg

En este ejemplo, esta fórmula simplificada nos daría siempre una desviación estándar del 10 %, más allá del valor de p. Pero eso, está bastante cerca de la desviación estándar real para las probabilidades de ganar entre el 40 y el 60 %. Ningún apostador, al menos con Pinnacle, debería afrontar un porcentaje de apenas el 40 % para apuestas que pagan lo apostado. 

La mayoría de los márgenes de Pinnacle están entre el 1 y el 3 %; los dividendos de 2,00 con un margen del 2 % implican una probabilidad de ganar el 49 % (la desviación estándar de rentabilidad en 100 apuestas sería del 9,998 %). Los mejores pronosticadores del mundo aciertan entre el 55 y el 56 % de las veces (la desviación estándar de rentabilidad en 100 apuestas sería del 9,928 %). 

¿Qué nos puede decir la desviación estándar de la rentabilidad?

Volvamos al ejemplo que presenté al comienzo para ver qué información puede darnos el desvío estándar de la rentabilidad. Suponiendo una apuesta promedio (o) de 3,00 para las 1015 apuestas iguales (n) y una probabilidad “verdadera” de ganar del 32 % (p) insinuada por una expectativa del -4,3 %, nuestra ecuación anterior arroja una desviación estándar de la rentabilidad del 4,39 % (o el 4,44 % con la fórmula simplificada). 

La distribución de las posibles ganancias alrededor de la expectativa será como la de la siguiente imagen. Puede dibujarlas usted mismo fácilmente en Excel mediante la función DISTR.NORM. Si bien, en teoría, estas distribuciones son binomiales y, por ende discretas, con muestras por encima de 30, la distribución normal (continua) es una aproximación muy confiable y se presta muy bien para dibujar estos gráficos en Excel. 

modelling-returns-in-article2.jpg

El área debajo de la curva azul suma un 100 %. En esta situación, damos por sentado que la rentabilidad real coincide con la expectativa. Sin embargo, como las probabilidades son bastante bajas, hay una gran variedad de posibles resultados, por lo cual incluso el resultado más probable, el 4,3 %, se dará menos del 10 % de las veces. 

¿Mi seguidor de Twitter estaba en lo cierto al cuestionar mi observación inicial? Creo que sí. Si bien los resultados claramente no corresponden a uno de los mejores servicios de pronósticos de carreras de caballos, no resulta evidente para nada que tenga un valor esperado negativo. El 13,65 % de las posibles rentabilidades en este escenario son positivas, lo cual está sin dudas dentro de los límites de lo aceptable estadísticamente. Quizás, el pronosticador tiene una expectativa superior al -4,3 % y solo ha tenido mala suerte.

Supongamos, en cambio, como propuse en la introducción, que la expectativa del pronosticador era del 0 %. Ahora la distribución sería la siguiente: 16,13 de las rentabilidades en este escenario serían inferiores a los resultados reales, lo cual es demasiado como para desechar la posibilidad de que haya sido por mala suerte.

 modelling-returns-in-article3.jpg

¿Y si la expectativa fuera del 4,3 %? Ahora tendríamos la siguiente distribución. Aún hay un 2,76 % de los resultados posibles que serían inferiores a los resultados reales. Es una cifra pequeña, pero ¿podríamos descartar por completo la influencia de la mala suerte? Es más de 1 vez cada 40 casos y, por ejemplo, en 4000 casos sucederá seguro.

modelling-returns-in-article4.jpg

Por último, supongamos que el pronosticador dice haber ofrecido de verdad las mejores recomendaciones de Internet y que habitualmente ofrecen una rentabilidad del 10 %. La distribución de los posibles resultados sería la siguiente.

modelling-returns-in-article5.jpg

Casi el 2 % son negativos, pero menos de 1 cada 1000 serían peores que el -4,3 %. Ya sería hora de decir que este pronosticador es demasiado optimista.

Si conocemos los dividendos promedio, la rentabilidad y la cantidad de apuestas, podemos calcular la desviación estándar esperada en las posibles rentabilidades y trazar casi todas las distribuciones que queramos. Como hice aquí, podemos contrastar los resultados reales con una serie de opiniones sobre lo que consideramos resultados posibles.

Cuando hay solo una pequeña chance de que el resultado real se alcance, dada nuestra opinión sobre lo posible (digamos por debajo del 1 % o incluso del 0,1 %), deberíamos reevaluar nuestras expectativas.

Cambio de los dividendos

¿Cómo varía la distribución de los posibles resultados para diferentes dividendos? Fíjese a continuación: estos son escenarios donde la expectativa es del 0 %.

modelling-returns-in-article6.jpg

No sorprende que cuanto mayores sean los dividendos, mayor sea la varianza o la diferencia de los posibles resultados. Desde luego, para estos escenarios donde la expectativa es del 0 %, la varianza (o la desviación estándar al cuadrado) es directamente proporcional a los dividendos menos 1.

Al apostar con dividendos superiores, hay más probabilidades de que nos vaya mucho mejor de lo esperado simplemente por azar (las colas de las distribuciones son más gordas en los mejores resultados). Desde luego, lamentablemente también es real lo contrario ya que las distribuciones son simétricas.

Cambio del período del historial de apuestas

También podemos ver la influencia del tamaño del historial sobre la distribución. La fórmula anterior nos indica que la desviación estándar de la rentabilidad es inversamente proporcional a la raíz cuadrada de la cantidad de apuestas. Por ende, con una expectativa del 0 % para 100 apuestas que paguen lo apostado (el 10 %) la distribución será 10 veces superior a la de unos resultados similares en 10 000 apuestas (el 1 %). A continuación, se ilustran algunas distribuciones más. 

modelling-returns-in-article7.jpg

Las distribuciones se van haciendo más delgadas y más altas al ir alargando el historial de apuestas, lo cual es, en esencia, un reflejo visual de la ley de los grandes números. Cuanto más grande es la muestra, más probable es que los resultados reales sean un reflejo de la rentabilidad esperada real.

¿Cuánto puede durar la carrera de un apostador profesional sin talento?

Como experimento final, veamos cuánto tiempo en Pinnacle le llevaría a un mal pronosticador con una expectativa del -2,5 % darse cuenta de que no tiene talento. Nos puede ayudar conocer la desviación estándar de la rentabilidad esperada.

En la tabla siguiente, vemos la probabilidad de que el pronosticador obtenga resultados positivos tras una serie de apuestas con diferentes dividendos.

Probabilidades de resultados positivos tras n apuestas con dividendos de o

Probabilidades de resultados positivos tras n apuestas con dividendos de o

-

Dividendos (o)

Cantidad de apuestas (n)

1,5

2

3

5

10

100

36,34 %

40,13 %

42,94 %

44,98 %

46,64 %

500

21,73 %

28,80 %

34,54 %

38,89 %

42,53 %

1000

13,46 %

21,45 %

28,68 %

34,49 %

39,49 %

5000

0,67 %

3,85 %

10,42 %

18,61 %

27,56 %

10 000

0,02 %

0,62 %

3,76 %

10,35 %

19,97 %

En las casas de apuestas de márgenes pequeños, con un poco de suerte se puede ganar mucho, en especial con dividendos altos. Desde luego, si no tiene suerte, con los dividendos altos se llega mucho más rápido a la bancarrota.

Aquí hay una tabla similar, pero de la probabilidad de perder un 10 %. Esto es simplemente una consecuencia de la mayor varianza (y la distribución más amplia de los posibles resultados).

Probabilidades de resultados negativos del 10 % tras n apuestas con dividendos de o

Probabilidades de resultados negativos del 10 % tras n apuestas con dividendos de o

-

Dividendos (o)

Cantidad de apuestas (n)

1,5

2

3

5

10

100

14,73 %

22,66 %

29,68 %

35,25 %

40,02 %

500

0,95 %

4,67 %

11,63 %

19,86 %

28,59 %

1000

0,05 %

0,88 %

4,57 %

11,56 %

21,20 %

5000

0,00 %

0,00 %

0,01 %

0,37 %

3,69 %

10 000

0,00 %

0,00 %

0,00 %

0,01 %

0,57 %

¿Cómo funciona la fórmula con historiales de apuestas reales?

Por último, quizás se pregunte cómo funciona la fórmula al calcular la desviación estándar de la rentabilidad de apuestas con diferentes dividendos. Hasta ahora, siempre supusimos que las apuestas eran todas con los mismos dividendos. Desde luego, la mayoría de la gente apuesta con todo tipo de dividendos. ¿Podemos simplemente tomar un valor promedio de los dividendos y obtener una cifra confiable para la desviación estándar de la rentabilidad? 

En las casas de apuestas de márgenes pequeños, con un poco de suerte se puede ganar mucho, en especial con dividendos altos. Si no tiene suerte, con los dividendos altos se llega mucho más rápido a la bancarrota.

Si volvemos a los resultados del pronosticador del comienzo del artículo, yo completé artificialmente los dividendos ausentes (de las apuestas perdidas nunca publicadas) para alcanzar un promedio de 3,00. La distribución real de dividendos de mis apuestas fue importante: desde 8/11 (1,73) hasta 14/1 (15,0).

Con el generador de números aleatorios de Excel, simulé los resultados con una expectativa para cada apuesta de -4,3%, hice 100.000 simulaciones de Montecarlo y obtuve 100.000 rentabilidades diferentes para la muestra de 1015 apuestas. La rentabilidad promedio fue de -4,297% y la desviación estándar fue del 4,373%. Con un margen de error aceptable, ese fue en efecto el valor que predijo mi fórmula: 4,389%.

Algunos habrán notado la similitud entre este método y mi método de prueba t para calcular la probabilidad de que los resultados de un historial de apuestas sean casualidad. Los dos métodos son en esencia muy similares. De hecho, incluso con las muestras más modestas (n > 30), las distribuciones binomial, normal y de t son básicamente lo mismo.

Ojalá este artículo ofrezca una mejor perspectiva de las diferentes expectativas que puede tener el apostador según sus preferencias y resultados.

Además de mi calculadora de pruebas t para poner a prueba historiales de apuestas, ahora puse a disposición una calculadora de distribución de rentabilidad que puede usar para poner a prueba su historial.

Recursos para apostar: facultando sus apuestas

La sección Recursos para apostar de Pinnacle es una de las recopilaciones más exhaustivas de consejos expertos sobre apuestas que encontrará en Internet. Dirigida a todos los niveles de experiencia, nuestro objetivo consiste simplemente en facultar a los apostantes para que estén mejor informados.