sep 19, 2017
sep 19, 2017

Los escollos de los sistemas de apuestas deportivas: correlación vs. causalidad

Sistemas de apuestas deportivas: ¿en qué consiste el análisis de la regresión?

Utilización de un sistema para realizar pronósticos de apuestas

Los escollos del análisis de la regresión

Los escollos de los sistemas de apuestas deportivas: correlación vs. causalidad

Un sistema de apuestas resulta fundamental a la hora de asegurarse beneficios a largo plazo con las apuestas. Sin embargo, los apostantes confundirán a menudo la gestión del dinero y los sistemas de apuestas, así como la correlación y la causalidad en lo que respecta a los resultados. ¿Qué es un sistema de apuestas y cómo puedes reconocer la diferencia entre correlación y causalidad? Sigue leyendo para averiguarlo.

¿Qué es un sistema de apuestas?

Al contrario que el método de cantidad apostada o estrategia de gestión del dinero, que propone un método de asignación de tamaños de cantidad apostada a tus apuestas, un sistema de apuestas deportivas consiste en una metodología de pronósticos estructurada que ha sido creada basándose en análisis cuantitativos de los datos históricos y cuyo objetivo es superar el margen de beneficio de la casa de apuestas y encontrar valor esperado positivo.

Los apostantes confunden a menudo la gestión del dinero y los sistemas de apuestas. Busca “sistema de apuestas” en Google y la mayoría de resultados serán estrategias como Martingala, Labouchere o Fibonacci, pero en realidad son cosas diferentes.

La gestión del dinero simplemente cambia la naturaleza de los riesgos asociados a tus apuestas; sin embargo, no puede convertir un método de pronósticos perdedor en uno ganador a largo plazo. Por el contrario, un sistema de apuestas intenta encontrar las probabilidades “reales” de que ocurra un suceso en una competición deportiva.

Sistemas de apuestas deportivas: análisis de la regresión

El método más comúnmente utilizado para diseñar un sistema de apuestas deportivas es el análisis estadístico de la regresión. Puede que esto les resulte intimidante a quienes no estén familiarizados con la jerga estadística, pero en realidad se trata únicamente de un método para calcular la relación entre variables.

Aunque el análisis de la regresión es una herramienta útil para diseñar un sistema de apuestas, su debilidad subyacente es su incapacidad para distinguir entre correlación y causalidad.

El análisis más sencillo es el de la regresión lineal simple, en el que se consideran solo dos variables, como el número de goles que marca un equipo (la variable predictiva o independiente) y su frecuencia de victoria (la variable respuesta o dependiente). 

En mi primer libro, Fixed Odds Sports Betting: Statistical Forecasting & Risk Management, examiné un modelo de regresión simple basado en la relativa superioridad goleadora de dos equipos en sus 6 partidos anteriores.

Utilizando una muestra grande de partidos (en este caso 8 temporadas, desde 1993 hasta 2001), es posible crear un gráfico para correlacionar las puntuaciones calculadas de los partidos (la diferencia de goles del equipo local en 6 partidos menos la diferencia de goles del equipo visitante en 6 partidos) con la frecuencia de cada resultado de partido. A continuación se muestra la distribución de la puntuación del partido (la variable independiente) frente a la frecuencia de victoria local (la variable dependiente).

correlation-and-causation-inarticle.jpg

Aunque los puntos de datos individuales del gráfico están algo diseminados, existe una tendencia lineal obvia que relaciona las dos variables: cuanto mejor es la diferencia de goles en los 6 últimos partidos del equipo local respecto al equipo visitante, más probable es que el equipo local gane el partido.

La línea de regresión dibujada en el gráfico describe esencialmente una relación idealizada entre la relativa superioridad goleadora y la frecuencia de victoria local, tras eliminar el ruido o la buena y mala suerte aleatorias.

Podemos describir la línea mencionada anteriormente a través de una ecuación; al tratarse de un modelo de regresión lineal simple, adopta la forma y = mx +c, donde “y” es la variable dependiente (la probabilidad de victoria), “x” es la variable independiente (la puntuación del partido), “m” es la pendiente o gradiente de la línea de tendencia (y una medida de la fuerza de la relación) y “c” es la constante o punto de intersección de la línea con el eje y (es decir, x = 0). En este ejemplo, la ecuación es la siguiente:

Victoria local (%) = (1,56 x puntuación del partido) + 46,5

Cuando la puntuación del partido es cero (es decir, el equipo local y el visitante están más o menos parejos en cuanto a la diferencia de goles), la probabilidad de victoria es del 46,5 %. Esto parece intuitivamente razonable, dado que aproximadamente el 46 % de los partidos de fútbol terminan con victoria del equipo local. Cuando la diferencia de goles neta del equipo local es de diez goles más que la del equipo visitante en los últimos seis partidos, el modelo de regresión muestra que dicho equipo gana normalmente en el 62 % de las ocasiones. Con una superioridad de 20 puntos, el porcentaje sube al 78 %. 

Nuestro análisis de la regresión también nos puede indicar qué parte de la variabilidad de las frecuencias de victoria se explica con este modelo de sistema de apuestas. En este caso fue el 86 %. Puedes observar que esto se demuestra a través de la bondad de ajuste de la línea de tendencia a los datos. Esto nos indica que existe una correlación fuerte entre las dos variables.

Utilización de un sistema para realizar pronósticos de apuestas

Para convertir nuestro modelo de regresión en un sistema de apuestas plenamente funcional, ahora necesitamos realizar pronósticos de partidos futuros y utilizarlos para identificar apuestas que tengan un valor esperado positivo.

La gestión del dinero simplemente cambia la naturaleza de los riesgos asociados a tus apuestas; sin embargo, no puede convertir un método de pronósticos perdedor en uno ganador a largo plazo.

Al igual que ocurre con la mayoría de metodología de creación de modelos, la suposición habitual es que el pasado es la clave del futuro. Si los partidos anteriores con puntuaciones de partido de +10 terminaron con victoria local el 62 % de las veces, entonces la suposición será que un equipo local con una superioridad goleadora de 10 puntos, en comparación con su rival, tendrá una probabilidad de ganar el partido del 62 %. 

A continuación, basta con transformar estas probabilidades en cuotas “reales” y, por tanto, podremos encontrar valor esperado en una casa de apuestas que ofrezca cuotas más grandes. Al aplicar este modelo a la temporada 2001/02 de la liga de fútbol inglesa, conseguí un beneficio sobre el volumen de apuestas de un +2,1 %, en 526 apuestas con las mejores cuotas de apuesta disponibles para la victoria local, en comparación con la pérdida de un -3,7 % que habría cosechado si simplemente hubiese apostado a ciegas a todas las victorias locales en esa temporada.

Correlación vs. Causalidad 

Una temporada de apuestas con un poco más de 500 apuestas no garantiza que la rentabilidad se pueda repetir temporada tras temporada. Puede parecer un número adecuado para estar seguros de la fiabilidad de un sistema de apuestas, pero los lectores habituales de Recursos para apostar sabrán que este no es el caso.

El artículo de Pinnacle sobre la ley de los números pequeños sirve para recordarnos que incluso las muestras de 1.000 apuestas pueden revelar patrones ilusorios de rentabilidad que de hecho no se basan en la causalidad, sino que se generan meramente por azar. Por desgracia, en las siguientes cinco temporadas utilizando este sistema de apuestas solo se produjeron pérdidas.

Aunque este sencillo modelo de regresión basado en la superioridad goleadora hizo un buen trabajo a la hora de descubrir qué equipos locales tenían más probabilidades de ganar, no garantizó que pudiera encontrar equipos que tuvieran más probabilidades de ganar que las sugeridas por las cuotas de las casas de apuestas.

Lamentablemente, muchos apostantes deportivos malinterpretan a menudo la precisión, exactitud y validez al analizar su historial de apuestas, confundiendo correlación y causalidad en el proceso.

Puede que mi modelo fuese bueno para realizar pronósticos, pero según parece no fue mejor a la hora de pronosticar que los modelos que las casas de apuestas utilizaron para establecer sus cuotas, ni tampoco fue mejor que los modelos que otros apostantes utilizaron y que ayudaron a determinar y modificar esas cuotas.

Si mi modelo hubiese repetido simplemente lo que hacían los modelos de las casas de apuestas, la rentabilidad no mostraría persistencia y tan solo reflejaría los caprichos del azar. Parece que no se creó basándose en alguna correlación válida. Los pronósticos de mi modelo no “causaron” esos beneficios porque el modelo no era más exacto que otros creados con el mismo objetivo.

Precisión vs. Exactitud

Por supuesto, un modelo de regresión lineal de dos variables difícilmente puede ser el más sofisticado de los sistemas de apuestas para intentar encontrar valor esperado. La regresión múltiple, en la que se introducen más variables independientes o predictivas, ofrece una manera de incrementar la precisión de los pronósticos. Sin embargo, los analistas deben tener cuidado para que esto no se produzca en detrimento de la exactitud.

Un modelo preciso es aquel en el que las mediciones están próximas entre sí, por ejemplo como demuestra la línea de tendencia observada anteriormente en mi sencillo modelo de regresión lineal. Sin embargo, la precisión no garantiza la exactitud. La exactitud es una medida de lo cerca que nos encontramos del valor “real”. La precisión está asociada con los errores aleatorios y la exactitud con los sistemáticos (también conocidos como sesgo). 

Para que un sistema de apuestas sea válido, o sea, para que de verdad haga lo que se supone que tiene que hacer (es decir, encontrar constantemente un valor esperado rentable), debe ser tanto preciso como exacto. La validez implica tanto previsibilidad como persistencia, es decir, si lo que creemos que es la causa es de verdad la causa real, y si nuestra medición apunta repetidamente hacia esa conclusión.

Lamentablemente, muchos apostantes deportivos malinterpretan a menudo la precisión, exactitud y validez al analizar su historial de apuestas, confundiendo correlación y causalidad en el proceso. Su error radica en creer que su sistema de apuestas “causó” los beneficios que lograron, cuando a menudo se debe a que simplemente se produjeron gracias a la buena suerte.

Los escollos del análisis de la regresión

Aunque el análisis de la regresión es una herramienta útil para diseñar un sistema de apuestas, su debilidad subyacente es su incapacidad para distinguir entre correlación y causalidad. El análisis de la regresión es eficaz a la hora de identificar una asociación entre variables, por ejemplo goles marcados y encajados frente a la probabilidad de ganar partidos, pero no es capaz de determinar si una variable causa la otra.

El análisis de la regresión puede mostrarnos que cuando el Barcelona pierde, Lionel Messi no marca ningún gol. Sin embargo, no podemos concluir que la falta de gol de Lionel Messi sea la causa de que el Barcelona pierda el partido.

Sin establecer la causalidad y la validez en nuestro sistema de apuestas, debemos ser precavidos ya que puede que no sea mejor que los modelos predictivos utilizados por los demás. En un contexto de habilidad relativa, como es el caso de las apuestas deportivas, no cobramos simplemente por predecir el futuro, tenemos que ser mejores en eso que los demás.

Recursos para apostar: facultando sus apuestas

La sección Recursos para apostar de Pinnacle es una de las recopilaciones más exhaustivas de consejos expertos sobre apuestas que encontrará en Internet. Dirigida a todos los niveles de experiencia, nuestro objetivo consiste simplemente en facultar a los apostantes para que estén mejor informados.