jul 4, 2019
jul 4, 2019

Parte dos: ¿Los corredores de apuestas toman posturas sobre los márgenes de puntos?

¿Qué datos estamos analizando?

Estudio a fondo sobre márgenes

¿Sistemáticos o aleatorios?

Parte dos: ¿Los corredores de apuestas toman posturas sobre los márgenes de puntos?

La parte uno de este artículo introdujo la idea de que los corredores de apuestas toman posturas sobre los mercados de márgenes de puntos debido a que el mercado de apuestas tiene exceso de confianza en los favoritos. La parte dos usa los datos recientes de las apuestas en la NBA para responder esta pregunta. Sigue leyendo para averiguarlo.

¿Los corredores de apuestas toman posturas en un mercado de apuestas con márgenes de puntos? En la primera parte de este artículo sobre apuestas, propuse un experimento de pensamiento que explicaría el motivo por el cual la respuesta sería afirmativa, y revisé la evidencia del economista Stephen Levitt, que sugería que los corredores de apuestas manipulan los precios de los márgenes de la NFL con el objetivo de aprovecharse de la preferencia de los apostadores por los favoritos para cubrir el margen y aumentar sus ganancias.

Este sesgo sistemático puede explicarse con la confianza intuitiva: cuanta más confianza tiene un apostador en que un equipo ganará (mayor favoritismo percibido), más probabilidades existen de que también crea que el equipo cubrirá el margen de puntos.

Levitt observó no solo que el 60 % de los apostadores prefieren respaldar al favorito en los mercados de márgenes de puntos de la NFL, sino que esos favoritos solo cubren el margen el 48 % de las veces. En el caso de un corredor de apuestas con un margen teórico del 2,5 %, este tipo de distribución de la acción aumentaría sus ganancias al 3,3 %. 

Entonces, investigaré si existe un sesgo similar en los datos sobre márgenes de puntos más recientes del mercado de apuestas de la NBA.

¿Qué datos estamos analizando? 

Para este análisis, usé los datos de las puntuaciones y las líneas de 12 temporadas de la NBA, facilitadas por Sportsbook Reviews. El período de análisis cubre 15 508 partidos de la NBA entre el 30 de octubre de 2007 y el 5 de mayo de 2019. Los valores de los márgenes que usé corresponden al cierre del mercado.

Al elegir diferentes umbrales de hándicap de puntos para incluirlos en las pruebas después de graficar los datos, corremos el riesgo de elegir arbitrariamente valores que nos ayudan a adaptar la hipótesis a los datos, cuando en realidad tendríamos que adaptar los datos a la hipótesis.

No se presentan precios reales, pero se debe asumir que, en promedio, los márgenes representaron probabilidades de 50-50 (1,95/1,95 o 1,91/1,91 por ejemplo, -105/-105 o -110/-110 según la notación norteamericana, después de aplicar el margen). Si esta suposición es válida, no se necesitan precios reales para el análisis posterior. 

Sportsbook Reviews informa que, antes de 2015, los valores de los márgenes se obtuvieron de 5Dimes, Betonline, Bookmaker, Heritage, Pinnacle y Sportsbook.com; los años posteriores, de Westgate Superbook, con suplementos de 5Dimes y Bookmaker. No se dispone de información más precisa sobre qué márgenes individuales se obtuvieron de cada casa de apuestas específica. 

De los 15 508 partidos, 15 311 tuvieron un favorito por hándicap al cierre del mercado (donde el hándicap de uno de los equipos era de ≤-0,5). En 254 de esos partidos, el favorito (y obviamente también el menos favorito) cubrió el margen de puntos de forma exacta. En el resto de los 15 057 partidos, 7541 favoritos, o el 50,08 %, cubrieron el margen; lo mismo ocurrió con 7516, o el 49,92 %, de los menos favoritos. La diferencia de la expectativa del 50-50 muestra un valor de p del 84 % en la prueba de la ji al cuadrado. En otras palabras, no existe una diferencia significativa en términos estadísticos con respecto al sesgo no sistemático. Eso es lo que dice el 48 %.

Estudio a fondo sobre márgenes

Este hallazgo apenas replica el análisis de la NFL de Levitt. Sin embargo, no perdamos aún la esperanza de hallar un sesgo. Cabe recordar que la explicación de la confianza intuitiva sugiere que cuanto mayor sea el favoritismo por la línea de dinero, es más probable que un apostador elija respaldar al favorito también en el mercado de márgenes, lo que alienta a los corredores de apuestas a manipular sus márgenes hacia los hándicaps de puntos más altos.

El siguiente gráfico muestra el porcentaje acumulado de los favoritos que cubren el margen con los partidos ordenados por hándicap de puntos y con los hándicaps de mayor magnitud primero. Obviamente, la escala del eje x no es lineal porque hay muchos menos hándicaps de puntos altos que bajos. 

in-article-points-margen-in-article-1.jpg

Si ignoramos los hándicaps más grandes donde el tamaño de muestra pequeño aumenta la varianza considerablemente, los datos muestran una clara evidencia de un sesgo de márgenes de puntos, aunque uno desapareció para el momento en que alcanzamos los hándicaps de cero con los equipos que tienen la misma calificación. Por ejemplo, en los 1303 partidos que tenían hándicaps al cierre con una magnitud ≥12, solo el 47,0 % de los favoritos cubrieron el margen. En los 2600 partidos que tenían hándicaps al cierre con una magnitud ≥10, el 48,3 % de los favoritos cubrieron el margen. Y en los 4701 partidos que tenían hándicaps al cierre con una magnitud ≥8, el margen quedó cubierto en el 49,4 %.

¿Sistemáticos o aleatorios?

Entonces la pregunta es si este sesgo es significativo y relevante en términos estadísticos o simplemente un hallazgo fortuito que surge de la muestra pequeña. Considerando las magnitudes del hándicap ≥12, la prueba t confirma que el hecho de que la probabilidad de que el 47 % de los favoritos cubran el margen (dada la expectativa del 50 %) fuera resultado de la casualidad es solo del 0,3 %.

En general, esto se consideraría significativo en términos estadísticos (los valores de p <5 % o 1 % suelen considerarse referentes críticos de la significancia estadística), y descartaríamos la hipótesis nula de que no haya sesgo a favor de uno diferente donde existe algún tipo de sesgo en los márgenes por un motivo. Como establecimos en la parte uno, el motivo más obvio es que los corredores de apuestas manipulan sus márgenes para aprovecharse de los apostadores.

Desafortunadamente, existen tres salvedades. En primer lugar, el valor de p asociado con el umbral de hándicap de 10 puntos, 1,7 %, tiene menor significancia estadística, mientras que el del umbral de hándicap de 8 puntos, 25,2 %, carece de significancia estadística.

En segundo lugar, el uso de la prueba t tal vez no sea adecuado en este caso porque se trata de conteos de datos (la cantidad de veces que los equipos cubren los márgenes), lo que podría no ajustarse a una distribución conocida de datos. En su lugar, podemos usar una prueba no paramétrica más sólida pero menos poderosa sin distribución: la prueba de la ji al cuadrado. El valor de p de la prueba de la ji al cuadrado para el umbral de hándicap de 12 puntos es, por ejemplo, del 3,3 %.

Cuanta más confianza tiene un apostador en que un equipo ganará (mayor favoritismo percibido), más probabilidades existen de que también crea que el equipo cubrirá el margen de puntos.

Por último, no es tan obvio qué hándicap de puntos deberíamos considerar cuando tratamos de determinar un sesgo. Al elegir diferentes umbrales de hándicap de puntos para incluirlos en las pruebas después de graficar los datos, corremos el riesgo de elegir arbitrariamente valores que nos ayudan a adaptar la hipótesis a los datos, cuando en realidad tendríamos que adaptar los datos a la hipótesis. Nunca es una muy buena idea semejante minería de datos. Los apostadores que quieren "descubrir" sistemas rentables de esta manera, lo hacen bajo su propia responsabilidad.

En el caso extremo, podríamos calcular el valor de p para cada punto en la serie de hándicaps de puntos calificados. Aquí, eso significaría 15 310 de los casos. Esto crea un problema de comparaciones múltiples; cuando realizamos un conjunto de pruebas estadísticas al mismo tiempo, cada una tiene el potencial de "descubrir" una inferencia significativa. Por ejemplo, si una de prueba se realiza con un valor de p crítico (umbral de significancia estadística) del 5 % y la hipótesis nula (que solo opera el azar) es verdadera, existe una posibilidad de tan solo el 5 % de rechazar la hipótesis nula incorrectamente.

Sin embargo, si se realizan 100 pruebas donde todas las hipótesis nulas correspondientes son verdaderas, y las pruebas son estadísticamente independientes una de la otra, la probabilidad de, al menos, un rechazo incorrecto es del 99,4 %. No podemos tener mucha fe en nuestras pruebas de hipótesis a menos que apliquemos algún tipo de corrección.

Un método frecuente es la corrección de Bonferroni. Para realizar la corrección de Bonferroni, se divide el valor de p crítico por la cantidad de comparaciones hechas. Por ejemplo, si el valor crítico de una sola prueba fue del 5 %, con 10 pruebas simultáneas, lo reduciríamos al 0,5 %. Si ninguno de los 10 valores de p está por debajo de este umbral más demandante, no podríamos descartar la hipótesis nula de que todo lo observado es solo resultado del azar. 

En el siguiente gráfico se muestra la evolución del valor de p con la prueba t y con la prueba de a ji al cuadrado para muestras de partidos consecutivas acumuladas en la serie calificada por hándicap de puntos. El eje y es logarítmico. También se muestra el valor de p crítico con la corrección de Bonferroni, suponiendo que el valor crítico para una prueba es del 5 % y que se realizaron 15 310 pruebas simultáneas.

in-article-points-margen-in-article-2.jpg

Las pruebas de la ji al cuadrado no paramétricas muestran valores de p más conservadores y son probablemente las que más merecen nuestra atención. Aún, incluso para los valores de p obtenidos con la prueba t, ningún valor alcanzó el valor crítico corregido que nos permitiría descartar el azar como el único motivo para nuestras observaciones.

En sentido estricto, la corrección de Bonferroni asume que todas las pruebas simultáneas son independientes una de la otra. Evidentemente, este no sería el caso en una serie calificada de hándicaps de puntos, donde tratamos de descubrir progresivamente si las muestras consecutivas más grandes de favoritos cubrirían colectivamente el margen menos del 50 % de las veces. Por lo tanto, nuestro umbral crítico corregido tal vez sea demasiado conservador. Sin embargo, ejemplifico esta metodología para resaltar los obstáculos posibles de asumir la significancia estadística cuando tal vez en realidad no exista. 

¿Qué aprendimos de este análisis?

En términos cualitativos, resumiría las observaciones de la siguiente manera. Sí, parece existir un sesgo hacia los favoritos de márgenes de puntos en el mercado de apuestas de la NBA, pero existe verdaderamente solo para el mayor de los valores de hándicap. Si este sesgo presenta alguna significancia estadística, lo que daría a entender un motivo causal de su existencia más allá del azar, como la manipulación de los márgenes por parte de los corredores de apuestas, probablemente sea débil.

Si los corredores de apuestas manipulan el margen, como sugirió Levitt en relación con la NFL, el alcance de dicha manipulación es limitado. El sesgo intuitivo explicaría por qué los apostadores apuestan excesivamente por el hándicap más grande, pero, de ser así, los corredores de apuestas solo pueden explotar esto mínimamente. Si se explotara más con un mayor desplazamiento de los márgenes, el comportamiento de los apostadores probablemente respondería de manera no lineal, por lo que se descartaría todo tipo de expectativa adicional de ganancia que los corredores de apuestas hubieran esperado.

Si se hubiera apostado contra los favoritos en esta muestra de 12 temporadas, como lo haría un opositor, el rendimiento habría evolucionado de la siguiente manera, con un hándicap de puntos calificados con supuestos precios de 1,95 (-105) y un margen del 2,5 % para el corredor de apuestas.

in-article-points-margen-in-article3.jpg

Es verdad que existe potencialmente cierta ganancia siendo el opositor que apuesta por los menos favoritos para cubrir el margen. Sin embargo, es pequeña, y nos seguimos preguntando si es en realidad significativa en términos estadísticos y, por lo tanto, si persistirá en el futuro. Al igual que con el sesgo improbable-favorito en los mercados de apuestas con probabilidades fijas, cualquier posible ganancia que exista por su presencia se limita a las apuestas solo contra el más fuerte de los favoritos, mientras que la mayor parte del mercado permanece dentro de las tolerancias de riesgo establecidas por el margen del corredor de apuestas.

Sin dudas, no existe una diferencia entre todos los favoritos y los menos favoritos más generalmente a lo largo de todos los márgenes; cubren el margen al igual que cualquier otro. Si bien podrían existir áreas de ineficiencia para los mayores favoritos, en promedio, los precios de los márgenes de la NBA parecen muy representativos de las probabilidades reales de que los equipos cubran dichos márgenes.

Si alguna vez existió un sesgo más general al momento en que Levitt estaba estudiando los mercados de la NFL, parecería haber desaparecido en gran medida. Una vez que las ineficiencias pasan a formar parte del conocimiento público, suelen tener una vida útil limitada.

Recursos para apostar: facultando sus apuestas

La sección Recursos para apostar de Pinnacle es una de las recopilaciones más exhaustivas de consejos expertos sobre apuestas que encontrará en Internet. Dirigida a todos los niveles de experiencia, nuestro objetivo consiste simplemente en facultar a los apostantes para que estén mejor informados.