ene 10, 2020
ene 10, 2020

Primera parte: Evaluación del talento del apostador mediante el factor de Bayes

¿Qué es el factor de Bayes?

Cómo interpretar un factor de Bayes

Cómo usar los factores de Bayes en situaciones hipotéticas de apuestas

Primera parte: Evaluación del talento del apostador mediante el factor de Bayes

¿Cómo sabemos cuándo los resultados de las apuestas dependen de la suerte y cuándo del talento? Existen varios indicios que intentan dar respuesta a esta pregunta, pero todavía suelen suscitar el debate. En su último artículo, Joseph Buchdahl explica cómo se puede usar el factor de Bayes para evaluar el talento del apostador. Sigue leyendo para obtener más información.

El factor de Bayes, en cambio, compara los méritos relativos de cada hipótesis sin mencionar sus méritos relacionados con la expectativa de caras verdadera.

Me suelen preguntar qué tan grande debe ser una muestra de apuestas para estar seguros de que lo que estamos observando es realmente un reflejo del talento subyacente del apostador como pronosticador y no simplemente el reflejo de la suerte. En muchos aspectos, esto es como preguntar qué tan largo es un trozo de cuerda. Sin embargo, durante los últimos años he buscado formas de responder esta pregunta.

Un enfoque habitual es calcular la probabilidad de que la rentabilidad que vemos en una muestra de apuestas surgir por casualidad suponiendo que el apostador no tiene talento, el llamado enfoque frecuentista o valor de p. Cuando esta probabilidad es baja (generalmente inferior al 5 %, o 1 % si somos más exigentes), subjetivamente argumentamos que debe haber algo más que la casualidad, como por ejemplo el talento.

La desventaja con el enfoque mencionado es que no nos dice la probabilidad de que tengamos talento. Simplemente calcula la probabilidad de los datos que vemos sobre la hipótesis de que no tenemos talento. Dada una cantidad lo suficientemente grande de apostadores, siempre encontraremos algunos con valores de p muy bajos que pueden dar la sensación de tener talento.

Un método alternativo usa el teorema de Bayes para estimar la probabilidad de la hipótesis de que tenemos talento dados los datos que observamos. Además, con cada dato nuevo (otro resultado de apuestas, por ejemplo), podemos actualizar la probabilidad anterior a una nueva (la probabilidad posterior) en una cadena iterativa de actualización de opiniones.

Sin embargo, una desventaja importante del teorema de Bayes es que las conclusiones son susceptibles a la elección de la probabilidad anterior inicial, en este caso que pensamos que éramos un apostador talentoso antes de comenzar una ‘carrera’ en apuestas.

¿Qué es el factor de Bayes?

Anteriormente comparé los enfoques frecuentista y bayesiano en la evaluación del talento del apostador. En este artículo, quisiera repasar esas ideas introduciendo el factor de Bayes. A mi juicio, el factor de Bayes ofrece una combinación de ambos enfoques calculando la razón de verosimilitud de dos hipótesis o modelos que compiten (por ejemplo, tengo talento frente a no tengo talento), comparando las probabilidades de los datos dada cada hipótesis. 

El propósito del factor de Bayes es cuantificar el respaldo de una hipótesis frente a la otra, independientemente de si alguna es correcta. Matemáticamente, el factor de Bayes se expresa por lo común de la siguiente manera:

bayes-skill-formula1.png

en donde P = probabilidad, D = datos, H1 es la hipótesis modelo, por ejemplo, tengo un valor esperado de +5 % por mi talento, y H0 es la hipótesis nula, por ejemplo, no tengo talento y mi expectativa es equivalente al margen -2,5 % de la casa de apuestas. P(D|H) es una forma matemática de expresar “la probabilidad de observar los datos siempre y cuando la hipótesis sea cierta”.

Comprensión del factor de Bayes: Un ejemplo simple

Supongamos que tenemos una moneda. Creemos que puede estar sesgada, pero no lo sabemos. Anteriormente la lanzamos 10 veces y obtuvimos siete caras, por lo que hipotetizamos (H1) que la moneda está sesgada hacia la cara en un factor de 70 % a 30 %. En una moneda no sesgada (H0), los pesos relativos de cara y cruz son 50 % y 50 %. Ahora la lanzamos 100 veces y obtenemos 60 caras. ¿Cuál hipótesis es correcta?

Un enfoque de valor de p frecuentista calcularía que la probabilidad de obtener 60 o más caras con una expectativa 50:50 es solo del 1,76 %, lo suficientemente baja como para que los académicos publiquen un artículo sobre una moneda sesgada. Sin embargo, el problema es que podríamos publicar otro artículo sobre la imparcialidad de la moneda, dado que la probabilidad de 60 o menos caras con un sesgo 70:30 es de solo el 2,10 %. Ambas cifras son estadísticamente significativas en el nivel de confianza del 95 %.

El factor de Bayes, en cambio, compara los méritos relativos de cada hipótesis sin mencionar sus méritos relacionados con la expectativa de caras verdadera. Siguiendo la fórmula anterior, el factor de Bayes se puede calcular a partir de la razón de probabilidades de obtener 60 caras en cada hipótesis. Con Excel, tenemos lo siguiente:

bayes-skill-formula2.png

Cómo interpretar un factor de Bayes

 

¿Qué significa en realidad una cifra de 0,783? Si comparamos las dos probabilidades anteriores, debería ser evidente, de forma intuitiva, que obtener 60 caras es aproximadamente igual de verosímil en ambas hipótesis. Un factor de Bayes cercano a uno implica que hay poca o ninguna evidencia que favorezca una hipótesis sobre la otra. En este caso, como está por debajo de 1, podríamos favorecer ligeramente a H0 (la moneda no sesgada) por sobre H1 (la moneda sesgada). 

Harold Jeffreys, el polímata del siglo XX, propuso una escala de interpretación para el factor de Bayes. Los valores entre uno y tres implican evidencia anecdótica que favorece a H1 por sobre H0 o (1 a 1/3 para H0 por sobre H1). Los valores entre tres y diez implican evidencia moderada en favor de H1 por sobre H0 (o 1/3 a 1/10 para H0 por sobre H1). Los valores entre 10 y 30 (y 1/10 a 1/30) implican evidencia contundente; 30 a 100 (y 1/30 a 1/100), evidencia muy contundente; y más de 100 (menos de 1/100) evidencia decisiva. 

Supongamos que, en cambio, observamos 65 caras. ¿En qué modifica esto el factor de Bayes? Si volvemos a calcular la razón anterior, obtenemos lo siguiente:

bayes-skill-formula3.png

Esta evidencia sería mucho más contundente para creer que la moneda está sesgada. 

En este caso, deberíamos recordarnos que el factor de Bayes no nos dice en realidad la probabilidad de que H1 sea cierta, sino que es más probable que H0. Consideremos 90 caras. El factor de Bayes sería de 85 700 millones, pero dado que observar 90 caras con un sesgo 70:30 tendría menos de 1 posibilidad en 2,5 millones, no es verosímil que nuestra creencia de que el sesgo es 70:30 sea correcta. 

En el cuadro siguiente se muestra cómo varía el factor de Bayes (de manera logarítmica) con la cantidad de caras observadas.

bayes-factor-in-article-1.jpg

¿Qué sucede si las expectativas de hipótesis son inciertas?

En mi ejemplo de lanzar la moneda, supuse una probabilidad fija para la expectativa de caras en H0 (50 %) y H1 (70 %). Resulta razonable para una moneda no sesgada, debido a que es una regla bien establecida de probabilidad que una moneda no sesgada tiene las mismas posibilidades de caer de cara o de cruz. [De hecho, es un poco más complicado que eso, y para quienes les interese, aquí está el artículo]. Pero, ¿es realmente este el caso de H1, la moneda sesgada? 

Si no conocemos exactamente la expectativa de caras, ¿no sería razonable suponer que podría encontrarse en un rango en lugar de asignarle un valor preciso?

El factor de Bayes compara los méritos relativos de cada hipótesis sin mencionar sus méritos relacionados con la expectativa de caras verdadera.

De hecho, así es como se calculan los verdaderos factores de Bayes. Hasta ahora, he hablado de la prueba de la razón de verosimilitud, en la que H1 (70 %) y H0 (50 %) son estimaciones de verosimilitud máximas.

En los casos en que las expectativas de las hipótesis son inciertas, el factor de Bayes es, de hecho, la razón de los integrales de las probabilidades en la distribución completa de expectativas de caras posibles. Por ejemplo, podemos suponer que mientras que una expectativa de caras del 70 % es la más verosímil para H1, los rangos de expectativas posibles pueden distribuirse normalmente con una desviación estándar del 5 %.

Excel no tiene la capacidad de lidiar con este tipo de cálculos integrales, pero es posible estimarlos calculando un promedio ponderado de valores posibles para la expectativa de caras.

Suponiendo una expectativa de distribución normal con una verosimilitud máxima del 70 % y una desviación estándar del 5 %, el valor del factor de Bayes original de 0,783 aumenta a 1,26. Ahora, H1 (la moneda sesgada) es la hipótesis ligeramente más favorecida. Esto se debe a que con una distribución de expectativas de cara posibles, algunas por debajo del 70 % y más cercanas al 60 % (el porcentaje observado de caras) se están teniendo en cuenta en el cálculo de ponderación.

Cómo usar los factores de Bayes en situaciones hipotéticas más complejas

El ejemplo anterior de lanzar la moneda presenta una situación hipotética muy simple en la que cada lanzamiento tiene la misma probabilidad. Sin embargo, en las apuestas, este no es casi nunca el caso; incluso para los apostadores de margen de puntos y hándicap asiático. Cuando las cuotas varían, se vuelve efectivamente imposible usar la distribución binomial para calcular la probabilidad de un conjunto de resultados de apuestas en particular. 

Por suerte, la distribución normal de las muestras por sobre aproximadamente 30 proporciona un reemplazo adecuado. Además, usar las cuotas promedio de una muestra ofrece una medición firme de dichas probabilidades, incluso cuando las cuotas de apuesta individuales varían considerablemente siempre y cuando las apuestas sean las mismas.

En Excel, la ecuación para la versión simple del factor de Bayes (en realidad, la razón de verosimilitud) se convierte en lo siguiente:

bayes-skill-formula4.png

en donde y = tu rendimiento real (o ganancia sobre el volumen), evH1 = tu valor esperado para el sistema de apuestas o modelo de pronóstico (el rendimiento que esperas lograr), evH0 es el valor esperado para la hipótesis nula (por ejemplo, puede ser el margen de la casa de apuestas), σH1 es la desviación estándar en evH1, y σH0 es la desviación estándar en evH0. 

En febrero de 2019, mostré cómo podemos modelar un rango de ganancias de apuestas posibles por medio de la desviación estándar. Específicamente, mostré que podemos usar la expresión siguiente: 

bayes-skill-formula5.png

en donde p es la probabilidad de ganar la apuesta ‘verdadera’, o son las cuotas de apuestas y n es la cantidad de apuestas. 

Si hacemos algunos pequeños cambios, podemos ver lo siguiente:

bayes-skill-formula6.png

en donde r es el retorno de la inversión (o y + 1). 

Si rH1 = evH1 + 1 y rH0 = evH0 + 1, entonces: 

bayes-skill-formula7.png

y

bayes-skill-formula8.png

Cualquiera que esté familiarizado con la función de Excel NORMDIST puede entender que cuando se usa con el identificador FALSE, el resultado es de hecho una función de densidad de probabilidad en lugar de una simple probabilidad. Y lo que resulta más confuso, las funciones de densidad de probabilidad pueden, en ciertas circunstancias, tener valores superiores a 1, mientras que las probabilidades, no. 

De hecho, las funciones de densidad de probabilidad son equivalentes a las probabilidades por unidad (en este ejemplo serían probabilidades por rendimiento), y más específicamente la probabilidad por unidad en un rango de intervalo infinitesimalmente pequeño (el derivado).

No debemos preocuparnos por tales cuestiones aquí. Por suerte, como estamos dividiendo una función de densidad de probabilidad por otra, las ‘por unidades’ se cancelan, lo que deja solo una razón de probabilidad, que es precisamente lo que es el factor de Bayes. 

En esta primera parte del artículo se debería haber proporcionado una introducción suficiente al factor de Bayes y cómo se puede usar en un contexto de apuestas. En la segunda parte, analizaré cómo podemos usar el factor de Bayes para evaluar la evidencia de talento en apuestas, al igual que otras situaciones hipotéticas modelo.

Recursos para apostar: facultando sus apuestas

La sección Recursos para apostar de Pinnacle es una de las recopilaciones más exhaustivas de consejos expertos sobre apuestas que encontrará en Internet. Dirigida a todos los niveles de experiencia, nuestro objetivo consiste simplemente en facultar a los apostantes para que estén mejor informados.