jan 10, 2020
jan 10, 2020

Primeira parte: Utilizar o Fator de Bayes para avaliar a competência nas apostas

O que é o Fator de Bayes?

Como interpretar um Fator de Bayes

Utilizar os Fatores de Bayes para cenários de apostas

Primeira parte: Utilizar o Fator de Bayes para avaliar a competência nas apostas

Como sabemos quando é que os resultados de apostas se devem à sorte e quando se devem à competência? Existem várias sugestões para tentar responder a esta pergunta, mas continuam a dar frequentemente origem a controvérsia. No seu mais recente artigo, Joseph Buchdahl explica como o Fator de Bayes pode ser utilizado para testar a competência nas apostas. Continue a ler para saber mais.

Por seu lado, o Fator de Bayes compara os méritos relativos de cada hipótese sem nada dizer sobre os respetivos méritos em relação à verdadeira expetativa de sair caras.

Muitas vezes, perguntam-me que tamanho é que uma amostra de apostas precisa de ter antes de podermos ter a certeza de que aquilo que estamos a ver é genuinamente o reflexo da capacidade de previsão subjacente de um apostador ou se se deve simplesmente à sorte? Em muitos aspetos, esta pergunta assemelha-se a perguntar qual é o comprimento de um pedaço de fio? No entanto, nos últimos anos, tenho procurado formas de responder a esta pergunta.

Uma abordagem habitual é calcular a probabilidade de que a eventual rentabilidade que vemos numa amostra de apostas pode ocorrer devido à sorte, partindo do pressuposto de que o apostador não tem qualquer competência, a chamada abordagem frequentista ou do valor p. Quando esta probabilidade é pequena (normalmente inferior a 5%, ou a 1% se quisermos ser mais exigentes), subjetivamente defendemos que deve existir outra coisa a funcionar, que não a sorte, por exemplo a competência.

A desvantagem da abordagem acima mencionada é que não nos indica a possibilidade de sermos competentes. Simplesmente calcula a possibilidade dos dados que vemos, dada a hipótese de que não somos competentes. Considerando um número de apostadores suficientemente grande, iremos sempre encontrar alguns valores p muito baixos que poderão dar a ilusão de competência.

Um método alternativo utiliza o Teorema de Bayes para estimar a possibilidade de sermos competentes considerando os dados que observamos. Além disso, com cada novo pedaço de dados (outro resultado de apostas, por exemplo), podemos atualizar a nossa possibilidade anterior para criar uma nova (a possibilidade posterior) numa cadeia iterativa de crença-atualização.

No entanto, uma desvantagem considerável do Teorema de Bayes é que as conclusões são sensíveis à escolha da possibilidade anterior inicial: neste caso, pensarmos que éramos competentes antes de embarcarmos numa “carreira” de apostas.

O que é o Fator de Bayes?

Anteriormente, comparei estas abordagens – frequentista e Bayesiana – para testar a competência dos apostadores. Neste artigo, gostaria de revisitar estas ideias ao apresentar o Fator de Bayes. Na minha opinião, o Fator de Bayes oferece uma mistura de ambas as abordagens, ao calcular a proporção de probabilidade de dois modelos ou hipóteses concorrentes (por exemplo, sou competente versus não sou competente), ao comparar as possibilidades dos dados em função de cada hipótese. 

O objetivo do Fator de Bayes consiste em quantificar o apoio a uma hipótese em relação à outra, independentemente de qual das hipóteses está correta. Em termos matemáticos, o Fator de Bayes é habitualmente indicado da seguinte forma:

bayes-skill-formula1.png

em que P = probabilidade, D = dados, H1 é a hipótese modelo; por exemplo, eu detenho um valor esperado de +5% graças à minha competência, e H0 é a hipótese nula, ou seja, eu não tenha nenhuma competência e a minha expectativa é equivalente à margem de -2,5% da casa de apostas. P(D|H) é a forma matemática de expressar “a probabilidade de observar os dados considerando que a hipótese seja verdadeira”.

Compreender o Fator de Bayes: um exemplo simples

Suponhamos que temos uma moeda. Achamos que ela pode estar viciada, mas não temos a certeza. Anteriormente, atirámo-la 10 vezes e obtivemos sete caras; portanto, estabelecemos a hipótese (H1) de que a moeda está viciada para caras por um fator de 70% para 30%. Com uma moeda não viciada (H0), os pesos relativos de caras e coroas são de 50% e 50%. Agora, atiramo-la 100 vezes e obtemos 60 caras. Que hipótese está correta?

Uma abordagem frequentista de valor p calcularia que a possibilidade de obter 60 ou mais caras com uma expetativa de 50:50 seria apenas de 1,76%, um valor suficientemente pequeno para que os académicos publicassem um artigo sobre uma moeda viciada. No entanto, o problema é que poderíamos publicar outro artigo sobre o facto de a moeda ser justa, uma vez que a possibilidade de 60 ou menos caras com um viés de 70:30 é de apenas 2,10%. Ambos os valores são estatisticamente significativos com um nível de confiança de 95%.

Por seu lado, o Fator de Bayes compara os méritos relativos de cada hipótese sem nada dizer sobre os respetivos méritos em relação à verdadeira expetativa de sair caras. Seguindo a fórmula acima, o Fator de Bayes pode ser calculado a partir da proporção das possibilidades de obter 60 caras para cada hipótese. Utilizando o Excel, temos:

bayes-skill-formula2.png

Como interpretar um Fator de Bayes

 

O que significa na realidade um valor de 0,783? Comparando as duas possibilidades acima, deveria ser intuitivamente óbvio que obter 60 caras é mais ou menos igualmente provável para qualquer uma das hipóteses. Um Fator de Bayes próximo de 1 sugere que há pouca ou nenhuma evidência que favoreça uma hipótese em relação à outra. Neste caso, porque é inferior a 1, poderíamos favorecer marginalmente a H0 (a moeda não viciada) sobre a H1 (a moeda viciada). 

Harold Jeffreys, o polímata do século XX, propôs uma escala de interpretação para o Fator de Bayes. Os valores entre 1 e 3 sugerem uma evidência esporádica que favorece a H1 sobre a H0 ou (1 para 1/3 para a H0 sobre a H1). Três para dez já sugere uma evidência moderada relativamente à H1 sobre a H0 (ou 1/3 para 1/10 para a H0 sobre a H1). Dez para 30 (e 1/10 para 1/30) sugere uma evidência forte, 30 para 100 (e 1/30 para 1/100) sugere uma evidência muito forte e mais de 100 (abaixo de 1/100) sugere evidências decisivas. 

Suponhamos, pelo contrário, que tínhamos observado 65 caras. De que forma é que isso muda o Fator de Bayes? Ao recalcularmos a proporção acima, temos:

bayes-skill-formula3.png

Isto representaria uma evidência muito mais forte para acreditarmos que a moeda estivesse viciada. 

Neste caso, deveríamos recordar-nos de que o Fator de Bayes não nos diz de facto qual é a probabilidade de que a H1 seja verdadeira, mas apenas que é mais provável que a H0. Considere obter 90 caras. O Fator de Bayes seria de 85,7 mil milhões, mas visto que obter 90 caras com um viés de 70:30 teria menos de 1 em 2,5 milhões de hipóteses de ocorrer, não é provável que a nossa crença esteja correta de que o viés seja de 70:30. 

O gráfico abaixo mostra como o Fator de Bayes varia (em termos logarítmicos) com o número de caras observadas.

bayes-factor-in-article-1.jpg

E se as expetativas das hipóteses não estiverem certas?

No meu exemplo de atirar a moeda ao ar, parti do pressuposto de uma possibilidade fixa quanto à expetativa de caras tanto para a H0 (50%) como para a H1 (70%). É um pressuposto razoável para uma moeda não viciada, já que uma regra bem definida das possibilidades determina que uma moeda não viciada terá hipóteses iguais de ser caras ou coroa. [Na verdade, é um pouco mais complicado do que isso e, para quem estiver interessado, aqui fica o artigo.] Mas será que é isso o que acontece, na verdade, para a H1, a da moeda viciada? 

Se não soubermos exatamente qual será a expetativa de caras, não será razoável partir do pressuposto de que a moeda poderá cair num intervalo em vez de lhe atribuir um valor preciso?

O Fator de Bayes compara os méritos relativos de cada hipótese sem nada dizer sobre os respetivos méritos em relação à verdadeira expetativa de sair caras.

Na verdade, é assim que se calculam os verdadeiros Fatores de Bayes. Até aqui, tenho estado realmente a falar sobre um teste de proporção de possibilidade, no qual a H1(70%) e a H0(50%) são estimativas máximas de possibilidade.

Sempre que as expetativas forem incertas, o Fator de Bayes é, na verdade, a proporção dos integrais das possibilidades sobre a distribuição total das expetativas possíveis de caras. Por exemplo, poderemos presumir que, embora uma expetativa de 70% de caras seja o mais provável para a H1, os intervalos das possíveis expetativas poderiam ser normalmente distribuídos com um desvio padrão de 5%.

O Excel não está equipado para lidar com este tipo de cálculo integral, mas é possível estimá-lo ao calcular uma média ponderada sobre os valores possíveis para a expetativa de caras.

Partindo do princípio de uma expetativa normalmente distribuída com uma possibilidade máxima de 70% e um desvio padrão de 5%, o valor original do Fator de Bayes de 0,783 aumenta para 1,26. Agora, a H1 (a moeda viciada) é marginalmente a hipótese mais favorecida. Tal acontece porque com uma distribuição das possíveis expetativas de caras, algumas abaixo de 70% e mais próximas de 60% (a percentagem observada de caras) estão a ser contabilizadas no cálculo da ponderação.

Utilizar os Fatores de Bayes para cenários de apostas mais complexos

O exemplo acima de atirar a moeda ao ar apresenta um cenário muito simples, no qual cada lançamento tem a mesma possibilidade de ocorrer. No entanto, nas apostas, tal quase nunca acontece, mesmo no caso dos apostadores no spread de pontos e no handicap asiático. Nas situações em que as probabilidades variam, torna-se efetivamente impossível utilizar a distribuição binomial para calcular a possibilidade de ocorrência de um conjunto particular de resultados de apostas. 

Felizmente, a distribuição normal para amostras acima de cerca de 30 proporciona um substituto adequado. Além disso, utilizar as probabilidades médias para uma amostra apresenta uma medida robusta dessas possibilidades, mesmo quando as probabilidades das apostas individuais variam de forma muito considerável desde que as paradas apostadas sejam as mesmas.

No Excel, a equação para a versão simples do Fator de Bayes (na realidade, a proporção da possibilidade) passa então a ser:

bayes-skill-formula4.png

em que y = o seu rendimento real (ou lucro sobre o volume de apostas), evH1 = o valor esperado para o seu modelo de previsões ou sistema de apostas (o rendimento que espera obter), evH0 é o valor esperado para as hipóteses nulas (por exemplo, este poderá ser a margem da casa de apostas), σH1 é o desvio padrão no evH1 e σH0 é o desvio padrão no evH0. 

Em fevereiro de 2019, mostrei como podemos modelar um intervalo de possíveis retornos de apostas através do desvio padrão. Especificamente, mostrei que podemos utilizar a seguinte expressão:

bayes-skill-formula5.png

em que p é a “verdadeira” possibilidade de vitória da aposta, o representa as probabilidades da aposta e n é o número de apostas. 

Com um pouco de reorganização, podemos mostrar que:

bayes-skill-formula6.png

em que r é o seu retorno sobre o investimento (ou y + 1). 

Se rH1 = evH1 + 1 e rH0 = evH0 + 1, então:

bayes-skill-formula7.png

e

bayes-skill-formula8.png

Qualquer pessoa familiarizada com a função NORMDIST no Excel pode ter conhecimento de que, quando utilizada com o identificador FALSO, o resultado é, na verdade, uma função Densidade de possibilidade e não apenas uma simples possibilidade. De modo mais confuso, as funções Densidade de possibilidade podem, em determinadas circunstâncias, ter valores superiores a 1, enquanto naturalmente as probabilidades não podem. 

Na verdade, as funções Densidade de possibilidade são equivalentes às probabilidades por unidade (neste exemplo, seria a probabilidade por rendimento) e, mais especificamente, a probabilidade por unidade num intervalo de valores infinitesimalmente pequeno (a derivada).

Não precisamos de nos preocupar com estas questões aqui. Felizmente, uma vez que estamos a dividir uma função Densidade de possibilidade por outra, as probabilidades “por unidades” anulam-se, deixando apenas uma proporção de probabilidades, que é o que o Fator de Bayes é na realidade. 

A primeira parte deste artigo deverá ter fornecido uma introdução suficiente ao Fator de Bayes e como ele pode ser utilizado num contexto de apostas. Na segunda parte, irei examinar de que forma podemos utilizar o Fator de Bayes para testar a evidência de competências nas apostas,  bem como outros cenários exemplificativos.

Recursos de apostas - Capacitar as suas apostas

Os Recursos de apostas da Pinnacle são um dos conjuntos mais abrangentes de conselhos de especialistas sobre apostas que se podem encontrar online. Dar resposta a todos os níveis de experiência - o nosso objetivo é simplesmente capacitar os apostadores a obterem mais conhecimentos.