jun 5, 2020
jun 5, 2020

A assimetria do mercado de apostas

Dois tipos de incerteza

Modelando a incerteza em um contexto de apostas

O mundo real das apostas

A assimetria do mercado de apostas

É amplamente aceito que vencer uma casa de apostas, especialmente uma como a Pinnacle, é uma tarefa muito desafiadora. Mas o que torna isso tão difícil? Será que observar as coisas da perspectiva de uma casa de apostas nos ajuda a entender o quão bom você precisa ser para vencer nas apostas esportivas? Leia para saber mais.  

Durante os meses de inatividade esportiva, perguntei-me se seria possível medir quão bons os apostadores devem ser para vencer a casa de apostas. Como de costume, não estou falando de vitórias por sorte, mas de rentabilidade esperada em longo prazo por meio dos princípios das apostas em valor.

Sabemos que, para conseguir isso, precisamos superar a margem da casa de apostas. O fato de que uma proporção tão pequena de apostadores provavelmente consegue isso é evidência de que essa é uma tarefa bastante difícil, mesmo quando algumas margens são tão reduzidas quanto 2%.

Além disso, quem leu meus artigos ou me acompanha no Twitter estará ciente de várias ferramentas do Excel que forneci para medir as chances estatísticas de alcançar um valor esperado lucrativo e como é esperado que esses desempenhos sejam distribuídos, com base em certas premissas de apostas.

No entanto, o que pretendo investigar desta vez é exatamente com o que o "ser melhor que a casa de apostas" se parece a partir da perspectiva da incerteza. Apostar, como sabemos, é um negócio incerto, mesmo para os melhores analistas. Quão menos incertos precisamos ser para superar a margem e nos tornarmos vencedores em longo prazo?

Por meio de tentativas de simulação de uma resposta, fica claro o quão boa é a casa de apostas e por que ela deve ser boa para continuar lucrativa. Essa é a assimetria do mercado de apostas.

Dois tipos de incerteza

Nos meus dois últimos artigos para a Pinnacle, discutimos dois tipos de incerteza. Em primeiro lugar, há a incerteza aleatória ou estatística. Essa é a incerteza inerente devido à variabilidade probabilística. Repita um processo várias vezes, por exemplo, jogar uma moeda, e variações sutis nas condições iniciais renderão resultados diferentes. Essas diferenças permanecem desconhecidas. A incerteza aleatória é irredutível. 

Algumas delas, como o demônio de Laplace, podem levantar o argumento de que essa é simplesmente uma consequência de informações limitadas e poder de processamento. Se pudéssemos conhecer perfeitamente todas as condições iniciais, certamente poderíamos prever todos os resultados com precisão.

Em termos práticos, a complexidade desses sistemas reduz essa coleta de informações ao nível do impossível. Porém, talvez o mais importante seja que a natureza probabilística, em vez de determinística, da realidade em pequenas escalas faz com que, mesmo teoricamente, essa tarefa esteja fadada ao fracasso.

Se a casa de apostas demorar muito na avaliação das probabilidades reais, haverá uma boa chance de o apostador também demorar e vice-versa. Alguns apostadores também podem estar parcialmente ancorados ao preço da casa de apostas.

É precisamente por esse motivo que faz sentido falar sobre probabilidades "verdadeiras" de resultados, e não nos iludirmos acreditando que elas sejam deterministicamente 0% ou 100%. É verdade que, nos esportes, diferentemente do lançamento de moedas ou de jogos de dados, não sabemos e não podemos conhecer as probabilidades "verdadeiras" (daí as aspas), mas faz sentido falar como se elas existissem.

O segundo tipo de incerteza é epistêmico, ou um modelo de incerteza, e surge por causa da compreensão incompleta sobre o que estamos tentando modelar. A incerteza epistêmica pode ser reduzida por meio da aquisição de conhecimento adicional sobre o modelo.

O objetivo da quantificação da incerteza é reduzir incertezas epistêmicas a incertezas aleatórias, embora, na prática, devido à complexidade do sistema e à natureza probabilística da realidade, a fronteira entre as duas possa ser confusa.

Em seu brilhante artigo publicado pela Pinnacle, Toward a theory of everything (Em direção a uma teoria de tudo), o autor convidado @PlusEVAnalytics descreveu esses dois tipos de incerteza, respectivamente, como incerteza de processo (aleatória) e de parâmetro (epistêmica). Ao reproduzir seu exemplo, esperamos esclarecer a diferença entre elas.

"Suponha que você atribua a um time de futebol uma probabilidade de 60% de ganhar, aposte nesse tipo com dinheiro na mesma proporção, mas eles perdem. Por que você perdeu sua aposta? Talvez você esteja correto em sua avaliação, mas não teve sorte, o evento que tinha 40% de chances de acontecer ocorreu e você perdeu sua aposta. Isso é causado pela incerteza de processo (aleatória), ou seja: você fez uma boa aposta, mas não teve sorte no resultado. Por outro lado, talvez você esteja incorreto em sua avaliação e a verdadeira probabilidade tenha sido de 50%, 30% ou até 1%. Você fez uma aposta que pensava ser boa, mas, na realidade, foi ruim. Essa é a incerteza de parâmetro (epistêmica). Como a verdadeira probabilidade é desconhecida, é muito difícil saber quanto dos seus resultados (bons ou ruins) são conduzidos pela incerteza de processo em oposição à incerteza de parâmetro."

Modelando a incerteza em um contexto de apostas

Em um ambiente de apostas, a incerteza aleatória será a mesma para todos. Os mesmos eventos ocorrem em uma competição esportiva, com a influência das mesmas variáveis. Todo apostador vive a mesma história.

É fácil modelar a incerteza aleatória por meio de um simples gerador de números aleatórios. Suponha que tenhamos um concurso 50-50, com probabilidades justas de 2,00. Para modelar a incerteza aleatória, podemos usar apenas um gerador de números aleatórios para gerar números entre 0 e 1. Se o resultado for abaixo de 0,5, sua aposta será vencedora. Acima disso, você terá perdido. A distribuição dos resultados (apostas ganhadoras e perdedoras) seria dada por um binômio.

Modelar a incerteza epistêmica é um pouco mais problemático, uma vez que não é óbvio que tipo de distribuição e aspecto esses erros decorrentes teriam. @PlusEVAnalytics usou uma distribuição beta para modelar essa incerteza, mas ele é muito mais inteligente do que eu, então vou recorrer à preguiça da distribuição normal. Além disso, assumirei que essa distribuição de erros epistêmicos está centrada na probabilidade verdadeira de resultado, como descrito abaixo. Obviamente, se houver vieses sistemáticos, isso não será verdade.

Para o apostador, essa talvez não seja uma suposição irracional, uma vez que já demonstrei que, pelo menos em mercados esportivos maiores, as probabilidades de apostas da Pinnacle são altamente eficientes. Em média, elas refletem as verdadeiras probabilidades subjacentes de resultados com muita precisão, mesmo que individualmente haja erros. Ainda não há tanta certeza de que isso também seja verdade para os apostadores.

Distribuição na incerteza epistêmica

Para modelar o efeito da incerteza epistêmica, criei uma série de 1.000 apostas hipotéticas, em que a verdadeira probabilidade de ganhar todas as apostas era de 50%. Para cada aposta, meu modelo de previsão hipotético exibe algum erro epistêmico ao julgar as verdadeiras probabilidades de vitória, cujo tamanho é determinado por seis desvios padrão diferentes: 0%, 1%, 2%, 3%, 4% e 5%. Por exemplo, para um desvio padrão de 1%, pouco mais de dois terços das probabilidades de vitória "verdadeiras" modeladas estarão entre 49% e 51%, com cerca de 95% entre 48% e 52%.

Para desvios padrão maiores, o spread nessas probabilidades "verdadeiras" de vitória, conforme produzido pelo modelo de previsão, será maior, como demonstrado no gráfico abaixo. Obviamente, com um desvio padrão de 0%, todas as probabilidades de vitória seriam exatamente 50%, portanto a linha não é mostrada. Quanto maior a distribuição, maior a incerteza epistêmica.

asymmetry-inarticle-Picture-1.jpg

Fica claro no gráfico que, embora cada uma dessas distribuições de probabilidade de vitória represente um modelo eficiente (a média é sempre 50%), a quantidade de incerteza epistêmica é variável.

Inverter as probabilidades de vitória "verdadeiras" nos dá a distribuição de probabilidades. Por causa da relação inversa entre a probabilidade de vitória e as probabilidades implícitas, elas serão distribuídas normalmente.

Em uma amostra de 1.000 apostas, isso significa que as probabilidades "verdadeiras" modeladas normalmente variam entre 1,88 e 2,13, 1,78 e 2,28, 1,69 e 2,46, 1,60 e 2,66 e 1,52 e 2,89 para desvios padrão de 1%, 2%, 3%, 4% e 5%, respectivamente.

asymmetry-inarticle-Picture-2.jpg

Casa de apostas vs. Apostador

Vamos usar esse modelo de incerteza epistêmica nas probabilidades verdadeiras para criar uma disputa entre a casa de apostas e o apostador. Para cada aposta, a casa de apostas publica sua opinião sobre quais são as probabilidades verdadeiras com uma margem de 2,5%, reduzindo o preço. Por exemplo, a casa publicaria 1,95 se pensasse que o preço real da aposta era 2,00. Nas 1.000 apostas, essas probabilidades variarão de acordo com as distribuições acima.

O apostador tem outro modelo e o utiliza para estimar quais devem ser as probabilidades reais. Se as probabilidades publicadas pela casa de apostas forem maiores que a estimativa do apostador, o apostador fará uma aposta de 1 unidade. Caso contrário, não haverá aposta.

Para fins de liquidação das apostas, as chances reais de cada aposta, sem o conhecimento da casa de apostas e do apostador, são de 2,00, e um gerador de números aleatórios é usado para determinar o resultado. Como explicado anteriormente, qualquer variação aqui é a consequência da incerteza aleatória.

O concurso foi repetido 10 mil vezes, com o uso de uma simulação de Monte Carlo. Primeiro, observe o número médio de apostas para cada um dos 36 pares diferentes de incertezas epistêmicas entre a casa de apostas e o apostador. Quanto maior a incerteza epistêmica (mostrada nos cabeçalhos de linha e coluna), tanto para apostador quanto para as apostas, mais provável que a diferença entre os dois modelos seja maior que a margem, portanto, é mais provável que uma aposta seja implementada.

asymmetry-inarticle-Picture-3.jpg

Quando a casa de apostas e o apostador são perfeitos, é impossível que haja apostas, pois a casa de apostas estará sempre publicando 1,95 e o apostador sempre saberá que esse valor é menor do que o preço real. 

A segunda tabela mostra os rendimentos médios (esperados) que o apostador conseguiu alcançar para cada par de incertezas. Lembre-se: quanto menor o desvio padrão, menor a incerteza epistêmica e melhor o modelo.

asymmetry-inarticle-Picture-4.jpg

Sem surpresa, quando a casa de apostas é perfeita e prevê exatamente a probabilidade de cada aposta, não importa quão bom seja o apostador, ele sempre perderá uma quantia equivalente ao tamanho da margem (-2,5%). A ligeira variabilidade em torno desse número é simplesmente consequência da incerteza aleatória. Uma simulação maior de Monte Carlo reduziria isso.

Observe também que, onde o modelo do apostador é melhor (menos incerto) do que o da casa de apostas, ele é suficiente para gerar um lucro esperado. Mas há também algo bastante intrigante que se torna aparente. Quando o modelo da casa de apostas é ruim, o apostador ainda pode obter um lucro esperado, mesmo que o modelo seja pior. Por exemplo, se a incerteza epistêmica da casa de apostas tiver um desvio padrão de 3% na probabilidade de vitória, o apostador ainda poderá esperar ganhar +0,68% quando seu modelo tiver um desvio padrão de incerteza de 5%. Isso parece não fazer sentido algum. 

A assimetria do mercado de apostas

Para solucionar esse paradoxo, precisamos examinar como essa disputa foi construída. Como em qualquer mercado de apostas, a casa de apostas estabelecerá um preço. O apostador deve então decidir aceitar o desafio, mas apenas se as probabilidades publicadas forem maiores que as próprias probabilidades "verdadeiras" estimadas. Caso isso aconteça, a casa de apostas não terá a chance de retirar a oferta da aposta.

No cenário do meu modelo, se houver alguma incerteza epistêmica, 50% dos erros da casa de apostas preverão probabilidades "verdadeiras", que estão acima das verdadeiras probabilidades reais (de 2,00) e 50% abaixo. Da mesma forma, 50% dos erros do apostador ficarão acima ou abaixo de 2,00. 

Nós nunca podemos saber quais probabilidades a casa de apostas realmente acredita serem "verdadeiras" nos seus mercados. Também não podemos saber quais são as verdadeiras probabilidades reais dessas estimativas.

No entanto, quando as probabilidades da casa de apostas estão abaixo de 2,00, há menos oportunidade de as probabilidades do apostador estarem ainda mais abaixo, o que desencadeia uma aposta. Por outro lado, há mais oportunidades para uma aposta ser realizada quando as chances da casa de apostas estão mais acima.

Essa assimetria leva a uma proporção maior de apostas com valor esperado positivo versus valores negativos. Quanto maior a incerteza epistêmica, maior a assimetria. Quando a casa de apostas e o apostador apresentam um desvio padrão de 2% na incerteza, 56% das apostas têm valor esperado positivo, e a probabilidade média de aposta é de 2,01. Quando o desvio padrão na incerteza sobe para 5% para ambos, 68% das apostas são realizadas com probabilidades acima de 2,00, com uma média de 2,10. 

Se, em vez disso, executarmos um modelo diferente, no qual o financiador e o intermediário tenham de concordar mutuamente se devem participar de uma aposta com probabilidades publicadas por terceiros, essa assimetria desaparecerá em grande parte. Eles também estarão competindo contra essa terceira parte e seu respectivo modelo de incerteza epistêmica. Se a incerteza epistêmica desse terceiro for pequena e o financiador e o intermediário tiverem modelos igualmente incertos, os dois perderão o equivalente à margem estabelecida pelo terceiro. 

O mundo real das apostas

Todas essas conclusões dependem de uma suposição importante e provavelmente irrealista. Supõe-se que os modelos da casa de apostas e do apostador são completamente independentes um do outro. Na realidade, é improvável que seja esse o caso, pois os modeladores tendem a usar dados e algoritmos de previsão semelhantes. 

Se a casa de apostas demorar muito na avaliação das probabilidades reais, haverá uma boa chance de o apostador também demorar e vice-versa. Alguns apostadores também podem estar parcialmente ancorados ao preço da casa de apostas.

Qualquer correlação de modelo entre a casa de apostas e o apostador reduzirá o valor esperado do apostador e dificultará o seu sucesso.

Não obstante, este modelo de incerteza epistêmica oferece uma pista de quão boa deve ser uma casa de apostas para permanecer lucrativa, mesmo com as margens ao seu favor. Como as casas de apostas não conseguem retrair as probabilidades depois que o apostador as aceita, elas devem ter certeza de que reduziram sua incerteza epistêmica ao mínimo.

Nós nunca podemos saber quais probabilidades a casa de apostas realmente acredita serem "verdadeiras" nos seus mercados. Também não podemos saber quais são as verdadeiras probabilidades reais dessas estimativas. Portanto, não podemos determinar com precisão que incerteza epistêmica existe.

No entanto, poderemos oferecer um palpite se assumirmos que as probabilidades de fechamento de uma casa de apostas (sem as margens) representam as verdadeiras probabilidades reais. Então, a diferença entre as probabilidades de pré-fechamento e fechamento fornecerá uma medida da quantidade de erros do modelo.

Tomando um conjunto acima/abaixo de probabilidades de pré-fechamento e fechamento da Pinnacle para os jogos da temporada mais recente do futebol inglês, removendo a margem e padronizando as chances de fechamento para 2,00, o desvio padrão na probabilidade de vitória assumido pelas chances de fechamento será de um pouco mais de 2%. Isso corresponde ao valor inferior dos meus desvios padrão modelados e revela novamente que o modelo da Pinnacle é bastante eficaz em minimizar a incerteza epistêmica.

Para vencer, os apostadores precisam ser pelo menos tão bons quanto a casa de apostas, com a assimetria pendendo para o seu lado. Se o erro epistêmico da Pinnacle nos confrontos com 50% de probabilidade de vitória for de apenas 2%, não haverá muito espaço para melhorias por parte do apostador. Obviamente, os apostadores podem potencializar as coisas a seu favor aplicando limites mínimos de valor esperado antes de apostar contra a Pinnacle. Mas qualquer correlação de modelo tornará a tarefa mais difícil.

Mais uma vez, mostramos que vencer uma casa de apostas, especialmente a Pinnacle, não é uma tarefa fácil. E agora temos outra razão para isso. Como intermediária das probabilidades, ela não tem o benefício, como seus clientes, de escolher o que pode ser uma boa aposta. Ela tem que mergulhar de cabeça nas probabilidades todas as vezes e torcer para acertar. Para a Pinnacle, minimizar a incerteza epistêmica e maximizar a eficiência das probabilidades é o nome do jogo.

Recursos de apostas - Capacitar as suas apostas

Os Recursos de apostas da Pinnacle são um dos conjuntos mais abrangentes de conselhos de especialistas sobre apostas que se podem encontrar online. Dar resposta a todos os níveis de experiência - o nosso objetivo é simplesmente capacitar os apostadores a obterem mais conhecimentos.