jan 24, 2023
jan 24, 2023

Surpresas e zebras: Quão surpreendente foi a Copa do Mundo 2022?

Quão surpreendente foi a Copa do Mundo 2022?

Probabilidade de Monte Carlo

Azarões da Copa do Mundo 2022

Surpresas e zebras: primeira parte

Surpresas e zebras: Quão surpreendente foi a Copa do Mundo 2022?

Até que ponto a Copa do Mundo 2022 foi surpreendente? A vitória do Japão sobre a Alemanha foi uma surpresa tão grande assim? Joseph Buchdahl analisa os dados para determinar se as grandes surpresas em um torneio importante são tão surpreendentes quanto se pensa.

De acordo com a empresa de metadados esportivos Gracenote, a Copa do Mundo 2022 no Catar foi dos azarões, com 15 partidas terminando em zebra (como definido pela empresa) – a maior porcentagem em 64 anos.

A Copa do Mundo do Catar foi a mais surpreendente em 64 anos

No entanto, esse número causa tanta surpresa assim? Para começo de conversa, como realmente decidimos o que constitui uma zebra?

Pois é, provavelmente todos nós acreditamos que o fato do Japão derrotar a Espanha e a Alemanha e a Argentina perder para a Arábia Saudita foi o que podemos considerar uma zebra, mas essa premissa depende do quanto são válidas nossas crenças de que Espanha, Alemanha e Argentina deveriam ter vencido esses jogos.

Podemos pensar intuitivamente que é óbvio, mas quando é impossível saber perfeitamente as verdadeiras probabilidades do resultado, devemos sempre estar atentos para o potencial de erro.

Quando um resultado de futebol parece surpreendente, é por que o azarão – corretamente chamado assim por um modelo de previsão preciso – teve sorte, ou por que o azarão, na verdade, não era um azarão e o modelo de previsão estava errado?

Filosoficamente, esse é um quebra-cabeça interessante e bastante difícil de desvendar. Aqui, estamos lidando com dois tipos de incertezas.

A incerteza ou erro na validade do modelo de previsão recebe o nome de incerteza epistêmica. Em teoria, ela pode ser reduzida com uma modelagem melhor.

O outro tipo é intrínseco e é conhecido como incerteza aleatória, mais comumente chamada de acaso, sorte ou aleatoriedade.

Essa incerteza é irredutível. Separar a incerteza epistêmica e a aleatória pode ser complicado. Nos presentes artigos escritos para a Pinnacle, espero agregar mais um pouco ao assunto. No primeiro texto, tentarei investigar o fator surpresa da Copa do Mundo como um todo.

No segundo, Usando a Copa do Mundo para testar a eficiência, terei mais a dizer sobre o que as descobertas podem nos dizer com relação à precisão (ou à eficiência) das probabilidades para apostas de uma casa de apostas e a validade do seu modelo de previsão que elas usam como base.

Probabilidades múltiplas de 64 correspondências

Se estimarmos as probabilidades de cada um dos três resultados possíveis em 90 minutos para cada partida da Copa do Mundo, podemos desenvolver uma probabilidade múltipla de 64 correspondências para cada combinação possível de resultados. Mas quais probabilidades de resultados devemos usar?

É inegável que a maioria dos aspirantes a apostadores tem seus próprios métodos para calcular essas probabilidades, mas, com o intuito de economizar tempo, usarei aquelas implícitas nas probabilidades para aposta da partida final da Pinnacle, sabendo que são algumas das melhores probabilidades disponíveis.

Em várias ocasiões, discuti longamente o motivo pelo qual as probabilidades no fechamento da Pinnacle são algumas das melhores disponíveis para estimar resultados de probabilidade verdadeiros.

A Pinnacle obviamente adiciona uma margem a essas probabilidades; por isso preciso removê-la primeiro. Tenho minha própria calculadora para fazer isso.

Sendo assim, podemos usar essas múltiplas probabilidades para tentar responder à pergunta: até que ponto, coletivamente falando, os resultados da Copa do Mundo 2022 foram surpreendentes?

Falácia narrativa

Vale a pena parar um momento para perceber que é ínfima a probabilidade de não haver absolutamente nenhuma zebra nas 64 partidas da Copa do Mundo.

Existe uma chance de 11% de que todos os favoritos ganhem

Usando as probabilidades no fechamento da Pinnacle, fiz o cálculo de 6,5 x 10-17, ou um pouco mais de um em 1 quintilhão para os resultados após 90 minutos.

Se tivesse acontecido, teria sido um dos eventos mais surpreendentes da história da humanidade.

No entanto, me pergunto se as pessoas, além daquelas que usam estatísticas, teriam dado alguma atenção a isso, talvez, inclusive, comentando que isso foi a prova de uma Copa do Mundo muito chata.

Todos os outros múltiplos de 64 correspondências – e há muitos deles, três elevado a 64 ou 3.433.683.820.292.512.484.657.849.089.281, para ser preciso – têm uma probabilidade menor.

Cada um deles incluirá zebras (se definirmos uma zebra como o resultado favorito que não acontecerá) e quanto menor a probabilidade múltipla, maior o número de zebras.

Porém, só existe uma forma de não haver zebras – todos os resultados favoritos devem acontecer. Em contraste, há muitas maneiras de acontecerem zebras. Individualmente, a probabilidade múltipla de 64 correspondências das zebras pode ser menor, mas coletivamente é mais provável que ocorram do que o contrário.

Considere um exemplo binomial simples de 10 partidas com dois resultados possíveis, onde cada favorito tem 80% de probabilidade de vitória e cada azarão tem 20% de probabilidade de ganhar.

Há cerca de 11% de chance de que todos os favoritos vençam, mas 20% de chance de três azarões vencerem, e até 9% de chance de quatro azarões serem os vencedores.

Mas por que tão alto? Individualmente, as probabilidades são de apenas 0,17% e 0,04% (para qualquer conjunto específico de três ou quatro azarões, respectivamente), mas há muitas possibilidades para que elas ocorram, 120 para três azarões e 210 para quatro deles.

Essa é outra forma de dizer que as zebras devem ser esperadas. No entanto, com muita frequência, nossos cérebros estão preparados para criar histórias simples e às vezes imperfeitas a partir de dados para dar sentido à lógica que considera as zebras mais inesperadas do que elas realmente são.

Quando o Japão não vence a Espanha e a Alemanha, não criamos essas histórias, mas as estatísticas nos dizem que esses resultados surpreendentes são efetivamente uma certeza estatística. Esse é um exemplo de falácia narrativa.

Uma distribuição da probabilidade de Monte Carlo

Existe apenas uma maneira de ver um múltiplo de 64 correspondências com uma probabilidade de 6,5 x 10-17. O múltiplo menos provável com todos os azarões vencendo chega a 1,5 x 10-51, e também só há uma maneira para que isso aconteça. Mas de quantas maneiras poderíamos ver probabilidades múltiplas de, digamos, 10-25 ou 10-30?

Lidar com esse tipo de computação de forma algorítmica é muito complexo. Para simplificar muito mais as coisas, é uma boa ideia construir uma simulação de Monte Carlo.

Ao randomizar os resultados das partidas de acordo com as probabilidades definidas implícitas da Pinnacle, podemos criar uma probabilidade múltipla de 64 correspondências gerada aleatoriamente.

Repita isso um grande número de vezes, conte quantas vezes ocorre cada probabilidade definida e podemos definir a chance da distribuição de probabilidade. Ou seja, podemos definir o intervalo e a chance de possíveis históricos de resultados das 64 partidas da Copa do Mundo.

Lidar com pequenos valores de probabilidade, contudo, é intuitivamente bastante difícil. No entanto, podemos aplicar uma pequena transformação para torná-los muito mais administráveis cognitivamente: calcule o logaritmo desses valores.

O logaritmo (base 10) de 0,001, por exemplo, é -3; para 0,000001 é -6 e para 0,000000000001 é -12. Na verdade, usarei o logaritmo natural (ln) para meus propósitos (base e) e dispensarei o sinal negativo.

Minha simulação de Monte Carlo continha 100.000 execuções, para 100.000 valores do logaritmo natural de cada probabilidade múltipla aleatória de 64 correspondências (sinal negativo removido).

Colocando-os em subgrupos, eu pude traçá-los no seguinte gráfico de distribuição de frequência (ou probabilidade).

Shock-WC.png
O intervalo total no eixo x deste gráfico é de 37,3 (para a vitória de todos os 64 favoritos) a 117,1 (para a vitória de todos os azarões), mas, como sabemos, suas chances são incrivelmente pequenas.

Na verdade, só é necessário mostrar os resultados mais prováveis para ter uma ideia de qual é o intervalo de possibilidades. Observando o gráfico, podemos ver que é muito provável que um múltiplo de 64 correspondências tenha um valor no eixo x entre 45 e 75.

Este intervalo corresponde a probabilidades múltiplas de aproximadamente 3 x 10-20 e 3 x 10-33, respectivamente.

A probabilidade múltipla diminui à medida que observamos à direita, ao longo do eixo x. O resultado múltiplo médio, ou mais provavelmente observado, tem um valor no eixo x de cerca de 60, correspondendo a uma probabilidade múltipla de 7,5 x 10-27.

A localização do resultado múltiplo real da Copa do Mundo que foi observado também está ilustrada no gráfico, por meio da linha preta vertical. Ela tem um valor de eixo x de 63,5 (e uma probabilidade múltipla de 2,7 x 10-28).

Isso é cerca de 28 vezes menor do que o mais provável de resultados múltiplos.

Parece ser muito, mas o gráfico conta uma história diferente. Você pode ver que não está tão longe do centro (a média) da distribuição de probabilidade. De fato, cerca de 20% das múltiplas probabilidades possíveis da Copa do Mundo foram menores do que aquilo que realmente aconteceu.

Estatisticamente, não diríamos que isso é uma surpresa. Para que isso acontecesse, precisaríamos que a linha vertical se movesse para pelo menos 70 no eixo x, o que significa que menos de 1% dos múltiplos possíveis seriam menos prováveis. Isso corresponderia a uma probabilidade múltipla de cerca de 4 x 10-31 ou quase 700 vezes menor do que aquilo que aconteceu.

Para isso, precisaríamos ter visto algo como o Catar vencendo a Holanda, a Polônia vencendo a França e a Coreia do Sul vencendo o Brasil.

Essa foi uma Copa do Mundo surpreendente?

A partir dos dados que apresentei neste artigo, agora estamos em condições de responder à minha pergunta inicial.

Não, não foi tão surpreendente assim. Sim, houve zebras surpreendentes em jogos individuais, mas agora sabemos que elas são esperadas em torneios com muitas partidas. Na verdade, seria muito mais surpreendente se não houvesse zebras.

Porém, o que significa realmente ser surpreendente, filosoficamente falando? Isso depende muito de quais são nossas expectativas iniciais sobre os resultados das partidas.

Como um exemplo extremo, suponhamos que meu modelo de previsão tornasse o País de Gales o favorito para derrotar a Inglaterra, que Gana fosse a favorita para vencer Portugal, a Austrália fosse a favorita para vencer a França, a Costa Rica fosse a favorita para vencer a Alemanha e assim por diante em todos os 64 jogos.

Indiscutivelmente, eu ficaria muito surpreso com o que se desenrolaria. Isso aconteceria porque os azarões, como meu modelo os classificou, teriam sorte ou porque meu modelo de previsão estaria errado?

Nesse caso, é bastante óbvio, mas geralmente a distinção entre os dois cenários é muito mais sutil.

As estimativas da Pinnacle para as probabilidades de partida não captaram perfeitamente o que se desenrolou. Isso aconteceu por causa da má sorte ou por causa de um erro de modelo?

Agora é ainda mais difícil de dizer. No entanto, talvez possamos dizer que, como não há uma diferença estatisticamente significativa entre a expectativa da Pinnacle e os eventos do mundo real, temos bons motivos para argumentar que o modelo de previsão da Pinnacle não é tão ruim assim.

Em outras palavras, a Copa do Mundo (de acordo com a visão da Pinnacle) não foi uma surpresa em particular, estatisticamente falando. Era menos provável do que o resultado mais provável da Copa do Mundo (que teria talvez duas ou três zebras a menos do que realmente ocorreu), mas não tanto assim.

Se houvesse uma diferença estatisticamente significativa, seria mais fácil argumentar contra a visão da Pinnacle.

Assim, poderíamos formular uma regra: quanto maior a diferença entre expectativa e realidade, maior a chance estatística de que nosso modelo de expectativa esteja errado. Como o modelo de previsão de partidas da Copa do Mundo da Pinnacle se compara a outras casas de apostas? Esse é o tema da segunda parte desta série.

Inscreva-se na Pinnacle para receber ótimas probabilidades de futebol em uma ampla gama de mercados. Não deixe de verificar outros artigos perspicazes de Joseph Buchdahl em Recursos de apostas.

Recursos de apostas - Capacitar as suas apostas

Os Recursos de apostas da Pinnacle são um dos conjuntos mais abrangentes de conselhos de especialistas sobre apostas que se podem encontrar online. Dar resposta a todos os níveis de experiência - o nosso objetivo é simplesmente capacitar os apostadores a obterem mais conhecimentos.