Percentagem de serviço |
Probabilidade |
Menos de |
Mais de |
50% |
19,5 |
1,99 |
2,01 |
54% |
20,5 |
1,90 |
2,11 |
58% |
20,5 |
2,05 |
1,95 |
62% |
21,5 |
2,06 |
1,95 |
66% |
22,5 |
2,00 |
2,00 |
70% |
23,5 |
1,96 |
2,04 |
72% |
25,5 |
2,02 |
1,98 |
Num artigo anterior, Jonathon Brycki mostrou como a dinâmica no ténis pode causar um impacto no resultado de uma partida. Neste artigo, explica como desenvolveu uma versão aperfeiçoada do seu modelo para analisar este impacto tanto entre sets como ao longo de toda a partida em diversos mercados de apostas. Continue a ler para saber mais.
Compreender os pontos fortes e os pontos fracos do modelo
Na primeira parte deste artigo, expliquei uma abordagem para modelar a dinâmica entre sets numa partida de ténis utilizando as percentagens de serviço. Ao fazê-lo, demonstrou-se que atualizar as expetativas da percentagem de serviço apenas no final de cada set não era suficientemente dinâmico. Por este motivo, o modelo era limitado pelo facto de não conseguir avaliar os totais e os handicaps.
Agora, na segunda parte, irei debater uma atualização ao modelo que melhor reflete a dinâmica tanto dentro do próprio set como entre sets durante uma partida de ténis.
Na primeira parte, mostrei que um tenista tem mais probabilidade, em média, de ganhar o segundo set se tiver ganho o primeiro. O primeiro passo na criação de um modelo mais dinâmico é compreender como a margem de vitória no primeiro set está relacionada com o vencedor do segundo set e com a margem de vitória nesse segundo set.
Medir o impacto da dinâmica do primeiro set sobre o segundo set
O gráfico abaixo representa a margem de vitória do vencedor do primeiro set (em jogos no primeiro set) sobre a sua percentagem (%) de vitória do segundo set. Por exemplo, os jogadores com possibilidades implícitas de vencer o jogo de 71-80% que ganharam o primeiro set por cinco ou seis jogos (6-1 ou 6-0), ganham o segundo set em 83% das vezes.
Parece haver uma relação positiva clara entre a margem de vitória no primeiro set e o resultado do segundo. Essa relação quebra-se para os tenistas com muito pouco favoritismo (<20% de possibilidade implícita), embora tenha havido significativamente menos jogos neste intervalo. Podemos aprofundar a análise deste resultado um pouco mais e comparar a margem de vitória no primeiro set com a margem de vitória no segundo set.
Uma vez mais, observa-se um efeito de dinâmica. Em média, uma margem de vitória mais ampla no primeiro set dá origem a uma margem de vitória no segundo set. Com estes resultados, atualizei a alteração média da percentagem de serviço necessária para o segundo set de uma forma idêntica à que foi mostrada na primeira parte deste artigo.
Portanto, sabemos agora a magnitude das atualizações da percentagem de serviço do segundo set necessárias depois do primeiro set (conhecendo a margem de vitória); no entanto, queremos atualizá-las de forma mais dinâmica - após cada jogo ou, em termos ideais, após cada ponto. O passo seguinte passa por determinar que atualizações incrementais fazer durante o set.
Para determinar a relação (e, assim, a magnitude da escala necessária) entre as percentagens de serviço e os resultados dos sets, simulei 30 000 partidas e calculei a diferença nas percentagens de serviço para os diferentes resultados.
Propus modificar as percentagens de serviço dos tenistas após cada jogo para refletir a dinâmica set a set. O meu cálculo para estas atualizações utiliza tanto o resultado (integrando o número de quebras de serviço) e as percentagens de serviço dos tenistas observadas.
Os poderes preditivos destas duas variáveis irão coincidir um pouco. Contudo, em alguns casos, uma variável poderá disponibilizar um sinal que a outra não disponibiliza. Por exemplo, numa partida equilibrada em termos de favoritismo, se compararmos os resultados de 3-3 e 4-2, as percentagens de serviço dos tenistas podem ser idênticas em ambas as partidas e, todavia, o tenista que lidera por 4-2 terá mais probabilidades de ganhar o set (e, assim, o set seguinte também). Da mesma forma, a 3-3, poderá haver uma diferença nas percentagens de serviço, apesar do resultado empatado.
Para determinar a proporção de atualizações da percentagem de serviço a aplicar após cada jogo, eu utilizo a possibilidade de cada tenista ganhar o set, estimada a partir de 30 000 simulações. O gráfico abaixo representa isto para uma partida equilibrada em termos de favoritismo. Por exemplo, depois de seis jogos, se houver uma quebra de serviço (um resultado de 4-2), espera-se que o tenista que está à frente ganhe o set com uma probabilidade de 88%. O meu modelo atribui a esse tenista 88% do ajuste da percentagem de serviço aplicável nesse momento da partida.
Os ajustes também são ampliados com base na força de serviço relativa observada após cada jogo. A força de serviço relativa é a diferença entre as percentagens de serviço observadas do Tenista 1 e do Tenista 2.
Para determinar a relação (e, assim, a magnitude da escala necessária) entre as percentagens de serviço e os resultados dos sets, simulei 30 000 partidas e calculei a diferença nas percentagens de serviço para os diferentes resultados. Por exemplo, para sets concluídos com uma diferença de dois jogos (6-4 ou 7-5), a diferença média na percentagem de serviço foi de +9% para o vencedor.
Utilizando os cálculos acima para distribuir as atualizações da percentagem de serviço de forma dinâmica após cada jogo ao longo de uma partida, podemos agora simular o nosso modelo e compará-lo aos resultados concretos nas partidas da ATP. O gráfico abaixo representa 30 000 simulações do modelo face a todas as partidas da ATP desde 2010 no intervalo de possibilidade implícita (do vencedor da partida) de 40-60%.
O modelo parece ter melhorado em relação ao modelo inicial apresentado na primeira parte deste artigo. No entanto, ainda subestima os totais do jogo de 18 ou menos. Tal sugere que o modelo ainda precisa de ser mais rápido a fazer ajustes em partidas onde há um grande favorito.
Devido aos resultados baseados nos sets do ténis, um tenista por trás de uma quebra ou duas de serviço num set pode perder o interesse e/ou querer poupar a energia e a concentração para o set seguinte. Para refletir este aspeto (além da dinâmica de curto prazo, em termos mais gerais), suspeito que preciso de incluir um fator de dinâmica “durante o set” para complementar as atualizações “entre sets” acima.
Sem dados relativos a cada jogo, descobri a magnitude deste fator através das simulações. Aprendi que o modelo precisava de se ajustar muito rapidamente ao desempenho “durante o set”.
A magnitude das atualizações das percentagens de serviço necessárias era quase o dobro da da variável “entre sets”. Fazendo simulações do modelo mais outras 30 000 vezes, podemos ver que a inclusão de um fator de dinâmica “durante o set” aumenta a sua exatidão.
Percentagem de serviço e apostas nos totais da partida
Podemos agora utilizar este modelo para atribuir um preço aos totais da partida. Em primeiro lugar, vejamos como um mercado de total de jogos mudaria numa partida equilibrada em termos de favoritismo, à medida que alteramos as percentagens de serviço. Na tabela abaixo, simulei 10 000 partidas para cada percentagem de serviço e estruturei um mercado sem margens.
À medida que as percentagens de serviço iniciais dos tenistas aumentam de 50% para 72%, a probabilidade para o total de jogos aumenta de 19,5 para 25,5.
Com percentagens de serviço superiores a 72% e, pelo menos 26 jogos (dois sets com “tie break”), esse jogador passa a ser o favorito. Para contextualizar a situação, os tenistas com a maior percentagem de serviço no top 50 da ATP são Isner e Federer, sendo que ambos ganham cerca de 72% dos pontos no serviço.
Só há alguns duelos no torneio da ATP que justificariam uma probabilidade no total da partida de 25,5. O duelo seria entre dois tenistas com um grande serviço, com um favoritismo semelhante, mas com uma fraca capacidade em devolver a bola. O que acontece a esses mercados se, em vez de uma partida equilibrada em termos de favoritismo, houver um favorito com probabilidades de 1,50?
Percentagem de serviço e apostas nos handicaps
Em seguida, consideremos os handicaps da partida. Variando as percentagens de serviço do tenista favorito e do menos favorito em torno da percentagem de serviço média da ATP de 64%, podemos analisar de que forma as probabilidades da partida se relacionam com a probabilidade do handicap no jogo.
Se fizermos uma análise cruzada destes dados com os mercados de ténis da Pinnacle, podemos ver que o modelo está bastante bem calibrado. Com o objetivo de atribuir um preço às partidas individualmente, o passo final seria prever as percentagens de serviço individuais dos tenistas e ajustar quanto a vieses específicos do tenista. Tal poderá incluir ajustar os fatores de dinâmica para refletir os padrões de um determinado tenista. Abordei vários deles noutro artigo anterior.
O resultado de incluir duas variáveis dinâmicas no meu modelo de ténis da ATP é um modelo bem calibrado que pode agora ser utilizado para atribuir um preço aos mercados do jogo, do set, da partida, do total e do handicap a partir das percentagens de serviço.
Outro passo poderia ser incluir vieses do jogador e/ou específicos do resultado. Por exemplo, quando serve sob pressão para continuar num set com um resultado de, digamos, *4-5 ou *5-6, será menor a probabilidade de um tenista em manter o serviço? Com alguns acréscimos deste género, o modelo poderia facilmente ser ampliado para ser utilizado em tempo real.