Serveprocent |
Lina |
Under |
Över |
50 % |
19,5 |
1,99 |
2,01 |
54 % |
20,5 |
1,90 |
2,11 |
58 % |
20,5 |
2,05 |
1,95 |
62 % |
21,5 |
2,06 |
1,95 |
66 % |
22,5 |
2,00 |
2,00 |
70 % |
23,5 |
1,96 |
2,04 |
72 % |
25,5 |
2,02 |
1,98 |
I en tidigare artikel visade Jonathon Brycki hur momentum kan spela en avgörande roll i tennismatcher. I den här artikeln utvecklar han en mer avancerad version av modellen för att analysera momentum-effekten både mellan set och under hela matcher på olika oddsmarknader. Läs vidare för att få reda på mer.
Momentum-modellens styrkor och svagheter
I del ett av den här artikeln förklarade jag hur man kan modellera momentum mellan set i tennismatcher med hjälp av serveprocent. Det jag kom fram till var att det inte räckte att bara uppdatera serveprocent-förväntningarna i slutet av varje set. Det var inte tillräckligt dynamiskt, och modellen var begränsad eftersom den inte kunde uppskatta rättvisa odds för totaler eller handikapp.
I den här artikeln går jag igenom en förnyad version av modellen som bättre speglar momentum både under och mellan set.
I del ett påvisade jag att tennisspelare som vunnit första set har större genomsnittlig sannolikhet att vinna även det andra. Det första steget mot att bygga en mer dynamisk modell är att undersöka hur segermarginalen i första set påverkar sannolikheten för vem som vinner andra set och med hur mycket.
Att mäta momentum från första till andra set
Diagrammet nedan visar gem-segermarginalen för spelaren som vunnit första set i förhållande till hur ofta samma spelare vinner set två. Exempel: spelare som har 71–80 % implicit sannolikhet att vinna hela matchen och som vinner första set med 6–1 eller 6–0 vinner andra set i 83 % av fallen.
Det tycks finnas ett klart positivt förhållande mellan segermarginalen i första set och utfallet av det andra. Förhållandet är emellertid inte tillförlitligt för matcher där en av spelarna har under 20 % implicit vinstsannolikhet, men sådana matcher är sällsynta. Vi kan nysta i det här ytterligare och jämföra segermarginalen i set ett med segermarginalen i set två.
Återigen observeras en momentum-effekt. En större segermarginal i set ett leder i regel till en större segermarginal i set två. Utifrån dessa fynd uppdaterade jag den genomsnittliga serveprocent-förändringen som krävs i set två. Det gjorde jag på samma sätt som i del ett av den här artikeln.
Nu vet vi hur många serveprocent-uppdateringar som krävs i set två (när man känner till segermarginalen i set ett), men vi vill kunna uppdatera dem mer dynamiskt – efter varje gem eller helst efter varje poäng. Nästa steg är att avgöra vilka inkrementella uppdateringar som behöver göras under ett pågående set.
För att avgöra förhållandet (och således hur stor skalning som krävs) mellan serveprocent och setställning simulerade jag 30 000 matcher och kalkylerade skillnaden i serveprocent för olika resultat.
Min idé är att modifiera spelarnas serveprocent efter varje gem för att spegla hur momentum utvecklas under hela set. Min beräkning för dessa uppdateringar utgår både från aktuell ställning (inklusive antalet break) och spelarnas observerade serveprocent.
Dessa två variablers prediktiva kraft överlappar varandra en aning. Men i vissa fall kan en av dem vara prediktiv medan den andra inte är det. Om vi till exempel jämför ställningarna 3–3 och 4–2 i en match mellan två jämnstarka motståndare kan båda spelarnas serveprocent vara identiska, men trots det har spelaren som leder med 4–2 större sannolikhet att vinna setet (och därmed även nästa set). På samma sätt kan det stå 3–3 trots olika serveprocent.
För att fastställa hur stor andel serveprocent-uppdateringar som ska tillämpas efter varje gem utgick jag från varje spelares sannolikhet att vinna setet. Sannolikheten är uppskattad utifrån 30 000 simuleringar. Diagrammet nedan plottar dessa data för en match mellan två jämnstarka spelare. Exempel: om ett break inträffar efter sex gem (och det då står 4–2) har spelaren som leder 88 % sannolikhet att vinna setet. Min modell tilldelar därför den spelaren 88 % av de tillämpliga serveprocent-justeringarna i det skedet av matchen.
Justeringarna skalas dessutom utifrån observerad relativ servestyrka efter varje gem. Relativ servestyrka är skillnaden i servestyrka mellan spelare 1 och spelare 2.
För att avgöra förhållandet (och således hur stor skalning som krävs) mellan serveprocent och setställning simulerade jag 30 000 matcher och kalkylerade skillnaden i serveprocent för olika resultat. Exempel: för set som slutat 6–4 eller 7–5 var den genomsnittliga skillnaden i serveprocent +9 % för vinnaren.
Genom att använda ovanstående beräkningar till att dynamiskt fördela serveprocent-uppdateringar efter varje gem kan vi simulera modellen och jämföra den med faktiska resultat i ATP-matcher. Diagrammet nedan plottar 30 000 simuleringar av modellen för alla ATP-matcher sedan 2010 där varje spelares implicita sannolikhet att vinna matchen låg på 40–60 %.
Den här modellen tycks vara bättre än modellen i del ett av den här artikeln. Men den uppvisar fortfarande underskattning när antalet gem är 18 eller färre. Det tyder på att modellen behöver anpassa sig till ojämna matcher ännu snabbare.
På grund av tennisens set-baserade poängsystem kan en spelare som ligger under med ett eller två break i ett set ibland "ge upp" det setet för att spara kraft och koncentration till nästa set. För att kunna spegla det (och kortsiktigt momentum i allmänhet) misstänker jag att modellen behöver inkludera en momentum-faktor under pågående set, utöver uppdateringarna mellan set.
Utan data för varje gem fick jag förlita mig på simulationer för att komma fram till den faktorns storlek. Det jag fann var att modellen behöver anpassa sig mycket snabbt till momentum-förändringar under pågående set.
Mängden serveprocent-uppdateringar som krävs under set är nästan dubbelt så stor som mellan set. Genom att återigen simulera modellen 30 000 gånger ser vi att den nya momentum-faktorn under pågående set ökar träffsäkerheten.
Serveprocentens roll när man spelar på matchtotaler
Nu kan vi använda modellen till att uppskatta rättvisa odds för matchtotaler. Låt oss börja med att undersöka hur en oddsmarknad för totalt antal gem i en match mellan två jämnstarka spelare förändras när vi justerar serveprocenten. I diagrammet nedan simulerade jag 10 000 matcher för varje serveprocent i förhållande till en oddsmarknad utan marginaler.
När spelarnas inledande serveprocent ökar från 50 % till 72 % ökar poängen på hela serien från 19,5 till 25,5.
Med serveprocent på över 72 % blir minst 26 gem (två tiebreak-set) favoriten. Bland topp 50-spelarna på herrsidan har Isner och Federer högst serveprocent – de vinner omkring 72 % av sina servepoäng.
Det finns bara några få potentiella herrmatcher som skulle rättfärdiga en matchtotal på 25,5. Det skulle vara matcher mellan två jämnstarka spelare som båda är bra på att serva och dåliga på att returnera. Vad händer med de marknaderna om en av spelarna är favorit med oddset 1,50?
Serveprocentens roll när man handikappspelar
Låt oss nu titta på matchhandikapp. Genom att variera favoritens och underdogens serveprocent kring ATP-genomsnittet på 64 % kan vi undersöka matchoddsens förhållande till handikapplinan.
När vi jämför dessa siffror med Pinnacles tennismarknader märker vi att modellen är tämligen välkalibrerad. Det sista steget mot att bedöma rättvisa odds för enskilda matcher är att förutspå individuella spelares serveprocent och justera för spelarspecifika biaser. Det kan till exempel röra sig om att justera momentum-faktorerna för att spegla en viss spelares spelmönster. Jag har redan gått igenom ett antal av dem i en annan artikel.
Genom att inkludera två dynamiska momentum-variabler i min ATP-tennismodell får vi en välkalibrerad modell som kan användas till att bedöma rättvisa odds på marknader för gem, set, match, totaler och handikapp utifrån serveprocent.
Ett ytterligare steg kan vara att inkludera poängspecifika biaser och/eller spelarbiaser. Kan det till exempel vara så att en servande spelare som är under press att hålla sig kvar i setet vid ställningen *4–5 eller *5–6 har mindre chans att hålla sin serve? Med ett par sådana tillskott kan modellen enkelt expanderas till att fungera för liveodds.