För att kunna gå med långsiktig vinst på odds är det mycket viktigt att ha ett spelsystem. En vanlig missuppfattning bland folk som spelar på odds är att förväxla pengahantering med spelsystem samt att förväxla korrelation med kausalitet i fråga om resultat. Vad är egentligen ett spelsystem och hur kan du se skillnad mellan korrelation och kausalitet? Läs vidare för att få reda på det.
Vad är ett spelsystem?
I motsats till en insatsmetod eller en strategi för pengahantering som går ut på att bedöma rätt insatsstorlek är ett spelsystem en strukturerad förutsägelsemetodik byggd på en kvantitativ analys av historiska data utformad för att övervinna spelbolagens vinstmarginaler och hitta positiva väntevärden.
- Ta reda på hur man beräknar spelmarginaler
Ofta förväxlas pengahanteringssystem med spelsystem – om du söker efter det sistnämnda på Google hittar du främst strategier som Martingale, Labouchere eller Fibonacci som i själva verket inte alls är spelsystem.
Pengahanteringssystem går helt enkelt ut på att förskjuta riskerna genom att manipulera insatsstorlekarna när du spelar. Sådana system kan dock inte förvandla en förlorande förutsägelsemetod till en vinnande på lång sikt. Målet med ett spelsystem är att identifiera de "sanna" sannolikheterna för olika möjliga utfall inom sport.
Spelsystem för sportodds: Regressionsanalys
Den vanligaste metoden för att utforma ett spelsystem är statistisk regressionsanalys. Om man inte är bekant med statistisk jargong kan begreppet låta avskräckande krångligt, men det är egentligen bara en metod för att beräkna förhållandet mellan olika variabler.
Även om regressionsanalys är ett användbart verktyg för att utforma ett spelsystem är dess underliggande svaghet oförmågan att skilja mellan korrelation och kausalitet.
Den enklaste av dessa är simpel linjär regression där endast två variabler beaktas – till exempel antalet mål som ett lag gör (förutsägelsevariabeln eller den oberoende variabeln) och lagets matchsegerfrekvens (svarsvariabeln eller den beroende variabeln).
I min första bok Fast Odds Sports Betting: Statistical Forecasting & Risk Management gick jag igenom en enkel regressionsmodell baserad på den relativa målöverlägsenheten mellan två lag under deras sex senaste matcher.
Genom att använda ett stort matchurval (i detta fall under åtta säsonger från 1993 till 2001) kan man plotta ett diagram som korrelerar de beräknade matchvärdena (hemmalagets målskillnad minus bortalagets målskillnad under de sex senaste matcherna) med frekvensen för varje matchresultat. Fördelningen av matchvärdet (den oberoende variabeln) kontra hemmasegerfrekvensen (den beroende variabeln) visas nedan.
Även om de enskilda datapunkterna i diagrammet är något spridda finns det en uppenbar linjär trend hos variablerna: ju bättre målskillnad hemmalaget har i förhållande till bortalaget under de sex senaste matcherna desto troligare är det att hemmalaget vinner matchen.
Man kan säga att den regressionslinje som ritats på diagrammet representerar ett idealiserat förhållande mellan relativ målöverlägsenhet och hemmasegerfrekvens utan slump (tur och otur har räknats bort).
Vi kan beskriva ovan nämnda linje med hjälp av en ekvation. Eftersom den är en enkel linjär regressionsmodell har den formeln y = mx +c, där y är den beroende variabeln (segersannolikheten), x är den oberoende variabeln, matchvärdet m är gradienten av trendlinjen (och ett mått på förhållandets styrka) och c är konstanten eller punkten vid vilken linjen korsar y-axeln (det vill säga x = 0). I detta exempel ges ekvationen av:
Hemmasegerprocent = (1,56 x matchvärde) + 46,5
När matchvärdet är noll (det vill säga att hemma- och bortalaget har mer eller mindre samma målskillnad) är sannolikheten 46,5 %. Detta förefaller intuitivt logiskt eftersom ungefär 46 % av fotbollsmatcher slutar med hemmaseger. Om hemmalagets nettomålskillnad överstiger bortalagets med 10 under de 6 senaste matcherna visar regressionsmodellen att sådana lag vanligtvis vinner i 62 % av fallen. Om överlägsenheten ligger på 20 mål stiger procentsatsen till 78 %.
Vår regressionsanalys kan också berätta hur mycket av segerfrekvensvariationen som förklaras av denna spelsystemmodell. I det här fallet var det 86 %. Detta illustreras av hur väl trendlinjen matchar datan. Därigenom får vi reda på att det finns en stark korrelation mellan de två variablerna.
Att använda ett system för spelprognoser
För att kunna göra vår regressionsmodell till ett fullt fungerande spelsystem måste vi göra förutsägelser om framtida matcher och använda dem för att identifiera spel som har ett positivt väntevärde.
Pengahanteringssystem går helt enkelt ut på att förskjuta riskerna genom att manipulera insatsstorlekarna när du spelar. Sådana system kan dock inte förvandla en förlorande förutsägelsemetod till en vinnande på lång sikt.
Som med de flesta andra modelleringsmetoder görs här ett grundläggande antagande om att dåtiden är nyckeln till framtiden. Om tidigare matcher med matchvärden på +10 slutade med hemmaseger i 62 % av fallen antar vi att ett hemmalag med en målskillnad som är 10 mål bättre än bortalaget kommer att ha 62 % sannolikhet att vinna matchen.
Vi kan därefter enkelt översätta dessa sannolikheter till de "sanna" oddsen och därmed hitta positiva väntevärden hos ett spelbolag som erbjuder högre odds. Genom att tillämpa denna modell på den engelska fotbollssäsongen 2001–2002 lyckades jag gå med +2,1 % i vinst efter 526 spel på bästa möjliga hemmasegerodds jämfört med -3,7 % i förlust om jag hade satsat blint på hemmaseger i varenda match under den säsongen.
Korrelation kontra kausalitet
Även om man går med vinst efter drygt 500 spel på en säsong är det ingen garanti för upprepad lönsamhet säsong efter säsong. Antalet kan tyckas vara tillräckligt högt för att man ska kunna vara säker på att spelsystemet är pålitligt, men regelbundna läsare av Oddsresurser vet att så inte är fallet.
Pinnacles artikel om de små talens lag är en viktig påminnelse om att till och med urvalsstorlekar så stora som 1 000 spel kan uppvisa illusoriska lönsamhetsmönster som i själva verket inte har någon grund i kausalitet utan snarare ren slump. Tyvärr hade man gått med förlust om man fortsatt använda samma spelsystem under de fem följande säsongerna.
Även om den här enkla regressionsmodellen för målskillnad lyckades identifiera vilka hemmalag som hade större chans att vinna kunde den inte konsekvent hitta lag som hade större chans att vinna än vad spelbolagens odds återspeglade.
Tyvärr förväxlar många oddsspelare korrelation med kausalitet vilket leder till misstolkningar av precision, träffsäkerhet och giltighet när de studerar sin egen spelhistorik.
Min modell må ha varit hyfsat bra på att förutsäga resultat, men den var uppenbart inte bättre på det än de modeller som spelbolagen använde sig av för att sätta sina odds. Inte heller var den bättre än andra spelares modeller som bidrog till att forma och förskjuta dessa odds.
Om min modell bara upprepar spelbolagens modeller kommer lönsamheten inte att bli långvarig utan enbart återspegla slumpen. Modellen verkar alltså inte vara byggd på någon giltig korrelation. Min modells förutsägelser orsakade inte vinsterna eftersom den inte var mer exakt än andra modeller som gjorde samma sak.
Precision kontra träffsäkerhet
Naturligtvis är en linjär regressionsmodell med två variabler knappast det mest sofistikerade spelsystemet man kan använda sig av på jakt efter positivt väntevärde. Multipel regression med fler oberoende variabler eller förutsägelsevariabler är ett sätt att öka förutsägelseprecisionen på. Man bör dock se upp så att det inte görs på bekostnad av träffsäkerheten.
I en precis modell ligger mätningarna nära varandra, till exempel på det sätt som illustreras av trendlinjen i min enkla linjära regressionsmodell ovan. Precision garanterar dock inte träffsäkerhet. Träffsäkerhet är ett mått på hur nära du är det "sanna" värdet. Precision förknippas med slumpmässiga fel medan träffsäkerhet förknippas med systematiska fel (även kallat bias).
För att ett spelsystem ska vara giltigt (det vill säga konsekvent hitta lönsamma väntevärden) måste det vara både precist och träffsäkert. Giltighet kräver både förutsägbarhet och långvarighet, det vill säga att det vi tror är orsaken faktiskt är den sanna orsaken. För att komma fram till det kan man ta hjälp av upprepade mätningar.
Tyvärr förväxlar många oddsspelare korrelation med kausalitet vilket leder till misstolkningar av precision, träffsäkerhet och giltighet när de studerar sin egen spelhistorik. De tror felaktigt att deras tidigare vinster "orsakats" av deras spelsystem trots att vinsterna i själva verket ofta uppstår på grund av tur.
Vanliga missuppfattningar om regressionsanalys
Även om regressionsanalys är ett användbart verktyg för att utforma ett spelsystem är dess underliggande svaghet oförmågan att skilja mellan korrelation och kausalitet. Regressionsanalys är en effektiv metod för att identifiera en koppling mellan olika variabler, till exempel gjorda och insläppta mål kontra sannolikheten för att vinna matcher, men regressionsanalys kan inte avgöra om en av variablerna orsakar den andra.
Regressionsanalys kan till exempel identifiera att Barcelonas förluster sammanfaller med att Lionel Messi inte gör mål. Men vi kan inte dra slutsatsen att Lionel Messis målbrist är orsaken till att Barcelona förlorar.
Utan att fastställa kausalitet och giltighet i vårt spelsystem är risken stor att det inte är bättre än de förutsägelsemodeller som används av alla andra. I sammanhang med skiftande färdighetsnivåer (till exempel sportodds) får man inte betalt för att bara förutsäga framtiden – man måste vara bättre på det än alla andra.