wrz 19, 2017
wrz 19, 2017

Pułapki systemów obstawiania: korelacja a przyczynowość

Systemy obstawiania zakładów sportowych: Co to jest analiza regresji?

Przewidywanie wyników zakładów przy użyciu systemów

Pułapki analizy regresji

Pułapki systemów obstawiania: korelacja a przyczynowość

System obstawiania stanowi podstawowe narzędzie każdego gracza, który chce uzyskiwać długoterminowe zyski z zakładów. Jednak obstawiający często mylą rozwiązania do zarządzania finansami z systemami obstawiania. W kwestii uzyskiwanych wyników mylą też korelację z przyczynowością. Co to jest system obstawiania i jak poznać różnicę między korelacją i przyczynowością? Czytaj dalej, jeśli chcesz dowiedzieć się więcej.

Co to jest system obstawiania?

W odróżnieniu od metody wyboru stawek lub strategii zarządzania pieniędzmi, które sugerują wysokość kwot stawianych w zakładach, system obstawiania stanowi ustrukturyzowaną metodologię prognozowania na podstawie ilościowej analizy historycznych danych w celu uzyskiwania wygranych przekraczających marże bukmachera i identyfikowania dodatniej wartości oczekiwanej.

Gracze często mylą narzędzia do zarządzania finansami z systemami obstawiania. Wystarczy wyszukać w Google „system obstawiania”, aby w większości przypadków uzyskać wyniki dotyczące strategii Martingale, Labouchere'a lub Fibonacciego — jednak to są zupełnie inne rzeczy.

Zarządzanie pieniędzmi pozwala tylko zmienić charakter ryzyka związanego z zakładami. Nie umożliwia jednak przekształcenia nieskutecznej metody prognozowania w taką, która zapewni długoterminowe zyski. Natomiast system obstawiania próbuje zidentyfikować „rzeczywiste” prawdopodobieństwo wystąpienia określonych zdarzeń podczas współzawodnictwa sportowego.

Systemy obstawiania zakładów sportowych: analiza regresji

Najpopularniejszą metodą projektowania systemów obstawiania w zakładach sportowych jest statystyczna analiza regresji. Osobom, które nie znają terminologii statystycznej, ta nazwa może wydać się odstraszająca, ale w rzeczywistości to nic skomplikowanego — jest to metoda szacowania relacji między zmiennymi.

Chociaż analiza regresji stanowi przydatne narzędzie do projektowania systemów obstawiania, to za jej pomocą nie można odróżnić korelacji od przyczynowości. Jest to jej słabością.

Prostym przykładem zastosowania tej metody jest liniowa analiza regresji dwóch zmiennych, na przykład liczby bramek zdobytych przez drużynę (czynnik lub inaczej wartość niezależna) i częstotliwości wygranych meczów (rezultat lub inaczej wartość zależna). 

W mojej pierwszej książce Fixed Odds Sports Betting: Statistical Forecasting & Risk Management (Zakłady sportowe ze stałymi kursami: prognozy statystyczne i zarządzanie ryzykiem) omówiłem prosty model analizy regresji na podstawie względnej przewagi bramkowej dwóch drużyn w 6 ostatnich meczach.

Korzystając z dużej próby danych statystycznych na temat drużyn (w tym przypadku są to dane z 8 lat: od 1993 do 2001 roku), można przygotować wykres zestawiający korelację obliczonych ocen meczu (różnica bramek po stronie gospodarzy w ciągu 6 spotkań minus różnica bramek gości w tym samym okresie) z częstotliwością wystąpienia każdego wyniku. Poniżej pokazany jest rozkład ocen meczu (wartość niezależna) względem częstotliwości zwycięstw gospodarzy (wartość zależna).

correlation-and-causation-inarticle.jpg

Mimo że pojedyncze punkty danych są względnie rozproszone, to widoczny jest liniowy trend łączący te dwie zmienne: im większa jest różnica zdobytych bramek w 6 ostatnich meczach przez drużynę gospodarzy względem gości, tym większe są szanse na zwycięstwo właśnie gospodarzy.

Linia regresji przedstawiona na wykresie reprezentuje wyidealizowany związek między względną przewagą bramkową i częstotliwością wygrywania na własnym boisku. Nie są przy tym brane pod uwagę okoliczności losowe, takie jak szczęście czy przypadek.

Tę linię możemy przedstawić w formie równania. Prosty model regresji liniowej ma postać y = mx +c, gdzie „y” jest zmienną zależną (prawdopodobieństwo wygranej), „x” to zmienna niezależna, „m” to ocena meczu, która określa nachylenie linii trendu (i wskaźnik siły zależności), natomiast „c” to stała lub punkt, w którym linia przecina oś Y (np. x = 0). W tym przykładzie równanie zawiera te wartości:

Procentowa szansa wygranej gospodarzy = (1,56 x ocena meczu) + 46,5

Gdy ocena meczu wynosi zero (czyli różnica bramek jest mniej więcej taka sama dla obu drużyn), prawdopodobieństwo wygranej wynosi 46,5%. W rzeczywistości 46% meczów piłkarskich kończy się wygraną drużyny gospodarzy, więc obliczona prognoza wydaje się wiarygodna. Jeśli w ostatnich 6 spotkaniach różnica bramkowa zespołu grającego u siebie jest większa o ponad dziesięć względem przeciwnika, model regresji wskazuje prawdopodobieństwo wygranej gospodarzy na poziomie 62%. W przypadku 20-punktowej przewagi ta wartość wzrasta do 78%. 

Ta analiza regresji może też pokazać sposób, w jaki zmienność częstotliwości wygranych jest odzwierciedlana przez model systemu obstawiania. W tym przypadku jest to 86%. Pokazuje to zgodność linii trendu z danymi. Dzięki temu możemy stwierdzić, że między dwoma podanymi zmiennymi istnieje silna korelacja.

Przewidywanie wyników zakładów przy użyciu systemów

Aby przekształcić model regresji w działający system obstawiania, musimy przygotować prognozę dla przyszłych meczów i użyć jej do wskazania zakładów mających dodatnią wartość oczekiwaną.

Zarządzanie pieniędzmi pozwala tylko zmienić charakter ryzyka związanego z zakładami. Nie umożliwia jednak przekształcenia nieskutecznej metody prognozowania w taką, która zapewni długoterminowe zyski.

Jak w większości metodologii modelowania, standardowym założeniem jest to, że kluczem do przyszłości jest przeszłość. Jeśli wcześniejsze mecze z oceną 10 lub większą w 62% przypadków kończyły się zwycięstwem gospodarzy, to możemy założyć, że drużyna gospodarzy mająca 10-punktową przewagę różnicy bramek nad przeciwnikiem ma 62% szans na wygraną. 

W ten sposób możemy pokazać „rzeczywiste” szanse na podstawie prognoz, co pozwala nam określić oczekiwaną wartość w przypadku zakładów u bukmacherów oferujących kursy długoterminowe. Zastosowanie tego modelu do angielskiej ligi piłkarskiej w sezonie 2001/2002 zapewniło mi zyski o +2,1% większe w stosunku do przychodów w 526 zakładach z najlepszymi kursami na drużyny gospodarzy. Dla porównania stawiając zakłady na zwycięstwo gospodarzy we wszystkich spotkaniach, zanotowałbym -3,7% strat.

Korelacja a przyczynowość 

Jednak dobre wyniki w ponad 500 zakładach na mecze jednego sezonu nie stanowią gwarancji zysków w kolejnych latach. Może się wydawać, że te wartości potwierdzają skuteczność opisanego systemu obstawiania, ale stali czytelnicy naszego działu wiedzą, że wcale tak nie jest.

Artykuł w Pinnacle na temat prawa małych liczb stanowi przypomnienie, że nawet w próbach 1000 zakładów możemy znaleźć pozorne wzorce zyskowności, które w rzeczywistości nie mają żadnych przyczynowych podstaw i są jedynie dziełem przypadku. W kolejnych pięciu sezonach ten model obstawiania przyniósł jednak straty.

Prosty model analizy regresji sprawdził się przy przewidywaniu zwycięstw gospodarzy w poszczególnych meczach. Nie zapewnił jednak gwarancji zidentyfikowania drużyn, których prawdopodobieństwo zwycięstwa było większe niż sugerowałyby kursy oferowane przez bukmachera.

Niestety wielu obstawiających błędnie interpretuje precyzję, skuteczność i istotność podczas analizowania swojej historii zakładów, myląc w rezultacie korelację z przyczynowością.

Mój model pozwalał całkiem dobrze prognozować wyniki, ale okazało się, że nie był lepszy od metod przewidywania używanych przez bukmacherów do określania kursów ani od narzędzi używanych przez innych obstawiających, których zakłady miały wpływ na te kursy.

W rzeczywistości mój model tylko powielał wyniki metod bukmacherów. Nie zapewniał on stałych zysków. Większe wygrane były uzależnione tylko od szczęścia. Wygląda na to, że jego działanie nie bazowało na rzeczywistej korelacji. Prognozy mojego modelu nie były „przyczyną” zysków, bo nie były dokładniejsze od innych modeli używanych w tym samym celu.

Precyzja a skuteczność

Oczywiście model analizy regresji liniowej dwóch zmiennych nie jest wyrafinowanym systemem obstawiania ani identyfikowania wartości oczekiwanej. Aby spróbować zwiększyć precyzję prognoz, możemy zastosować wielokrotną regresję, w której używanych jest więcej wartości niezależnych. Jednocześnie musimy uważać, aby nowa metoda nie wiązała się ze zmniejszeniem skuteczności.

Precyzyjny model to taki, w którym pomiary są zbliżone do siebie, jak na przykład pokazuje trend w moim prostym modelu regresji liniowej. Jednak precyzja nie gwarantuje skuteczności. Skuteczność pokazuje, jak blisko nasze przewidywania odzwierciedlają „rzeczywistą” wartość. Precyzja jest powiązana z losowymi błędami, natomiast skuteczność dotyczy błędów systemowych (nazywanych też tendencyjnością). 

Dobry system obstawiania jest zarówno precyzyjny, jak i skuteczny, co z kolei pozwala stale identyfikować wartość oczekiwaną zapewniającą zyski. Umożliwia nam wiarygodną ocenę, czy sytuacja, która naszym zdaniem może wywołać określoną reakcję, w rzeczywistości jest taką przyczyną oraz czy nasze wyniki regularnie prowadzą do pożądanych rezultatów.

Niestety wielu obstawiających błędnie interpretuje precyzję, skuteczność i istotność podczas analizowania swojej historii zakładów, myląc w rezultacie korelację z przyczynowością. Ich błąd polega na założeniu, że „przyczyną” osiągniętych zysków jest działanie systemu obstawiania, gdy w rzeczywistości zwykle jest to tylko kwestia szczęścia.

Pułapki analizy regresji

Chociaż analiza regresji stanowi przydatne narzędzie do projektowania systemów obstawiania, to za jej pomocą nie można odróżnić korelacji od przyczynowości. Jest to jej słabością. Ta metoda pozwala identyfikować związki między zmiennymi, na przykład między liczbą zdobytych i straconych bramek a prawdopodobieństwem wygrania meczu. To jednak nie pokazuje, czy jedno jest przyczyną drugiego.

Analiza regresji może wskazać, że gdy Barcelona przegrywa, to w takim meczu Lionel Messi zwykle nie zdobywa gola. Jednak to nie stanowi potwierdzenia, że przyczyną przegranej jest brak bramek ze strony tego zawodnika.

Bez uwzględnienia przyczynowości i istotności faktów w systemie obstawiania nie możemy powiedzieć, że nasze rozwiązanie jest lepsze od modeli prognozowania używanych przez innych. W zakładach sportowych liczy się zdobycie przewagi nad innymi. Oznacza to, że nie osiągamy sukcesu za samo przewidywanie wyników, ale za zrobienie tego lepiej niż wszyscy pozostali.

Przydatne informacje o zakładach — pomoc dla obstawiających

Dział przydatnych informacji o zakładach to jeden z najobszerniejszych zbiorów materiałów z poradami ekspertów, jaki został udostępniony online. Materiały przeznaczone są dla osób o wszystkich poziomach doświadczenia. Przede wszystkim staramy się pomóc osobom obstawiającym w podejmowaniu świadomych decyzji.