lis 30, 2018
lis 30, 2018

Rozwiązywanie problemu z efektywnością: część pierwsza

Czym jest efektywność rynku?

Jak precyzyjne są kursy zamknięcia Pinnacle?

Tworzenie modelu efektywności rynkowej

Rozwiązywanie problemu z efektywnością: część pierwsza

Wszystkie osoby chcące sprawdzić, czy ich przewidywania są wystarczająco dokładne do regularnego pokonywania bukmacherów, prawdopodobnie spotkały się z wykorzystywaniem w tym celu kursów zamknięcia Pinnacle. Jak precyzyjne są kursy Pinnacle oraz w jaki sposób można modelować efektywność rynku? Aby się tego dowiedzieć, przeczytaj ten artykuł.

Dyrektor ds. tradingu w Pinnacle, Marco Blume, stwierdził, że wiarygodnym wskaźnikiem tego, czy mamy do czynienia z doświadczonym graczem (to znaczy takim, który dysponuje wartością oczekiwaną zapewniającą długoterminowe zyski), jest jego umiejętność pokonywania kursów zamknięcia.

Powszechnie przyjmuje się, że spośród wszystkich dostępnych kursów, to kursy zamknięcia są najbardziej efektywne, inaczej mówiąc precyzyjne, ponieważ uwzględniają możliwie najwięcej informacji na temat danego wydarzenia. Jeśli odzwierciedlają „prawdziwe” prawdopodobieństwo danego wyniku (musimy jednak pamiętać o marży), to każda wartość pokonująca kurs będzie miarą oczekiwanej przewagi.

Pokonanie kursu zamknięcia o 10% oznacza, że możemy spodziewać się 10% zysku w długim terminie. Są jednak i tacy, którzy twierdzą, że chociaż pokonywanie kursów zamknięcia stanowi istotny wyznacznik umiejętności, to niekoniecznie jest warunkiem niezbędnym. Powyższe stwierdzenie sugeruje, że kursy zamknięcia nie zawsze są dokładne.

W tym artykule chcę spróbować pogodzić oba stanowiska, skupiając się ponownie na efektywności, a w szczególności na efektywności (dokładności) kursów zamknięcia Pinnacle. Uprzedzam jednak, że dalsza część artykułu może nie być odpowiednia dla osób, których odstraszają eksperymenty myślowe oparte na statystyce.

Kiedy podjąłem się tego zadania, nie byłem pewien, co okaże się na końcu. Nawet po zgromadzeniu wszystkich informacji wciąż nie jestem całkowicie pewien wyciągniętych wniosków, ale mimo to szczerze zachęcam do dalszej lektury. Być może nie będzie to tak fascynujące doświadczenie, jak podróż przez fabrykę czekolady Willego Wonki, ale mam nadzieję, że okaże się pouczające dla graczy aspirujących do miana tych najlepszych. 

Czym jest efektywność rynku?

W ciągu ostatnich kilku lat wiele razy wspominałem o koncepcji efektywności rynku. W kontekście zakładów bukmacherskich efektywny rynek to taki, w którym kursy dokładnie odzwierciedlają rzeczywiste prawdopodobieństwo wystąpienia określonego wyniku danego wydarzenia. Jeśli na przykład „rzeczywiste” prawdopodobieństwo pokonania drużyny Manchester United przez Manchester City wynosiło 70%, wówczas kurs 1,429 przed uwzględnieniem marży bukmachera należałoby uznać za efektywny. 

Rynki bukmacherskie są całkiem niezłymi źródłami obserwacji z zakresu wnioskowania bayesowskiego, w których następuje konsekwentne podnoszenie dokładności postrzegania prawdopodobieństwa wystąpienia danego zdarzenia.

Oczywiście w przypadku pojedynczego meczu wynik jest bezkompromisowy, co sprowadza się do tego, że postawienie na Manchester City zakończy się wygraną albo stratą. Jednak gdy mówimy o setkach lub tysiącach zakładów, to wpływ przypadku w pojedynczych meczach przestanie mieć znaczenie (prawo wielkich liczb). Dlatego nadal będziemy mówić o „rzeczywistym” prawdopodobieństwie wyniku, mimo że w praktyce nie jest możliwe jego dokładne określenie. Najważniejsze aby pamiętać, że kursy zakładów stanowią odbicie prawdopodobieństwa.

Efektywność rynku jest interesującą koncepcją stosowaną do dużych próbek. Jeśli w przypadku pojedynczych zdarzeń nie jesteśmy w stanie stwierdzić, jakie jest „rzeczywiste” prawdopodobieństwo wyniku, to skąd mamy wiedzieć, jak dokładna była wartość kursu dla zakładu? 

Oczywiście możemy przeanalizować dużą próbkę zakładów, których kursy bez marży wynoszą na przykład 2,00. Jeśli 50% z nich okaże się zakładami wygrywającymi, oznacza to, że średnie prawdopodobieństwo wygranej w tych zakładach zapewne wynosiło 50%. To z kolei wskazuje, że kursy na te zakłady stanowiły prawidłowe odzwierciedlenie rzeczywistego prawdopodobieństwa wygranej. Nie mówi nam to jednak nic o prawdopodobieństwie wygranej dla poszczególnych zakładów, które były brane pod uwagę przy obliczaniu średniej. Rynek może być efektywny w ujęciu ogólnym, jednocześnie ukrywając rzeczywistą efektywność pojedynczych kursów.

Jak precyzyjne są kursy zamknięcia Pinnacle?

W lipcu 2016 r. w Pinnacle opublikowany został artykuł mojego autorstwa, w którym omawiałem efektywność (czyli dokładność) kursów Pinnacle na mecze piłki nożnej, a w szczególności kursy zamknięcia, czyli ostateczne wyceny publikowane przed rozpoczęciem meczu.

Wykazywałem, że po usunięciu marży kursy o wartości 2,00 dają wygraną w 50% przypadków, kursy o wartości 3,00 w 33% przypadków, kursy 4,00 w 25% przypadków, i tak dalej. Oczywiście, jak już wspominałem, dane te w żaden sposób nie odnoszą się do „rzeczywistego” prawdopodobieństwa wyniku pojedynczych meczów. Świadczą jedynie o tym, że kursy w ujęciu średnim były dość dokładne.

Co więcej, we wspomnianym artykule wskazałem również, że stosunek kursów otwarcia do kursów zamknięcia w Pinnacle stanowił bardzo wiarygodny wskaźnik rentowności, co sugeruje, że kursy zamknięcia były bardzo precyzyjne. Na przykład drużyny, których kurs otwarcia wynosił 2,20 (bez marży), a następnie tuż przed zamknięciem rynku spadł do 2,00, wygrały w około 50% przypadków. W przypadku zakładów o równych stawkach zysk dzięki stawianiu po kursie otwarcia wyniósłby 10% (czyli 2,20/2,00 – 1). W przypadku zakładów po kursie zamknięcia zysk wyniósłby 0%.

Z kolei drużyny, których kurs otwarcia wynosił 1,80, a następnie wzrósł do 2,00, również wygrały w około 50% przypadków. Przekładało się to na 10% straty dla zakładów po kursie otwarcia (lub 1,80/2,00 – 1). W przypadku zakładów po kursie zamknięcia strata by nie wystąpiła (0%). Podobną analizę przeprowadziłem ponownie, tym razem zwiększając rozmiar próbki do 158 092 meczów i 474 278 kursów na zwycięstwa gospodarzy, gości oraz remisy ― otrzymane wyniki i wnioski okazały się zasadniczo takie same. Przedstawiam je na poniższym wykresie.

in-article-solve-a-problem-like-efficiency-3.jpg

Każdy punkt danych odpowiada faktycznym zwrotom w zależności od stosunku kursów otwarcia do zamknięcia, w interwałach co 1%. Punkty oznaczone kolorem niebieskim to zwroty z kursów otwarcia, natomiast punkty w kolorze czerwonym oznaczają zwroty z kursów zamknięcia. Oczywiście istnieją pewne wahania, ale ogólnie panujące tendencje są widoczne. Na wykresie zostały również ukazane linie trendu, których przecięcie znajduje się w punkcie zero (całkiem rozsądne założenie w przypadku nieuwzględnienia marży), i ich równania.

Dzięki nim ponownie możemy obserwować niemal idealne odzwierciedlenie mojej pierwotnej hipotezy, według której stosunek kursu otwarcia do zamknięcia (na wykresie na osi x) jest doskonałym wskaźnikiem rentowności dla kursów otwarcia (na osi y) ― co w skrócie oznacza, że statystycznie kursy zamknięcia Pinnacle są wysoce precyzyjne.

Współczynnik proporcjonalności między stosunkiem kursów otwarcia do kursów zamknięcia (minus 1) a rentownością (czyli zyskiem) stanowi o przebiegu linii trendu. Wartość 1 oznacza idealną proporcjonalność. Dla zaoszczędzenia miejsca w dalszej części artykułu wskaźnik ten będziemy oznaczać akronimem z języka angielskiego OCRYCOP.

Również jednak i w tym przypadku wiemy tylko, że wyniki są „prawdziwe” w ujęciu ogólnym. Nadal jednak nie wiemy, jak precyzyjne są pojedyncze kursy zamknięcia. Każdy punkt danych na wykresie stanowi uśrednione połączenie tysięcy wyników.

Tworzenie modelu efektywności rynkowej 

Chcąc stworzyć podobny wykres współczynnika OCRYCOP, który wskazuje precyzyjność kursów zamknięcia, opracowałem prosty model symulujący ruch kursów otwarcia względem kursów zamknięcia. Model składał się z 10 000 zakładów, każdy z kursem otwarcia oraz zamknięcia. 

Chcąc ponownie zademonstrować niepewność co do „rzeczywistego” prawdopodobieństwa wyniku, zdecydowałem się na testowanie losowych kursów otwarcia o średniej wartości 2,00 przy odchyleniu standardowym (σ) 0,15 (z czego wynika, że wartość dwóch trzecich kursów waha się pomiędzy 1,85 a 2,15, a 95% między 1,70 a 2,30). 

Zatem gdy „prawdziwy” kurs dla każdego zakładu, znany wyłącznie demonowi Laplace'a (i mnie), wynosił 2,00, kurs otwarcia publikowany przez hipotetycznego bukmachera w moim modelu przyjmował wartość zbliżoną do 2,00. Dla odchylenia standardowego wybrałem wartość 0,15, ponieważ w dużym stopniu odzwierciedla zmiany kursów otwarcia względem kursów zamknięcia na prawdziwych rynkach zakładów, gdzie kursy są bliskie 2,00.

Na przykład odchylenie standardowe wynoszące 0,05 oznaczałoby, że 95% opublikowanych kursów otwarcia o wartości około 2,00 miałoby dokładność ± 5%. Wydaje się to zbyt wąski zakres, biorąc pod uwagę fakt, że kursom faktycznie towarzyszą wahania. Podobnie wartość 0,3 lub wyższa sugerowałaby, że bukmacherzy nie są zbyt dobrzy w ustalaniu kursów ― co, jak powszechnie wiadomo, nie jest prawdą. 

Efektywność rynku jest interesującą koncepcją stosowaną do dużych próbek. Jeśli w przypadku pojedynczych zdarzeń nie jesteśmy w stanie stwierdzić, jakie jest „rzeczywiste” prawdopodobieństwo wyniku, to skąd mamy wiedzieć, jak dokładna była wartość kursu dla zakładu?

Jest bardzo mało prawdopodobne, że bukmacher wyznaczy kurs 3,00, gdy „prawdziwy” kurs ma wartość 2,00. Oczywiście może się tak zdarzyć, ale zazwyczaj jest to wynikiem oczywistego błędu lub konsekwencją pojawienia się pewnych nieprzewidzianych, ale znaczących informacji, które były niedostępne w momencie ustalania kursów. W takich wypadkach należy mówić o zmianie "prawdziwych" kursów. Wróćmy jednak do kwestii tworzenia modelu. Wygenerowałem trochę kursów otwarcia, ale co z kursami zamknięcia?

W teorii kursy zamknięcia odzwierciedlają opinie graczy wyrażone w postaci pieniężnej. Zastanówmy się nad skrajnym przypadkiem, kiedy odrzucimy twierdzenia o akumulacji informacji na temat „rzeczywistego” prawdopodobieństwa i przyjmiemy taki sam poziom niepewności losowej. Oczywiście założenie takie wydaje się nierealne, ponieważ rynki bukmacherskie można uznać za środowiska wnioskowania bayesowskiego, w których konsekwentne podnosi się dokładność postrzegania prawdopodobieństwa wystąpienia danego zdarzenia. W efekcie poziom niepewności ulga obniżeniu.

W kontekście naszego modelu średni kurs i odchylenie standardowe wynoszą odpowiednio 2,00 i 0,15. Teraz dla każdej pary kursów otwarcia i zamknięcia możemy obliczyć ich stosunek. Znając „rzeczywiste” prawdopodobieństwo wyniku (50%), możemy obliczyć oczekiwane zwroty dla kursów otwarcia i zamknięcia dla wszystkich 10 000 meczów. Na koniec możemy sporządzić wykres, który pokaże, w jaki sposób oczekiwane zwroty z kursów otwarcia i zamknięcia zmieniają się wraz ze zmieniającym się stosunkiem kursów otwarcia do zamknięcia ― podobnie jak wcześniej w przypadku kursów na mecze w Pinnacle.

Pierwszy z sześciu poniższych wykresów przedstawia wyniki modelowania. Niebieskie i czerwone linie pokazują obrazują średnią z 50 meczów dla oczekiwanych zysków z zakładów o stałych stawkach (oś y) (odpowiednio dla kursów otwarcia i zamknięcia) względem 10 000 zakładów z danym stosunkiem kursu otwarcia do zamknięcia –1 (oś x). Nie przypomina to wyżej przedstawionych danych Pinnacle.

Mimo że przyjęte w niniejszym eksperymencie kursy otwarcia i zamknięcia są teoretycznie precyzyjne, ponieważ statystycznie odpowiadają „prawdziwym” kursom, to w rzeczywistości stosunek kursów otwarcia do zamknięcia przewiduje jedynie połowę oczekiwanego zysku (OCRYCOP = 0,5). Na przykład stosunek 110% daje zwrot 105% (czyli 5% zysku w stosunku do obrotu) w przypadku zakładów po kursie otwarcia oraz zwrot 95% (czyli 5% straty w stosunku do obrotu) w przypadku zakładów po kursie zamknięcia. 

in-article-solve-a-problem-like-efficiency-2.jpg

Wychodzi na to, że w tym przypadku stosunek kursu otwarcia do kursu zamknięcia nie jest dobrym wskaźnikiem rentowności, a co za tym idzie, indywidualne kursy zamknięcia nie mogą być zbyt precyzyjne. Powód jest oczywiście prosty. Po pierwsze wiemy, że analizowane tutaj kursy zamknięcia nie są precyzyjne w ujęciu indywidualnym i nie odpowiadają kursowi „prawdziwemu”, czyli 2,00. Przecież ich wartości zostały losowo zmienione, aby jedynie w przybliżeniu wynosiły 2,00.

Po drugie, największy stosunek kursu otwarcia do zamknięcia będzie miał miejsce, gdy przyjęty na potrzeby tego artykułu generator losowych kursów zwróci wysokie kursy otwarcia i niskie kursy zamknięcia. Największy współczynnik wygenerowany w tym przypadku wynosił 1,55 (przy kursie otwarcia 2,27 i zamknięcia 1,46). Rzeczywiście w przypadku kursów otwarcia wynoszących 2,27 przy „prawdziwym” kursie 2,00, nasz oczekiwany zysk wyniesie 2,27/2,00 – 1 = 0,135 lub 13,5%, a nie 55%, jak przewidywała moja początkowa hipoteza.

Na pięciu dodatkowych wykresach powtarzamy nasz model, ale zmniejszamy zmienność losową (odchylenie standardowe) dla kursów zamknięcia co 0,03 (pozostawiając takie same odchylenie w kursach otwarcia). Można zauważyć, że wraz ze spadającymi wahaniami kursów zamknięcia względem „rzeczywistej” wartości 2,00 wartość współczynnika OCRYCOP zbliża się do 1. W skrajnym przypadku, gdy wszystkie kursy zamknięcia wynoszą 2,00, a więc są stuprocentowo dokładne, występuje doskonała korelacja 1:1.

Spójrzmy ponownie na wcześniejszy wykres rzeczywistych kursów w Pinnacle. Linie trendu (i związane z nimi równania) są bardzo zbliżone do naszego przykładowego modelu pokazującego idealną korelację. Widać jednak wyraźnie, że nadal występuje pewna zmienność – punkty nie znajdują się idealnie na liniach trendu. Taki stan rzeczy może być oczywiście wynikiem przypadku towarzyszącego wynikom rzeczywistych zdarzeń (ponieważ mój model bazuje na zysku oczekiwanym, czynnik szczęścia i pecha został w nim wyeliminowany). 

Z całą pewnością nieuzasadniona wydaje się wiara w to, że każdy indywidualny kurs zamknięcia będzie idealnie odpowiadał „prawdziwemu” kursowi. Problem polega jednak na tym, że bez dostępu do precyzyjnych indywidualnych kursów zamknięcia jesteśmy zmuszeni zaakceptować nieidealną korelację pomiędzy stosunkiem kursu otwarcia do kursu zamknięcia a oczekiwanymi zwrotami (OCRYCOP < 1). Czy można to w jakiś sposób rozwiązać? Opiszę to zagadnienie dokładnie w drugiej części tego artykułu.

Przydatne informacje o zakładach — pomoc dla obstawiających

Dział przydatnych informacji o zakładach to jeden z najobszerniejszych zbiorów materiałów z poradami ekspertów, jaki został udostępniony online. Materiały przeznaczone są dla osób o wszystkich poziomach doświadczenia. Przede wszystkim staramy się pomóc osobom obstawiającym w podejmowaniu świadomych decyzji.