Часть вторая: выбирают ли сторону букмекеры для рынков ставок на разницу в счете?

Какие данные мы рассматриваем?

Детальное изучение ставок на разницу в счете

Систематичность или случайность?

Часть вторая: выбирают ли сторону букмекеры для рынков ставок на разницу в счете?

Первая часть этой статьи была посвящена следующей идее: букмекеры выбирают сторону для рынков ставок на разницу в счете из-за чрезмерной уверенности рынков в успехе фаворитов. Во второй части статьи мы попробуем ответить на этот вопрос, используя свежие данные о ставках на НБА. Чтобы узнать больше, прочитайте статью.

Выбирают ли сторону букмекеры для рынка ставок на разницу в счете? В первой части этой статьи о ставках я предложил мысленный эксперимент, который объясняет возможные причины такого выбора, и проанализировал факты, которые приводит экономист Стивен Левитт. По мнению Левитта, букмекеры манипулируют коэффициентами ставок на разницу в счете в матчах НФЛ, стремясь выгодно использовать склонность игроков ставить на то, что фаворит покроет разницу в счете, для повышения прибыли.

Такое систематическое когнитивное искажение можно объяснить интуитивной уверенностью: чем сильнее игрок уверен в победе команды (чем выше он оценивает фаворита), тем выше вероятность того, что игрок считает команду способной покрыть разницу в счете.

Левитт обнаружил, что 60 % игроков на рынках ставок на разницу в счете в матчах НФЛ предпочитают ставить на фаворита, но при этом фаворитам удается покрыть разницу в счете лишь в 48 % случаев. Если теоретическая маржа букмекера составляет 2,5 %, такое распределение ставок повышает его прибыль до 3,3 %. 

Посмотрим, можно ли обнаружить признаки подобного эффекта предвзятости в свежем наборе данных о ставках на разницу в счете на рынке НБА.

Какие данные мы рассматриваем? 

Для этого анализа я использовал опубликованный Sportsbook Reviews набор данных о результатах матчей НБА и линиях ставок на эти матчи за 12 сезонов. Период анализа начинается 30 октября 2007 г. и завершается 5 мая 2019 г. За это время в НБА состоялось 15 508 матчей. Я использовал значения разницы в счете, доступные на момент закрытия рынка.

Используя различные пороговые значения гандикапа очков для проверки после нанесения данных на график, мы рискуем произвольно выбрать величины, которые помогут подогнать гипотезу к данным, тогда как нам следует подгонять данные к гипотезе.

Фактические коэффициенты ставок не указаны, однако нужно предположить, что в среднем значения разницы в счете отражали вероятность исходов 50 на 50 (например, после применения маржи − 1,95/1,95 или 1,91/1,91, а в американской системе обозначения коэффициентов они выглядят так: −105/–105 или –110/–110). Если это предположение верно, для выполнения приведенного ниже анализа не нужно использовать фактические коэффициенты ставок. 

Sportsbook Reviews сообщает, что источниками значений разницы в счете, зафиксированных до 2015 г., являются букмекеры 5Dimes, Betonline, Bookmaker, Heritage, Pinnacle и Sportsbook.com. Источником более поздних значений является букмекерская контора Westgate Superbook; некоторые дополнения поступают от 5Dimes и Bookmaker. Информация о том, какие именно букмекеры предоставили те или иные значения разницы в счете, отсутствует. 

На момент закрытия рынка в 15 311 матчей из 15 508 был предусмотрен фаворит с гандикапом (в каждом случае гандикап для одной из сторон составлял не более –0,5). В 254 матчах из этих 15 311 фаворит (по всей видимости, равно как и аутсайдер) сумел покрыть разницу в счете. В оставшихся 15 057 матчах разницу в счете удалось покрыть 7541 фавориту (50,08 %). Того же добились 7516 аутсайдеров (49,92 %). В результате проверки по критерию хи-квадрат p-значение отклонения от ожидаемой величины 50 на 50 составило 84 %. Другими словами, статистически значимое отклонение от условий без систематического эффекта предвзятости отсутствует. Вот вам и 48 %.

Детальное изучение ставок на разницу в счете

Сделанный мной вывод не воспроизводит результаты анализа матчей НФЛ, полученные Левиттом. Как бы то ни было, расставаться с надеждой на обнаружение эффекта предвзятости еще не время. Стоит вспомнить: гипотеза интуитивной уверенности предполагает, что чем выше игроки оценивают фаворита на рынке ставок типа «денежная линия», тем больше вероятность того, что игрок поставит на фаворита и на рынке ставок на разницу в счете. Это мотивирует букмекеров изменять коэффициенты ставок на разницу в счете с целью увеличения гандикапа очков.

В приведенной ниже таблице показана суммарная доля фаворитов, сумевших покрыть разницу в счете. Матчи отсортированы по гандикапу очков; в первую очередь приводятся максимальные значения гандикапа. Очевидно, что шкала оси X не линейна, поскольку высоких гандикапов очков значительно меньше, чем низких. 

in-article-points-spread-in-article-1.jpg

Если мы проигнорируем самые высокие гандикапы, дисперсию которых существенно увеличивает небольшой размер выборки, данные ясно продемонстрируют наличие эффекта предвзятости при размещении ставок на разницу в счете, пусть даже этот эффект и исчезает при приближении к нулевым гандикапам команд с одинаковым рейтингом. Например, в 1303 матчах с гандикапом, который на момент закрытия рынка составлял не менее 12, разницу в счете сумели покрыть лишь 47,0 % фаворитов. В 2600 матчах с гандикапом, который на момент закрытия рынка составлял не менее 10, разницу в счете удалось покрыть 48,3 % фаворитов. Что касается 4701 матча с гандикапом закрытия не менее 8, доля успешных фаворитов составила 49,4 %.

Систематичность или случайность?

Возникает вопрос: обладает ли выявленный эффект предвзятости статистической значимостью? Не обусловлено ли его появление случайностью и небольшим размером выборки? Если рассматривать гандикап не менее 12, проверка по t-критерию Стьюдента подтверждает: вероятность того, что 47 % фаворитов удастся покрыть разницу в счете (при наличии ожидания 50 %) вследствие случайности, составляет всего 0,3 %.

Как правило, такая величина считается статистически значимой (p-значения менее 5 % или 1 % обычно рассматриваются в качестве критических показателей статистической значимости). Это позволяет нам отказаться от нулевой гипотезы об отсутствии эффекта предвзятости в пользу другой гипотезы: для возникновения некоторого эффекта предвзятости при размещении ставок на разницу в счете есть причина. Как уже было сказано в первой части этой статьи, наиболее очевидная причина заключается в том, что букмекеры манипулируют оценкой разницы в счете для извлечения выгоды из действий игроков.

К сожалению, следует принять во внимание три оговорки. Во-первых, p-значение 1,7 %, связанное с пороговой величиной гандикапа в 10 очков, обладает меньшей статистической значимостью, тогда как p-значение 25,2 %, связанное с пороговой величиной гандикапа в 8 очков, вообще не имеет статистической значимости.

Во-вторых, проверка по t-критерию Стьюдента в данном случае может быть неуместной, поскольку мы имеем дело с количествами данных (количествами раз, когда команде удалось покрыть разницу в счете), а они могут не соответствовать известному распределению данных. Вместо этой проверки мы можем выполнить проверку по более надежному, но менее мощному непараметрическому критерию хи-квадрат, свободному от распределения. В результате проверки по критерию хи-квадрат p-значение для пороговой величины гандикапа в 12 очков составляет, к примеру, 3,3 %.

Чем сильнее игрок уверен в победе команды (чем выше он оценивает фаворита), тем выше вероятность того, что игрок считает команду способной покрыть разницу в счете.

И наконец, величина гандикапа очков, которую следует использовать для поиска эффекта предвзятости, вовсе не очевидна. Используя различные пороговые значения гандикапа очков для проверки после нанесения данных на график, мы рискуем произвольно выбрать величины, которые помогут подогнать гипотезу к данным, тогда как нам следует подгонять данные к гипотезе. В таком «копании» в данных не может быть ничего хорошего. Игроки, применяющие этот метод в надежде «открыть» прибыльную систему, действуют на свой страх и риск.

В качестве крайней меры можно было бы вычислить p-значение для каждой точки в ряду расположенных в определенном порядке величин гандикапов очков. В этом случае мы получили бы 15 310 p-значений. Возникает проблема множественных сравнений, связанная с необходимостью одновременно выполнить ряд статистических проверок, каждая из которых может привести к обнаружению значимого вывода. Например, при проведении проверки с использованием критического p-значения (порогового показателя статистической значимости) на уровне 5 % при условии истинности нулевой гипотезы, которая заключается в том, что все события возникли случайно, вероятность ошибочно отвергнуть нулевую гипотезу составляет всего 5 %.

Однако при проведении 100 статистически независимых друг от друга проверок при условии истинности всех соответствующих нулевых гипотез вероятность ошибочно отвергнуть по меньшей мере одну нулевую гипотезу составляет 99,4 %. В таких обстоятельствах нам не стоит всецело доверять используемому методу проверки гипотез, если мы не внесем в него какую-либо поправку.

В таких случаях нередко используется поправка Бонферрони. Для внесения поправки Бонферрони нужно просто разделить критическое p-значение на количество выполняемых сравнений. Например, если критическое значение, используемое при выполнении одной проверки, составляет 5 %, при одновременном выполнении десяти проверок оно уменьшается до 0,5 %. Если ни одно из десяти p-значений не упадет ниже этого жесткого порогового показателя, мы не сможем отвергнуть нулевую гипотезу о том, что все наблюдаемые события произошли случайно. 

На следующем графике изображен процесс изменения p-значения для проверок по t-критерию и критерию хи-квадрат в связи с выборками совокупностей идущих подряд матчей, ряды которых отсортированы по гандикапам очков. Ось Y является логарифмической. Кроме того, на графике изображено критическое p-значение с поправкой Бонферрони: предполагается, что критическое значение, используемое при выполнении одной проверки, составляет 5 % и что одновременно было выполнено 15 310 проверок.

in-article-points-spread-in-article-2.jpg

Проверки по непараметрическому критерию хи-квадрат систематически дают более консервативные p-значения и, вероятно, заслуживают большего внимания. Впрочем, при выполнении проверок по t-критерию ни одно p-значение, достигшее критической величины с учетом поправки, не позволило бы нам исключить гипотезу случайности всех наблюдаемых событий.

Строго говоря, поправка Бонферрони предполагает, что все одновременно выполняемые проверки независимы друг от друга. Очевидно, если рассматривать упорядоченный ряд гандикапов очков, с помощью которого мы последовательно выясняем, покрывают ли все большие выборки фаворитов разницу в счете менее чем в 50 % случаев, выполняемые проверки не обладают такой независимостью. Отсюда следует, что применяемый нами критический пороговый показатель с учетом поправки может быть слишком консервативен. Тем не менее я продемонстрировал этот метод, чтобы обратить внимание читателей на потенциальные ловушки, подстерегающие тех, кто принимает за данность статистическую значимость, которая может и не существовать в реальности. 

Какие выводы можно сделать на основании проведенного нами анализа?

Используя качественный подход, я сформулирую эти выводы следующим образом. Да, на рынке ставок на НБА, по всей видимости, наблюдается эффект предвзятости, связанный с размещением ставок на разницу в счете в пользу фаворита, но при этом он возникает лишь для самых высоких гандикапов. Если этот эффект и обладает какой-то статистической значимостью, которая дает основания полагать, что он возникает не только благодаря случайности, но и по определенной причине (например, вследствие того, что букмекеры манипулируют оценкой разницы в счете), эта статистическая значимость, скорее всего, невелика.

Если букмекеры манипулируют оценкой разницы в счете в соответствии с предположением Левитта, который рассматривает рынок ставок на НФЛ, возможности для такого манипулирования ограничены. То, что игроки делают завышенные ставки в связи с высокими гандикапами, может объясняться эффектом интуитивной предвзятости, однако возможности букмекеров для злоупотребления этим эффектом минимальны. Если букмекер попытается расширить эти возможности путем увеличения разницы в счете, реакция игроков будет, вероятно, нелинейной, что приведет к исчезновению дополнительной ожидаемой прибыли букмекера.

Если бы на протяжении рассматриваемых нами 12 сезонов вы делали ставки против фаворитов, играя против толпы, вот как изменялся бы ваш доход в зависимости от гандикапа очков. В этом примере используются коэффициент 1,95 (–105) и маржа букмекера 2,5 %.

in-article-points-spread-in-article3.jpg

Да, игра против толпы с размещением ставок на то, что самые недооцененные аутсайдеры сумеют покрыть разницу в счете, могла принести некоторую прибыль. И все же прибыльность такой игры была бы небольшой. Остается вопрос: есть ли у этой прибыльности статистическая значимость и, соответственно, воспроизводимость? Во многом это напоминает эффект предвзятости при оценке аутсайдеров и фаворитов на рынках ставок с фиксированными коэффициентами: любая потенциальная прибыльность, обусловленная эффектом предвзятости, ограничена ставками против сильнейших фаворитов, тогда как большая часть рынка находится в пределах устойчивости к риску, которые устанавливаются маржой букмекера.

Вне всякого сомнения, в целом разница между фаворитами и аутсайдерами, связанная с любыми значениями разницы в счете, отсутствует: фавориты покрывают разницу в счете с тем же успехом, что и аутсайдеры. В связи с сильнейшими фаворитами на рынке могут существовать отдельные проявления неэффективности, однако в среднем коэффициенты ставок на разницу в счете матчей НБА, по-видимому, хорошо отражают истинные значения вероятности того, что команде удастся покрыть разницу в счете.

Если во время изучения Левиттом рынков НФЛ и существовал более общий эффект предвзятости, этот эффект в основном исчез. Если информация о неэффективности рынка становится общедоступной, срок ее годности обычно быстро истекает.

Ресурсы для размещения ставок: расширение возможностей игроков для размещения ставок

Ресурсы для размещения ставок Пиннакл содержат одну из наиболее полных коллекций экспертных рекомендаций по размещению ставок онлайн. Стремясь предоставить игрокам возможность расширить их знания, в этих рекомендациях мы постарались охватить все уровни опыта.