ブックメーカー、特にPinnacleのようなブックメーカーに勝つことは非常に難しいことだと広く知られています。しかし、それをそんなに難しくしているものは何でしょうか? スポーツベッティングで勝つにはどれくらい優秀でなければならないか、ブックメーカーの視点から物事を考えてみることで理解しやすくなるでしょうか? 詳しくは続きをお読みください。
スポーツの大会が中止になっていたこの数か月間、ブックメーカーに勝つにはどれくらい優秀なベッターになる必要があるのかを測定することは可能だろうか、と考えていました。いつものように、幸運についてではなく、バリューベッティングの原則に基づいて長期的な予想利益についてお話ししたいと思います。
これを達成するには、ブックメーカーのマージンを超える必要があることは明らかです。マージンが2%と少なくても、これを何とか達成できるベッターがわずかであるという事実が、ブックメーカーに勝つことは非常に難しいことだと証明しています。
さらに、私の記事の読者やTwitterで私をフォローしている人なら、利益の出る期待値を達成する統計上の可能性と、特定のベッティングや賭けの想定でそれらのパフォーマンスをどれくらい期待できるのかを測定するために私が提供した複数のExcelツールを知っているでしょう。
しかし今回調べたいのは、不確実性の観点から「ブックメーカーよりも優秀であること」がどのようなことであるかです。ご存じのように、ベッティングは最高の予想屋にとっても不確実なビジネスです。マージンを超え、長期的に勝つには、どれくらい不確実性を少なくする必要があるでしょうか?
答えをシミュレーションする中で、ブックメーカーはどれくらい優秀なのか、そしてなぜ彼らは利益を出し続ける必要があるのか、ということが明確になってきました。これはブックメイキングの不均衡です。
2種類の不確実性
私はPinnacleの過去2つの記事で、2種類の不確実性について論じました。まず、偶然的、つまり統計的な不確実性があります。これは、確率的な可変性による特有の不確実性を意味します。たとえばコイントスを行うなど、プロセスを何回も繰り返します。開始条件をわずかに変えると、異なる結果が出ます。これらの差異は未知のままです。偶然的な不確実性を減らすことはできません。
ラプラスの悪魔のように、これは単に限られた情報と処理能力の結果だと主張する人がいるかもしれません。開始条件をすべて完璧に把握できたら、正確な結果を確実に予測できるはずだと。
実際の問題として、これらシステムの複雑性はそのような情報収集を不可能にしています。しかしおそらくもっと重要なのは、小規模で現実の決定論的ではなく確率論的な性質が、このタスクが理論上でさえも失敗する運命にあることを意味していることです。
ブックメーカーが真のオッズを評価するのに時間がかかりすぎる場合は、ベッターも同じようにそうなる可能性があります。一部のベッターは、ブックメーカーのプライスにも部分的に左右されるかもしれません。
確実に0%または100%のいずれかになるとだまされて信じてしまうのではなく、結果の「真の」可能性について話すことが理に適っているのは、正確にはこの理由のためです。コイントスやサイコロを転がすものと違い、スポーツでは「真の」可能性を知ることができません(そのため、かぎ括弧をつけています)が、それらが存在するかのように話すことは理に適っています。
2つ目の不確実性は認識論的、つまりモデルの不確実性です。これはモデル化しようとするものについて理解が不完全であるために起こります。認識論的不確実性は、モデルについて知識を増やすことで減らすことができます。
不確実性の定量化のゴールは認識論的不確実性を偶然的不確実性に減らすことですが、システムの複雑さと現実の確率的性質により、実際には2つの境界があいまいになる可能性があります。
ゲスト著者の@PlusEVAnalyticsは、Pinnacleの記事「Toward a theory of everything piece」で、2種類の不確実性をそれぞれプロセス(偶発性)とパラメーター(認識論的)の不確実性として説明しています。彼の例を再現することで、その違いを明確にしたいと思います。
「勝率が60%のサッカーチームがあり、そのチームにイーブンマネーをベットして、負けたとします。なぜベットに負けたのでしょうか? もしかすると、正しい評価でしたが、不運だったのかもしれません。40%の事象が発生し、ベットに負けてしまいました。これはプロセスの(偶然的)不確実性であり、良いベットでしたが、不運な結果になってしまいました。あるいは、もしかすると、評価で間違えたのかもしれません。真の可能性は50%、30%、いや1%だったかもしれません。あなたは良いベットだと思ったベットをしましたが、実際は悪いベットでした。これはパラメーターの(認識論的)不確実性です。真の可能性がわからないので、結果(良い結果と悪い結果の両方)が、どの程度パラメーターの不確実性ではなくプロセスの不確実性によって動くのかを解明することは、非常に難しいことです。」
ベッティングの世界における不確実性をモデル化
ベッティングの環境では、偶然的不確実性はすべての人にとって同じです。同じ影響変数により、同じ事象がスポーツの試合でも起こります。すべてのベッターは同じ歴史を生きています。
シンプルな乱数発生器を使用して偶然的不確実性をモデル化するのは簡単です。両者の勝率がそれぞれ50%の試合があり、フェアオッズが2.00とします。 偶然的不確実性をモデル化するために、乱数発生器を使用して0から1の数字を出力します。0.5以下の場合は勝ち、それ以上の場合は負けとなります。結果(勝ちベットと負けベット)の分布は二項分布になります。
認識論的不確実性のモデル化は、そこから発生するエラーがどんな種類の分布になるのかまったく明らかになっていないため、やや難しくなります。@PlusEVAnalyticsはモデル化にベータ分布を使用しましたが、私は彼ほど頭脳明晰ではないため、標準分布を使おうと思います。さらに、以下で説明するように、この認識的エラーの分布が真の結果の確率の中心になると想定します。もちろん系統的なバイアスがあれば、それは真ではなくなります。
少なくともブックメーカーの場合、私がすでに示したようにこれはおそらく妥当な想定でしょう。大きなスポーツマーケットの場合は少なくともPinnacleのベッティングオッズはかなり効率的です。つまり平均的に、たとえ個別にエラーがあってもそれらは真の結果の可能性を非常に正確に反映します。これがベッターにも当てはまるかどうかは、おそらくあまり確実ではありません。
認識論的不確実性の分布
認識論的不確実性の影響をモデル化するために、1,000回分の仮説的なベットを作り、すべてのベットで真の勝率が50%になるようにしました。各ベットについて、私の仮説の予想モデルでは、真の勝率の判定においていくらかの認識的エラーがあり、エラーの大きさは6つの異なる標準偏差(0%、1%、2%、3%、4%、5%)によって決まります。たとえば標準偏差1%の場合は、モデル化された「真の」勝率の2/3以上が49%から51%の間にあり、約95%が48%から52%の間にあります。
標準偏差が大きくなると、以下の表が示すように、予想モデルによって出されたその「真の」勝率の広がりが大きくなります。明らかに標準偏差0%では、すべての勝率がぴったり50%となり、ラインは見られません。分布が広がるほど、認識論的不確実性は大きくなります。
表からは、これらの勝率分布が効率的なモデルを示す、つまり平均が必ず50%になる一方で、認識論的不確実性の度合いが変化することが明らかです。
「真の」勝率を反対にすると、オッズの分布になります。勝率と暗示的なオッズの逆の関係により、それらは対数正規型に分布します。
1,000回のベットサンプルでは、モデル化された「真の」オッズは標準偏差1%、2%、3%、4%、5%に対して、通常それぞれ1.88から2.13、1.78から2.28、1.69から2.46、1.60から2.66、1.52から2.89の範囲に広がることを意味します。
ブックメーカー対ベッター
真のオッズで認識論的不確実性のモデルを使用してブックメーカー対ベッターの戦いを構築してみましょう。各ベットで、ブックメーカーは真のオッズだと思うものを公開します。そのプライスはすでに2.5%のマージン分が引かれたものです。たとえば、ブックメーカーが真のプライスを2.00だと考えれば1.95を公開します。1,000ベットを超えると、それらのオッズは上記の分布に従って変化します。
ベッターには別のモデルがあり、それを使用して真のオッズであると考えるものを推測します。ブックメーカーが公開したオッズがベッターの推測よりも大きい場合、ベッターは1ユニットのベットを行います。そうでない場合はベットしません。
ベットを設定するために、すべてのベットの真のオッズは2.00で、ブックメーカーとベッターは両者ともにこれを知らず、結果は乱数生成器を使用して決めるものとします。前述の通り、ここでのばらつきは偶然的不確実性の結果です。
この対戦をモンテカルロシミュレーションを使用して10,000回繰り返します。まず、ブックメーカーとベッターの認識論的不確実性の、36種類の異なる組み合わせそれぞれについて、当たったベットの平均数を見てみましょう。ベッターまたはブックメーカーのいずれかについて認識論的不確実性が大きくなるほど(行と列の見出しを参照)、2つのモデル間の差異がマージンより大きくなる傾向があり、そのためベットが当たりやすくなります。
明らかにブックメーカーもベッターも完璧な場合、ブックメーカーは常に1.95を公開するようになり、ベッターはそれが真のプライスよりも低いことを知っているので、ベットは発生しません。
2つ目の表は、ベッターが各不確実性の組み合わせで何とか達成した平均(期待)収益を示しています。標準偏差が小さくなるほど、認識論的不確実性が小さくなり、より良いモデルになることを思い出してください。
当然、ブックメーカーが完璧ですべてのベットの確率を正確に予想すると、ベッターがどんなに優秀でもマージンの大きさ(-2.5%)と等しい金額を失います。この数字に関するわずかなばらつきは、単純に偶然的不確実性の結果です。モンテカルロシミュレーションを行うほど、これは減っていきます。
ベッターのモデルがブックメーカーのモデルより優れている(不確実性が少ない)場合、予想利益を出すことは簡単であることにも気づきます。しかし、明らかに極めて複雑なものもあります。ブックメーカーのモデルが良くない場合、ベッターは自分のモデルがもっと悪くても予想利益を出すことができます。たとえば、ブックメーカーの認識論的不確実性で勝率の標準偏差が3%の場合、ベッターはモデルの不確実性の標準偏差が5%であれば+0.68%を期待できます。これはまったく理に適っていないように見えます。
ブックメイキングの不均衡
この逆説を解決するためには、この対戦がどのように成り立っているかを見る必要があります。ベッティングマーケットについては、ブックメーカーがプライスを決めます。ベッターはそのチャンレンジを受け入れるかどうか決める必要があり、公開されたオッズが自分の予想する「真の」オッズよりも大きい場合のみ受け入れます。ベッターが受け入れた場合、ブックメーカーはベットのオファーを撤回することはできません。
私のモデルシナリオでは、認識論的不確実性が存在する場合、ブックメーカーのエラーの50%は実際の真のオッズ(2.00)よりも大きい「真の」オッズを予想し、50%は小さいオッズを予想します。同様にベッターのエラーの50%は2.00よりも大きいか、小さいかのどちらかになります。
ブックメーカーがマーケットの「真の」オッズとして信じているものを知ることはできません。これらの推定の、現実の真のオッズを知ることもできません。
ただし、ブックメーカーのオッズが2.00よりも小さいと、ベッターのオッズが小さくなる可能性が下がるため、ベットがトリガーされる機会が減ります。逆に、ブックメーカーのオッズが大きすぎるとベットがトリガーされるチャンスが増えます。
この不均衡により、マイナスの期待値のベットに対して、プラスの期待値のベットの割合が大きくなります。認識論的不確実性が広がるほど、不均衡は大きくなります。ブックメーカーとベッターの両方が不確実性で2%の標準偏差を示している場合、ベットの56%はプラスの期待値を持ち、平均のオッズベットは2.01になります。両者の不確実性の標準偏差が5%になると、68%のベットが2.00以上のオッズで当たるようになり、平均は2.10になります。
代わりに、買い手と売り手の両方が第三者によって公開されたオッズでベットすることに相互に同意する必要があるという別のモデルを実行する場合、この不均衡の大部分は消えます。両者とも、第三者とモデルの認識論的不確実性と競う立場となります。その第三者の認識論的不確実性が小さい場合、買い手と売り手の両方ともモデルが等しく不確実であれば、第三者が設定したマージンと等しい金額を失います。
現実世界のベッティング
これらの結論はすべて、大規模で、おそらく現実的ではない前提によるものです。ブックメーカーのモデルとベッターのモデルはお互い完全に独立していることが想定されています。しかし現実では、モデラーは同様のデータや予想アルゴリズムを使用する傾向にあるため、こういったケースとなる可能性は低いです。
ブックメーカーが真のオッズを評価するのに時間がかかりすぎる場合は、ベッターも同じようにそうなる可能性があります。一部のベッターは、ブックメーカーのプライスにも部分的に左右されるかもしれません。
ブックメッカーとベッターのモデルの相関関係により、ベッターの期待値が減り、ベッターが成功することは難しくなります。
それにもかかわらず、この認識論的不確実性のモデルは、典型的なブックメーカーがマージンがある中でも利益を出すにはどれくらい優れている必要があるかについて、手がかりを提供してくれます。ベッターがオッズを受け入れるとブックメーカーはオッズを撤回できなくなるため、ブックメーカーは認識論的不確実性を最小限に減らす必要があります。
ブックメーカーがマーケットの「真の」オッズとして信じているものを知ることはできません。これらの推定の、現実の真のオッズを知ることもできません。そのため、どんな認識論的不確実性が存在するかを正確に判断することができません。
しかし、ブックメーカーのクロージングオッズ(マージンを除く)が現実の真のオッズを表していると想定するなら、根拠ある推測をすることができます。そして、クロージング前のオッズとクロージングオッズの差から、モデルのエラーがどれくらい存在するかを測ることができます。
今シーズンの英国サッカーの試合でPinnacleのオーバー/アンダーのクロージング前のオッズとクロージングオッズを取り上げ、マージンを排除し、クロージングオッズを2.00に統一すると、クロージング前のオッズで想定した勝率の標準偏差は2%をわずかに上回りました。これは私のモデル化された標準偏差の一番低い方であり、Pinnacleのモデルは認識論的不確実性を最小限するのにかなり効果的であることが、ここでも明らかになっています。
ベッターは勝つために少なくとも同じくらい優秀である必要があり、ベッター側に不均衡があります。勝率50%の対戦におけるPinnacleの認識的なエラーがわずか2%であれば、ベッターによる改善の余地はありません。明らかに、ベッターはPinnacleに対してベットを行う前に期待値の最少しきい値を適用することで、自分たちに有利なものを増やすことができます。しかし、モデルの相関関係がそのタスクを難しくします。
繰り返しになりますが、ブックメーカーに勝つことは特にPinnacleでは簡単なことではありません。そして今、もう1つ理由があります。オッズの売り手として、Pinnacleは顧客のように良いベットになりそうなものを選ぶことで利益を得るのではありません。毎回危険を冒し、それが正しいことを願う必要があります。Pinnacleにとっては、認識論的不確実性を最小限に減らし、オッズの効率を最大限に増やすことが最も重要なのです。