- |
- |
- |
X1 |
Y1 |
Z1 |
ph |
pd |
pa |
ph |
ph + pd |
ph + pd + pa |
0.211 |
0.245 |
0.544 |
0.211 |
0.456 |
1 |
Pinnacleは特にサッカーのような人気のあるベッティングのスポーツにおいて、効率的なベッティング市場として知られています。こういった市場がいかに、またはなぜ効率的なのかについては、多くの分析がなされてきましたが、以前よりさらに効率が増しているのでしょうか? 詳しくは続きをお読みください。
Pinnacleのベッティングリソースについて執筆を重ねるにしたがい、読者は市場の効率性という私の話に慣れ親しんでいくことでしょう。簡単に言うと、効率性とはまさに正確性のことです。ベッティングプライスの市場が効率的だと言う場合は、つまりそのプライスが特定のサッカーの試合結果の本当の確率を正確に示しているという意味になります。
人によってはこのコンセプトはかなり分かりにくいかもしれません。問題は、オッズは確率を表しますが、結果は勝つか(100%)負けるか(0%)の二者択一であることです。その意味ではオッズはすべて不正確です。結果を反映していないからです。結果はイベントの起こり得る事象のひとつにすぎないが、実際にどの事象が起こるのかは不確実性という特性の中に隠れているということを理解するには、少しばかりの想像力が必要です。
- 参照記事:「不確定性」というベッティングの性質
数え切れないほどのサッカーの試合を行えば、ホームチームが勝つ場合、引き分ける場合、アウェイチームが勝つ場合といった結果の分布が分かります。この分布をいかに上手く暗示的確率に反映するかによって、基本的なベッティングのオッズの正確性または効率性を測定する手段が得られます。
サッカー市場の正確さはどのように計測するのでしょうか?
残念なことに、Pinnacleのサッカーのベッティング市場の正確性を測定しようとするときに私たちが扱わなければならないことのすべては実際の結果です。私たちは本当の基本的な確率が実際どのようなものなのかを知りようがありません。オッズが実際の結果をいかに良く反映しているかを測定するためには、確率的な予測の正確性を測定する、いわゆる得点ルールを使用できます。
Pinnacleは既にベッティングリソースの記事で、よく知られた得点ルールのひとつであるブライアスコアを公表しています。さらにイグノランススコアというルールもあり、これはシャノンエントロピーや任意の変数が取り得る結果に固有の情報に関連するものです。この記事では別のスコアを紹介します。それが階層別確率スコア(Ranked Probability Score:RPS)です。
階層別確率スコア(Ranked Probability Score:RPS)の理解
階層別確率スコア(RPS)は隔たりや順序を考慮する確率的な結果のための得点ルールです。結果と比較したサッカーのオッズの正確性をスコア化する場合、この方法では引き分けはアウェイチームの勝利よりもホームチームの勝利により近い(逆の場合も同様)と見なします。この方法はサッカーでは2012年に学術的資料で最初に使用されました。RPSの計算式はこのようになります。
ここでのrは起こり得る結果の数(サッカーの試合のベッティング市場においては3)、pjとejは位置jにおける確率の予測値と実際の結果です。定性的に言えば、RPSとは予測と実際の結果の累積分布間の差異の二乗の合計値を表し、0(予測が完璧)と1(予測が完全に外れ)の間の値になります。実例を見て行くと、少しは分かりやすくなるでしょう。
2020年3月8日のマンチェスターユナイテッドとマンチェスターシティの試合での、(ブックメーカーのマージンを除いた)フェアオッズから始めます。平均的な市場に基づき、ホームチームが勝つ確率、引き分け、アウェイチームが勝つ確率(ph、pd、pa)はそれぞれ0.211、0.245、0.544でした。実際にはマンチェスターユナイテッドが勝ち、ehは1でedとeaは0でした。
ではまず累積の予想確率を計算してみましょう。最初の表はその方法を示しています。
それでは結果について同じ計算をします。
最後にそれぞれの起こり得る結果について、二者の差異の二乗を計算し、合計して2(rが3なのでr-1は2になります)で割ります。
今回は最も予測しにくい結果となったので、RPSはかなり高くなっています。マンチェスターシティが勝っていれば、RPSは0.126でした。
隔たりを考慮する得点ルールを採用する利点のひとつは、両チームがまったく対等となる引き分けに対してより低いスコアを生み出せることです。3月7日にバーレーはトッテナムと引き分けました。勝つ確率の予想値は両チームとも同じ(35.7%)でした。3種類の結果のうち、引き分ける確率は実際に28.7%と最も低かったのですが、RPSは0.127でした。どちらかのチームが勝っていれば、この試合のRPSは0.270になっていました。
引き分ける確率が最も低かったにも関わらず、少なくとも得点ルールの視点からすれば、このモデルの確率(この場合はオッズ)がいかに良く現実のイベントを反映しているか、このことから直感的に理解できます。もっとも、その根拠については様々な意見があるのも確かです。
階層別確率スコア(RPS)を使って市場の効率性を見積もる
理論的には、試合のサンプルから平均RPSを計算して、市場のベッティングプライスの効率性を見積もることができます。スコアが低いほど市場での効率が良く、オッズのモデルがより正確です。私は2007年から2017年に行われた国際的なサッカーの試合の多くのサンプル(n = 162,282)についてこの計算を行いました。Pinnacleのクロージング試合オッズの平均RPSは0.2046でした。
より小規模なリーグでは情報が少ないため、より不確実性が増しばらつきも多くなります。よってPinnacleは、お客様がエラーのより大きな可能性に乗じないように、お客様の賭け金を制限しています。
何らかの基準点がないと、その数値が意味するところやベッティングオッズの正確性について言っている内容を知ることは難しいものです。個別の試合レベルでは、結果論的な意味においてはすべてのオッズは「間違い」であることは、既に見てきました。しかしどのくらい間違っているのでしょうか? 完全なスコアは0ですが、もちろんどんなオッズのモデルでもそれを達成することはできません。
考えられるもっともシンプルなオッズのモデルは推測です。Excelの乱数発生器を使って、ホームチームの勝利、引き分け、アウェイチームの勝利の確率をランダムに作成し、実際の試合結果の同じセットに基づくRPSを計算してみました。モンテカルロシミュレーションでの平均RPSは0.293でした。明らかに、予想モデルとしてPinnacleのクロージングオッズはランダムな推測(実に451標準偏差程度です)よりも統計的にはるかに優れています。
しかしサッカーファンなら誰でも、少なくとも平均すると、ホームチームが勝つ確率は引き分けやアウェイチームが勝つ確率よりずっと高いことを知っています。歴代の試合のデータベースをほんの少しチェックすると、約45%の試合でホームチームが勝利し、引き分けが約27%、アウェイチームが勝つ確率は28%であることが分かります。ではこの値をこのサンプルの全試合に使用したらどうなるでしょうか? となるとRPSは0.225に落ちます。これはランダムよりは正確ですが、Pinnacleのクロージングオッズの正確性には遠く及びません。
オープニングオッズ対クロージングオッズ
Pinnacleのオープニングオッズとクロージングオッズは、どのように比較するのでしょうか? 直感的に、ほとんどの人はベッティング市場が成熟すると、より多く賭けられる金額を反映してより多くの行動と意見が起こり、オッズが先鋭化することを理解しています。
試合のサンプルの平均RPSは0.2059でした。この値はクロージングプライスの場合よりも高いのですが、その差はわずかです。こうしたわずかの差が、市場のオープニングとクロージングの間のプライスの効率性を上げる証拠になるでしょうか?
それをチェックするひとつの方法は、このRPS値がどれほど幸運か、または不運かを見ることです。試合の結果はかなりの部分が偶然に支配されることを思い出してください。これは偶然の不確実性または統計的不確実性として知られています。毎回同じ結果が出ることはありません。実際の結果は、3の162,282乗回の起こり得る事象(私はこの数値を約77,000桁と見積もっています!)に対して3種類の結果のひとつだけです。
実際の結果を使わずに、無作為化してみましょう。Pinnacleのオープニングとクロージングのオッズ自体でその確率を決定して、モンテカルロシミュレーションでRPSの期待値の範囲がどうなるのかを見てみます。
クロージングオッズではRPSの期待値(平均)は0.2045で、その標準偏差は0.0003でした。つまり、クロージングオッズのモデルでのRPS値の約2/3は0.2042から0.2048の間の値になりました。この範囲には実際の結果のRPSが含まれていました。約99.8%が3標準偏差内、つまり0.2036と0.2054の間に収まりました。同様に、オープニングオッズの平均は0.2056で、標準偏差は変わらず0.0003でした。
オープニングオッズとクロージングオッズの実際のRPS結果の差は0.13(または4標準偏差以上)なので、これは2種類のオッズモデルの間に統計上の大きな差があることを示しています。つまり、クロージングオッズは全くのところオープニングオッズよりも効率的(または正確)であることを暗示しています。同様に、実際の試合でのオープニングオッズとクローニングオッズのRPSにおける片側t検定では、p値は約0.001です(大体3標準偏差強に相当)。
Pinnacleのサッカー市場はより効率化されたでしょうか?
このリソースのタイトルに戻って考えてみましょう。Pinnacleのサッカーの試合でのベッティングオッズは、時と共により効率化されたでしょうか? 私はRPSを暦年ごとに分析し、以下のチャートにその傾向をプロットしました。
年とともにはっきりとした差があり、実際の結果のランダム性だけでなく、年ごとの昇格や降格、チームの要員やチーム状態によって試合内容が変わる場合が想定されるものの、効率性はより高まっている傾向が見られます。
興味深い点として、クロージングプライスはオープニングプライスよりもより速く効率的になっていることが分かります。オープニングプライスの平均RPSは、Pinnacleのオッズ設定モデルの正確さを反映しています。対照的に、クロージングオッズの平均RPSは、Pinnacleのモデルに加えてそのお客様の全モデルを反映しています。クロージングプライスは2007年から2017年に相対的にさらに効率化したように見えますが、これは大勢のお客様がPinnacleと、また結果的にはお客様同士で、かつてなく予測の正確さが増す方向に「せめぎ合って」競争したことを示しています。
どのサッカーリーグが最も効率的でしょうか?
小規模であまり効率的でない市場では、大勢の顧客が活発に取り引きする大市場よりも、ブックメーカーを打ち負かすのはずっと簡単だということがよく言われます。まったく理にかなった意見です。特にPinnacleは、リスクを管理するために具体的にリーグに応じて掛け金の制限額を変えて設定しています。
より小規模なリーグでは情報が少ないため、より不確実性が増しばらつきも多くなります。よってPinnacleは、お客様がエラーのより大きな可能性に乗じないように、お客様の賭け金を制限しています。ヨーロッパのマイナーリーグの下位クラスでは、賭け金の制限額をほんの数百ドルに設定しています。一方、Premier LeagueやChampion Leagueの試合での制限額は45,000ドルです。
- 参照記事:ベッティングでの競争の結果
以下のチャートは、最初のチャートのデータを「大規模」と「小規模」のサッカーリーグ/大会に分類して分析しています。「大規模」と「小規模」の分類の選択はやや恣意的で主観的ですが、常識に沿ったものだと思っています。つまり、「大規模」とはイングランド、スコットランド、スペイン、イタリア、ドイツ、フランス、さらにChampions League、Europa League、European Cup、World Cupの最高クラスを含み、全サンプルの約15%に及びます。
重要なポイントがふたつあります。まず、「大規模な」市場は「小規模な」市場より平均RPSが低いのです。実際の所、その差は統計学的には膨大です。オープニングプライスとクロージングプライスの両方に関して、偶然にこれほどの差がつく確率は約500億分の1です。次に、「大規模」市場はRPSが低くなる傾向にあり、また効率は速く高くなることが分かります。実際のところ、「小規模」の市場ではほとんど変化しません。
なぜ大規模市場には効率化がより速く進行する傾向が見られるのでしょうか? 考えられる理由としては、大規模な市場でのお客様の興味は、小規模市場でのそれよりも比較的速く増大するということが挙げられます。スポーツベッティングのオンラインやテレビでの広告が増えるので、より大きな大会に注目が集まるという点では、納得できるかもしれません。
しかし、そもそも大規模市場で平均RPSが統計的に低くなるのは、本当に効率が高まったからなのでしょうか? 確かに、それで説明がつく部分もあります。しかし他の理由として、「大規模な」大会にはより強力な本命と、高い価格が付く勝ち目の少ないチームが参加する傾向がある点が挙げられます。すなわち、3種類の結果の確率のばらつきがより大きくなるのです。
どちらの場合かを見極めるよう試みると、RPSを使うことによる根本的な問題が見えてきます。実はどんな得点ルールでもそうですが、確率的な予測の正確性について言うべきことがわかってきます。
認識論的不確実性についてはどうでしょう?
ホームチームの勝利、引き分け、アウェイチームの勝利にそれぞれ45%、27%、28%が予測されている試合のモデルを考えてみます。このモデルが正しいと仮定すると、RPSの期待値は0.225になります。試合でのランダムな影響による偶発的不確実性により、実際のスコアは0.191(ホームチームの勝利)、0.140(引き分け)、0.360(アウェイチームの勝利)となるかもしれませんが、数え切れないほどの試合を行えば、平均のRPSは0.225となります。
ではこのモデルで70%、20%、10%が予想されたとします。3種類の結果の確率のばらつきは広がり、3種類の考えられるRPSのばらつきもホームチームの勝利が0.05、引き分けが0.25、アウェイチームの勝利が0.65と広がりますが、RPSの期待値は、0.150と低くなります。
大規模な市場は小規模な市場より効率的かもしれませんが、一方、強力な本命の比率が大きくなることによって説明できることもあり得ます。
両方のモデルが正しいとすれば、ひとつまたは複数の特定の結果の確実性がより大きい場合、RPSは低くなるでしょう。これは、大規模な市場の平均RPSが小規模な市場の場合よりも低くなるという明らかな理由を示しています。「大規模」市場では、私のサンプルではオッズの約5%が70%以上勝つ確率を示していました。「小規模」市場ではわずか2%でした。同様に、「大規模」市場でのオッズの20%以上が勝つ確率は20%以下で、それに比べて「小規模」市場ではわずか13%でした。
サンプルの期間中の「大規模」な大会での、レアル・マドリード、バルセロナ、ユヴェントス、マンチェスターシティ、チェルシー、セルティック、PSG、バイエルン・ミュンヘンのような強豪チームについて考える場合には、この違いは理解できます。「大規模」な大会には強力な本命がより多く参加していて、ということは勝ち目の少ないチームも増えます。それらのチームの暗示的確率に関連してオッズは非対称になるため、「大規模」な大会では平均オッズがロングになります。
しかし、ここで私の思考実験での第二のモデルが完全に間違っていると仮定します。その代わりに、本当の確率が60%、25%、15%と仮定します。これでRPSの期待値が0.190に上がります。アウェイチームの勝つ確率がこのモデルで想定されているはずの数値よりも上がるからです。しかし、それでもRPSの期待値は最初のモデルが予測している試合のものよりも低くなり、より正確な予測のグループを暗に示しますが、それは間違っていることが分かっています。試合のこのサンプルでのあり得る3種類の結果の確率のばらつきが大きくなるため、より正確になるように見えるにすぎません。
- 参照記事: ベッティングにおけるランダム性の再検討
あるモデルでの系統的不確実性(またはエラー)は認識論的不確実性として知られています。問題は、RPSのサンプルが示される場合、系統的不確実性がどのくらい存在するかをどのようにして知ればよいかということです。単にRPSの値だけで判別することは不可能です。より大規模なサッカー市場でのオッズは、平均RPSが低いためより正確(かつ効率的)なように見えますが、それは容易に錯覚となり得ることを見てきました。平均RPSが低いことは、必ずしもより正確な予測モデルを意味しません。
ここから学べることは何でしょうか?
階層別確率スコア(RPS)はサッカーのベッティング市場で、確率的な予測の正確性を測定するために使用できます。
RPSを使用すると、クロージングオッズはオープニングオッズより効率的と思われ、時とともに相対的にその傾向が強まります。さらに、大規模な市場は小規模な市場より効率的かもしれませんが、一方、強力な本命の比率が大きくなることによって説明できることもあり得ます。
しかし、結果の確率を予測するために使用するモデル内の基本的な認識論的不確実性により、そのスコアを基本的なモデルの正確さの評価に変換する方法が制限されます。
したがって、そこからサッカーのベッティング市場の効率性に関する結論を引き出す場合には注意する必要があります。根本的な問題は、サッカーの試合の本当の確率は絶対に分からないということです。それが出来たら大富豪になれますよね。