スポーツベッティングシステムの落とし穴 相関関係vs 因果関係

スポーツベッティングシステム 回帰分析とは?

ベッティング予測のためのシステムを利用する

回帰分析の落とし穴

スポーツベッティングシステムの落とし穴 相関関係vs 因果関係

ベッティングシステムは、ベッティングで長期的な利益を確保するには欠かせないものです。しかし、ベッターはマネーマネジメントとベッティングシステムを混同しがちです。結果を考える際に、相関関係と因果関係を混同することもよくあります。ベッティングシステムとは何でしょうか? また、どうすれば相関関係と因果関係との違いがわかるのでしょうか? 答えを知りたければ、ぜひご一読ください。

ベッティングシステムとは

賭け金額への配分方法を示す賭け方やマネーマネジメントの戦略とは違い、スポーツベッティングシステムは、過去データの定量分析による体系的な予測方法論であり、ブックメーカーの利益率を凌駕し、プラスの期待値を割り出すことを目的としています。

ベッターはマネーマネジメントとベッティングシステムを混同しがちです。Googleに「ベッティングシステム」と入力して検索すると、ヒットするのはマーティンゲールLabouchereフィボナッチといった戦略でしょう。ただし、これらはスポーツベッティングシステムとは別物なのです。

マネーマネジメントは単純に、ベットにともなうリスクの性質を変えることはできます。しかし、長い期間をかけても、負ける予測方法を勝つ予測方法へと変えることはできません。対照的に、ベッティングシステムは、スポーツの試合で生じる出来事についての「本当の」確率を導き出そうとします。

スポーツベッティングシステム 回帰分析

スポーツベッティングシステムを構築するために最も広く使われている方法は、統計での回帰分析です。統計学用語に馴染みがない方は身構えてしまうかもしれませんが、これは変数同士の関係を予測する方法に過ぎません。

回帰分析はベッティングシステムを構築する際に便利なツールです。ただし根本的に、相関関係と因果関係を区別できないのが弱点です。

回帰分析のうち最も単純なのは、2つの変数だけを扱う線形回帰です。たとえば、あるチームの得点数(予測変数または独立変数)とそのチームが試合に勝つ頻度(応答変数または従属変数)などです。 

私は最初の本Fixed Odds Sports Betting: Statistical Forecasting & Risk Managementの中で、2チームの過去6試合における相対的なゴール優位性に基づく単純な回帰モデルについて論じました。

多くの試合サンプル(この場合は1993年~2001年の8シーズン)を使えば、算出した試合のレーティング(ホームチームの6試合の得失点差-アウェーチームの6試合の得失点差)と各試合の勝敗頻度との相関関係を表で示すことが可能です。試合のレーティング(独立変数)とホームでの勝利頻度(従属変数)の分布は下記の通りです。

correlation-and-causation-inarticle.jpg

表の各データポイントは多少散らばっていますが、2つの変数の関係には明らかに直線的な傾向が見られます。ホームチームがアウェーチームと比べて過去6試合における得失点差で上回っているほど、ホームチームが試合に勝つ可能性が高まるのです。

表の回帰直線は原則的に、ノイズや無作為による運不運を相殺したうえでの、相対的なゴール優位性とホームでの勝利頻度の理想的な関係を表しています。

このような直線は、方程式を使って説明できます。単純な線形回帰モデルなら、式はy = mx +cで、yは従属変数(勝率)、xは独立変数(試合のレーティング)、mは傾向線の傾き(および関係の強さの指標)、cは直線がy軸に交わる点を表します(x = 0)。この例では、方程式は次のようになります。

ホームでの勝率% = (1.56 x 試合のレーティング) + 46.5

試合のレーティングがゼロの場合(つまりホーム/アウェー両チームが得失点差でほぼ互角の場合)、勝率は46.5%となります。サッカーの試合では約46%がホーム側の勝利で終わることを考えると、これは直観的に理解しやすいでしょう。過去6試合においてホームチームの得失点差の合計がアウェーチームより10以上多い場合、回帰モデルではこうしたチームの勝率は通常62%と示されます。20ポイント上回っていれば、勝率は78%にまで上がります。 

回帰分析を使うことで、このベッティングシステムモデルで勝利頻度の可変性をどれだけ説明できるかもわかります。この場合は86%でした。データに対する傾向線の適合度を見れば、さらに一目瞭然でしょう。2つの変数の間には強い相関関係があることを示しています。

ベッティング予測のためのシステムを利用する

回帰モデルから十分に機能するベッティングシステムを作り出すためには、将来の試合について予想を立て、その予想を基に期待値がプラスになるベットを見分ける必要があります。

マネーマネジメントは単純に、ベットにともなうリスクの性質を変えることはできます。しかし、長い期間をかけても、負ける予測方法を勝つ予測方法へと変えることはできません。

ほとんどのモデル構築方法と同様、過去は未来への鍵という仮定が基準となります。レーティングが+10だった過去の試合のうち62%でホーム側が勝利した場合、ホームチームのゴール優位性が相手と比べて+10なら試合の勝率は62%になるという仮定が成り立つでしょう。 

こうした確率は簡単に「本当の」オッズに変換できます。つまり、より長いオッズを提示するブックメーカーの期待値もわかるのです。私はこのモデルを2001/02シーズンの英国のサッカーリーグに応用し、最高のホームチーム勝利ベッティングオッズにより、526件のベットから+2.1%のリターンを得ることができました。もし、単純にそのシーズンすべてをホームチームの勝利に賭けていたら、-3.7%の損失が出ていたはずです。

相関関係vs 因果関係 

1シーズンのベット数が500を少し超える程度では、毎シーズン利益を出せる保証はありません。こう言うと、信頼できるベッティングシステムを築くには十分な数が必要なように思われるかもしれませんが、実際は必ずしもそうではないことは、Betting Resourcesの愛読者の方ならご存知でしょう。

ピナクルの小さい数の法則に関する記事を読めばお分かりいただけますが、1,000以上のベットをサンプルにした場合でも、利益のパターン(実際は何の因果関係もなく、運に左右されているだけ)を錯覚してしまうことがありえます。残念ながら、その後は5シーズン続けてこのベッティングシステムで損失を出してしまいました。

この単純なゴール優位性回帰モデルは、どのホームチームが勝つ可能性が高いかを予想するには非常に役立ちました。一方で、ブックメーカーのオッズが示す確率以上に勝つ可能性が高いチームを予想できるという保証はなかったのです。

あいにく、多くのスポーツベッターは過去のベッティング経験を検証する際に的確さや正確さ、妥当性を読み違えてしまい、その過程で相関関係と因果関係を混同してしまいます。

私のモデルは予測する上では役に立ったかもしれませんが、ブックメーカーがオッズを設定する際に使用するモデル、あるいは他のベッターが用いるモデル(ブックメーカーのオッズの形成・変動に影響を与える)以上に優れた予測はできなかったようです。

もし、私のモデルが単にブックメーカーのモデルがやっていることを模倣しただけのものだったとしたら、安定して利益を得ることもなく、単純に無作為性を反映したものになったでしょう。どうやら、有効な相関関係に基づいたものではなかったということです。私のモデルを使った予測は、利益の「原因」を作るわけではありません。同じことをやっている他のモデルよりも正確にできるわけではないからです。

的確さvs 正確さ

当然ながら、期待値を導き出すうえで、2つの変数の直線回帰モデルが最も洗練されたベッティングシステムであるとは言えません。より多くの独立変数または予測変数を導入する重回帰は、予測の的確さを高める手段となります。しかし、これは正確さを犠牲にしたものではないという点に、アナリストは留意するべきです。

的確なモデルとは、一つ一つの測定結果が互いに近いものです。たとえば、上記で述べた私の単純な直線回帰モデルにおける傾向線にもそれは表れています。しかし、的確さとは、正確さを保証するものではありません。正確さとは、どれだけ「本当の」値に近づいたかの指標です。的確さは、偶然誤差や系統誤差をともなう正確さに関連しています(バイアスと呼ばれることもあります)。 

ベッティングシステムを有効なものにするには、当然やるべきことがあります。すなわち、利益を出せる期待値を着実に見つけることです。そのためには、的確さと正確さの両方が必要になります。有効であること、それはすなわち予測可能性と持続性です。つまり、私たちが原因と考えるものは本当に原因なのか、私たちの予測方法は繰り返し正しい結論を示せるのかということです。

あいにく、多くのスポーツベッターは過去のベッティング経験を検証する際に的確さや正確さ、妥当性を読み違えてしまい、その過程で相関関係と因果関係を混同してしまいます。彼らの間違いは、単に運が良かったので成功した場合であっても、自分の得た利益の「原因」が、自分のベッティングシステムにあると信じてしまうことです。

回帰分析の落とし穴

回帰分析はベッティングシステムを構築する際に便利なツールです。ただし根本的に、相関関係と因果関係を区別できないのが弱点です。得点数・失点数と試合の勝率など、変数同士の関係性を特定するうえで回帰分析は効果的です。しかし、一方が他方の原因であったのかを判断することはできません。

回帰分析を使うと、Barcelonaが負けるときはLionel Messiが得点しないということが示されるかもしれません。しかし、Lionel Messiが得点しないことが、Barcelonaが負ける原因であると結論付けることはできません。

ベッティングシステムで因果関係や有効性を確立できなければ、他の誰もが使っている予測モデルよりも優れた予測はできない可能性があるという点に留意すべきです。スポーツベッティングのような相対的なスキルに関しては、単に未来を予測するだけでは利益を得られませんし、他の誰よりも上手く予測ができるようにならなくてはなりません。

ベッティングリソース - あなたのベッティングをパワーアップ

オンライン最高クラスの充実度を誇るピナクルのベッティングリソースでは、専門家によるベッティングのアドバイスをご覧いただけます。ベッティング経験の長さを問わず、ベッターの皆様がパワーアップできる知識をお伝えすることが目的です。