日常の難問を解決する方法はいろいろありますが、わたしたちは通常、従来の方法(関数)に慣れています。関数とは、一連のインプットと許容アウトプットとの関連性で、各インプットはひとつだけのアウトプットと関連しています。
例えば、ルイス・ハミルトンが日本のグランプリで優勝することを考えてみましょう。これを行う1つの方法は、最後のレース結果などの成績に影響を与える入力パラメーターの関数をつくることです。同様な戦略は、各チームのゴール率によくポアソン予想を使用するサッカーにも適用できます。(こちらの記事では、ポアソンアプローチを使用して試合結果を計算する方法を説明しています)
しかし、ハミルトンがフォーミュラ1の2014年シーズンで優勝する確率を計算する場合はどうなるでしょうか?この質問の回答は、はるかに複雑であり、単純な関数では解決できません。このようなときに数学的モデルを使用できます。
決定論的モデル
決定論的モデルは関数と似ています。すべてのインプットは分かっているので、アウトプットを計算するのは比較的簡単です。 しかし、ハミルトンがシースンで優勝する確率を計算するには、より技術的または複雑なアプローチが必要になります。
確率論的モデル
これを行うひとつの方法は、残り5つのグランプリ(日本、ロシア、米国、ブラジル、アブダビ)の結果を、モンテカルロシミュレーションでシミュレートすることです。モンテカルロシミュレーションは、結果の近似値を求めるために、任意に生成された数字を使用する技術です。これは、1つの単純な関数ではなく、たくさんの任意の変数がある、一連の結果を必要とする確率論的モデルです。
本稿を書いている時点で、メルセデスのドライバー、ハミルトン(1.568* ドライバーのチャンピオンシップで優勝する確率)およびニコ・ロズベルグ(2.510*)が世界チャンピオンシップの1位と2位。ダニエル・リチャルド(51.240*)が3位で、ハミルトンより60ポイント下です。
各レースで優勝者は25ポイントを獲得し、最後のレースではポイントが2倍になり、まだ150ポイントを入手可能なので、理論的には6位のバルテッリ・ボッタスでさえ優勝できます。扱いやすくするために、上位3名だけがチャンピオンシップで優勝する現実的な可能性があるとします。
したがって、ベッターはドライバーがポイントを獲得する上位10名全員をシミュレートするべきです。しかし、この本稿では優勝者と2位だけをシミュレートします。
これら3人のドライバーが2位まで入賞しなかったら、6ポイントを獲得したと仮定します。それはチェッカーラインを3位(15ポイント)から11位(0ポイント)の間で越えた場合に獲得する平均ポイントと近くなります。例えばシミュレーションで、ハミルトンが1位(25ポイント)、ロズベルグが2位(18ポイント)になると、リチャルドは6ポイントが与えられます。
ロズベルグ、ハミルトン、およびリチャルドは2014年の現時点までに開催された14のグランプリで、それぞれ4回、7回、および3回優勝しました。したがって、ロズベルグ:ハミルトン:リチャルド:その他の強さの比率として、4:7:3:1を使用できます。
この場合、各レースで13の起こり得る結果(A~M)があります。例えば、以下の表中の結果Iでは、リチャルドはレースで優勝しましたが、メルセデスチーム以外のドライバーが2位になっています。比率は4:7:3:1なので、リチャルドがそのレースに優勝する確率は15分の3です。ハミルトンまたはロズベルグのどちらも2位にならない確率は、12分の1になります。比率はリチャルドと彼の4:7:1を除外するからです。
したがって、リチャルドが25ポイントを獲得し、その他2人がそれぞれ6ポイントを獲得する確率は、3/15*1/12 = 1/60 になります。各結果の確率および累計ポイントが以下の表に表示されています。
コース | A | B | C | D | E | F | G | H | I | J | K | L | M |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ロズベルグ | 25 | 25 | 25 | 18 | 6 | 6 | 18 | 6 | 6 | 18 | 6 | 6 | 6 |
ハミルトン | 18 | 6 | 6 | 25 | 25 | 25 | 6 | 18 | 6 | 6 | 18 | 6 | 6 |
リチャルド | 6 | 18 | 6 | 6 | 18 | 6 | 25 | 25 | 25 | 6 | 6 | 18 | 6 |
確率 | 17.0% | 7.3% | 2.4% | 23.3% | 17.5% | 5.8% | 6.7% | 11.7% | 1.7% | 1.8% | 3.1% | 1.3% | 0.4% |
累計確率 | 17.0% | 24.2% | 26.7% | 50.0% | 67.5% | 73.3% | 80.0% | 91.7% | 93.3% | 95.1% | 98.2% | 99.6% | 100% |
これで累計値を使用して結果を予想できます。5つのレースが残っているので、0から1までの間の5つの任意の数字を生成します。これはExcelの =rand()を使って行うことができます。
各値で、表を使用してこれら3人のドライバーが獲得したポイントを予想します。例えば、最初の任意の数字が0.4215なら、26.7%と50.0%の間になるので、日本の次のレース結果Dは、ハミルトンが1位、ロズベルグが2位とシミュレートします。
各シミュレーションで、現在のドライバーの世界チャンピオンシップポイントを5つのシミュレーションレースで獲得したポイントに追加します。勝者は最もポイントが多いドライバーになります。
数多くのシミュレーションを行ってこの手順を繰り返し、少ないサンプル数のためにデータが無効にならないようにします。例えば、ハミルトンが10,000回のシミュレーションで4,000回優勝した場合、ハミルトンがチャンピオンシップで優勝する確率は0.4または40%になります。
ダイナミックモデル
ダイナミックモデルは、モデルがシミュレートされるにつれてパラメーターが改善します。
この例では、強さの比率が各レースがシミュレートされた後に変わります。データは、形、勢い、車の設定などの他の変数も考慮します。
例えば。ハミルトンが日本のGPで優勝するとモデルが予想した場合、ロシアの次回レースでの勢いを考慮します。したがって、強さの比率はロシアGPでは4:8:3:1 に変わります。
結論
結論として、数学的モデルには3つの主要なステージがあります(決定論、確率論、ダイナミック)。ステージが高くなればなるほど、より多くの技術的知識が必要になります。モンテカルロシミュレーションは後者2つで使用可能で、主な違いはダイナミックな設定ではシミュレーション自体からモデルは学習するということです。
結局、確率分布に基づくモデルは「直観」のような明確な答えを教えてはくれません。そのかわりに、モデルの答えは確率分布であり、起こり得る結果の範囲と相対的な可能性を教えてくれます。
しかし、他のモデルと同じく、モンテカルロは弱点があります。データはシステムに入力される変数に依存しているので、情報が信頼できるものでなくてはなりません。「くず入れくず出し」を避ける必要があります。ここで作成されたすべての主要な前提を批判することができます。例:
- 強さの比率は、異なるドライバーと車が特定のレースサーキットや温度に適していることを考慮していません。
- 6ポイントの属性は必ずしも現実的ではありません。3人のドライバーのそれぞれが各レールでポイントを獲得すると前提しているからです。
理想を言えば、この前提に対する結果の反応性をテストするべきです。情報が信頼できなければ、このシステムは機能しません。それが、モンテカルロモデルだけに頼るのではなく、バランスのとれたベッティング戦略と一緒にモンテカルロモデルを使用することが推奨されている理由です。
また、Pinnacleが提供しているような、常にベストのオッズを使用するべきです(当社の優れたオッズについてはこちらをご覧ください)。当社はオンラインで最高の上限金額を提供しているので、当社でベットすれば確実に最高のバリューを獲得できます。