ポアソンモデル(またはその確率変数)は、サッカーの得点を予測するのに使用される基本モデルです。最もわかりやすいアプローチでは、各チームの予想得点パラメーターを設定し、得点を予測します。
ポアソンモデルを簡単に説明すると、ホームチームのパラメーターは、リーグの平均ホーム得点率にホームチームの攻撃ファクターとアウェイチームの防御ファクターを掛けたものになります。前者はビジターチームの防御率にあわせて(防御力が高いと、ゴールの可能性が少なくなります)、後者はホームチームの得点能力にあわせてホームの得点アドバンテージを調整します。アウェイチームの予想得点率も同様の方法で評価しますが、アウェーチームの攻撃ファクターとホームチームの防御ファクターを使用します。
ポアソンモデルの限界
他のモデルのように、ポアソンモデルでサッカーの試合得点を予想するにはいくつか限界があります。つまり、結果が使用するパラメーターの変化の影響を受けやすいということです。
長時間が過ぎても試合が無得点のままの場合、得点能力の高いチームがテンポを抑えていることがあるため、そうしたチームにとって無得点ドローとなる実際の確率は非常に高くなります。
また、ポアソンモデルでは、予想ゴールパラメーターを設定した後、各チームのゴール数は独立していると仮定されます。具体的な防御率と攻撃率を使用して多少調整するといっても、ホームチームが5得点を決めたか無得点かに関係なく、アウェーチームが5得点を決める可能性は常に同じだと言えるでしょうか?
最も致命的な限界は、チームごとの得点ゴールの分散がゴールの期待値と等しいとする仮定です。これはポアソン分布の特徴です。過分散(または過少分散)や二変数ポアソンモデルなど、これに対処するうまいやり方はありますが、この記事の本筋から外れるものです。
こうした限界の影響の1つが、ポアソンモデルの結果と異なる可能性がある無得点ドローの確率に関する予測力不足です。ポアソンモデルは高いゴールパラメーターを持つチームの無得点ドローの可能性を低く評価する傾向があると感じています。
長時間が過ぎても試合が無得点のままの場合、得点能力の高いチームがテンポを抑えていることがあるため、そうしたチームにとって無得点ドローとなる実際の確率は非常に高くなります。反対に、ゴールパラメーターの低いチームは最初の得点をとるまでテンポを上げている可能性があります。標準のポアソンモデルはこの点を考慮しないため、無得点ドローの確率を実際より高く予想します。つまり、これはテストに基づくものではありません。誰かテストしてみようという人がいたら、ぜひ私までご連絡ください。
ドローの確率の拡張および収縮方法
無得点ドローの確率を調整するために、そうしたドローの可能性を拡張または収縮し、あわせて他の予想を調整します。これは5つのステップで説明できます。わかりやすい例で見ていきましょう。
ステップ1: チームごとに予想ゴールパラメーターを計算する
これはおそらく、自動化しない限り最も時間がかかるプロセスです。Benjamin Cronin氏が、彼のポアソン分布の記事でこの計算について見事に説明してくれています。簡潔に、ホームチームの平均ゴールパラメーターは1.7、アウェイチームは1.2と仮定します(これらはランダムな数字です)。
ステップ2: 各チームの得点ゴール数の可能性を計算する
これは公式を使って計算します。上記のリンク先で例を見ることができます。今回の場合は、その公式を使用したゴール数の確率分布を使用します。
-
|
-
|
ゴール数の確率
|
チーム
|
予想ゴールパラメーター
|
0
|
1
|
2
|
3
|
4
|
ホーム
|
1.7
|
18.30%
|
31.10%
|
26.40%
|
15.00%
|
6.40%
|
アウェイ
|
1.2
|
30.10%
|
36.10%
|
21.70%
|
8.70%
|
2.60%
|
ステップ3: スコアの確率分布を計算する
これで、さまざまなスコアの確率を掛けることができます。例えば、0-0のスコアは18.3% x 30.1% = 5.5%となります。結果は以下のようになります。他のスコア(例: 5-1)の可能性があるので、合計が100%になることはありません。また、他のスコアの確率は3.7%とします。
-
|
-
|
ホームチームのゴール
|
-
|
-
|
-
|
-
|
-
|
0
|
1
|
2
|
3
|
4
|
アウェイチームのゴール
|
0
|
5.50%
|
9.40%
|
8.00%
|
4.50%
|
1.90%
|
-
|
1
|
6.60%
|
11.20%
|
9.50%
|
5.40%
|
2.30%
|
-
|
2
|
4.00%
|
6.70%
|
5.70%
|
3.20%
|
1.40%
|
-
|
3
|
1.60%
|
2.70%
|
2.30%
|
1.30%
|
0.60%
|
-
|
4
|
0.50%
|
0.80%
|
0.70%
|
0.40%
|
0.20%
|
ステップ4a: 無得点ドローの拡張/縮小パラメーターを計算する
これには主観が入ることがあります。例えば、過去の統計から0-0の可能性は10%と仮定してみましょう。すると、5.5%を10%に増やす必要があります。
拡張パラメーターは次のように計算できます。
(0-0の推定確率)/(予測確率)=(推定確率)/(確率(0,0))
記号αを使用してこれを表すと、次のようになります。
これは、無得点ドローの確率を82%増やすことになります。5.5%から10%に増えたので、結果の合計が100%になるよう、他の確率は同じ分だけ累積確率を減らす必要があります。
ステップ4b: その他のスコアの拡張/縮小パラメーターを計算する
このファクターに記号βを使用すると、次の等式を使用できます。
β=(1-α[確率(0,0)])/(1-[確率(0,0)])=(1-推定確率)/(1-予測確率)
この場合、β=(1-0.1)/(1-0.055)=0.95となります。
ステップ5: 拡張したスコア表を再度追加する
0-0の確率にαを掛け、残りにβを掛けることで、さまざまなスコアの確率を再計算できます。次のような結果が得られ、他のスコアの確率は3.5%となります。
-
|
-
|
ホームチームのゴール
|
-
|
-
|
-
|
-
|
-
|
0
|
1
|
2
|
3
|
4
|
アウェイチームのゴール
|
0
|
10.00%
|
8.90%
|
7.60%
|
4.30%
|
1.80%
|
-
|
1
|
6.30%
|
10.70%
|
9.10%
|
5.10%
|
2.20%
|
-
|
2
|
3.80%
|
6.40%
|
5.50%
|
3.10%
|
1.30%
|
-
|
3
|
1.50%
|
2.60%
|
2.20%
|
1.20%
|
0.50%
|
-
|
4
|
0.50%
|
0.80%
|
0.70%
|
0.40%
|
0.20%
|
ポアソンモデルの調整について、どんなことがわかったでしょうか?
この記事では、無得点ドローの確率を変えてしまう従来のポアソンモデルを調整する方法を取り上げました。すべての結果の確率を調整して合計100%になるのであれば、このモデルはどんなスコアの調整にも活用できます。
これは、一部の結果の確率変化に対する唯一のアプローチではありません。例えば、Alun Owen博士は昨年6月に開催されたMathSportカンファレンスにおいて、不完全なポアソンモデルについてより良いアプローチを説明しています。
前述の通り、この調整によってポアソンモデルの限界が最小限に抑えられるわけではありません。実際、無得点ドローの仮の確率だけでなく、他の確率を同じ率のβで調整するという前提が存在します。それでも、無得点ドローを過小評価/過大評価する傾向がある従来のモデルにとっては優れた改良と言えます。