サッカーの目的は、相手にゴールを許すことなく得点を挙げること。シンプルに聞こえますが、実際にはランダム性や運などの要素が絡んでくるため、チームが必ずしも「実力にふさわしい」結果を得られるとは限りません。
だからこそ、スポーツベッティングの世界ではデータ分析や、ゴール期待値のような指標が役立ちます。これらの数字を通じて、パフォーマンスをより統計的な観点から分析し、「負けたのは運がなかったから」という主張に確固たる根拠を与えることができるのです。
シュートは得点するための決定的な攻撃であり、よってシュートデータはあらゆるゴール期待値モデルにとっての要となります。
ゴール期待値(あるいは省略して「xG」)は、サッカーチームが活用するデータ分析の一形態であり、ベッターの間でも徐々に人気が高まっている指標です。ゴール期待値のデータはネット上で広く公開されていますが、その計算には異なるモデルが用いられるため、すべてが同じ数値になるとは限りません。
モデルには単純なものも複雑なものもあります。以下、異なるゴール期待値モデルの仕組みを説明していきます。それでは、これらのモデルを支えるメカニズムや、導かれる結果の違いを見ていきましょう。
基本的なシュートデータを活用する
Andrew Beasleyは以前の記事で、基本的なシュートデータのモデルを使ってゴール期待値を計算する方法を説明しています。シュートは得点するための決定的な攻撃であり、よってシュートデータはあらゆるゴール期待値モデルにとっての要となります――サッカーの試合では得点を左右する事象が無数に存在しますが、ゴールの成功率という特定の結果を予想する上で、シュートがもっとも重要であることは疑いようがありません。

このモデルでは、世界最大級のスポーツデータ企業Opta社が定義する「ビッグチャンス」――プレイヤーによる得点が合理的に期待される状況――の概念と、ペナルティエリア内外からのシュートデータを活用した、シンプルなアプローチが採られています。
過去5年間のPremier Leagueシーズンのシュート成功率に基づけば、ビッグチャンスでのxG値は0.387(38.7%の確率で得点が入る)、ペナルティエリア内からのシュートでの値は0.070、ペナルティエリア外からのシュートでの値は0.036となります。
シュートデータの詳細な分析
サッカーのピッチは広大であり、様々な角度からシュートが放たれます。こうしたアングルは得点の成功率を左右しますし、用いるモデルがシュート位置の詳細な分析を取り入れているかに関係なく、そのゴール期待値の結果に影響を及ぼします。

Andrew Beasleyの基本的なゴール期待値モデルに似ていますが、この種のアプローチではシュートが蹴られた位置をより細かく分析して、各シュート位置のxG値を割り出します。手っ取り早いのは、ゴールまでのシュートレンジをグリッドで分割し、各シュートをグリッドに割り振っていくやり方です。
こうしたモデルを活用する利点は、プレイヤーがゴールの正面から直接シュートした場合(得点する可能性が極めて高い)と、鋭角なアングルからシュートした場合(得点する可能性はずっと低い)の差や、そのシュートがヘディング(より得点しにくい)によるものか、キック(より得点しやすい)によるものかという点を考慮しているということ。
Paul Rileyのモデルは、シュート位置データを多少高度なアプローチで分析し、xG値のモデルを構築している好例です。
攻撃プロセスを考慮する
もちろん、シュートが成功する確率は、単にそのシュートがどの場所から、体のどの部位を使って放たれたかによって決まるわけではありません。シュートへと至るプレーの過程も、そのチャンスの質に関係してきます。
いくつかのモデルでは、単純に蹴られた位置に基づいてシュートのxG値を割り出すのではなく、どうやってシュートチャンスが生まれたか(クロス、スルーパス、カウンターアタックなど)を考慮し、シュートが打たれた状況(ドリブルで突破したあとのシュートか、セーブ後のこぼれ球のシュートかなど)をより詳細に分析しています。

言うまでもなく、この種のモデルの構築と維持には膨大なデータや情報が必要になります――サッカー分析コンサルタントの11tegen11のxGモデルは、様々な攻撃プロセスを考慮した上で、シュートのxG値を割り出している、ゴール期待値モデルの一例と言えるでしょう。
ディフェンスがxG値に与える影響
ゴール期待値をモデル化する上述の3つの手法はいずれも、あるチームが1試合またはシーズン全体で、どのくらい得点を挙げられるのか概算を得るのに役立ちます。もっとも、得点機会を潜在的に左右する変数は他にも存在します。
いくつかのモデルでは、単純に蹴られた位置に基づいてシュートのxG値を割り出すのではなく、どうやってシュートチャンスが生まれたかを考慮し、シュートが打たれた状況をより詳細に分析しています。
サッカーは攻撃だけのスポーツではありません。守備側のポジショニングや、敵の得点機会を減らすことも、攻撃と同じくらい重要です――ディフェンダーはその守備によって相手のシュート方法を変化させ、最後の修正を余儀なくさせて、より得点するのが困難な状況を作り出せるのです。
全体的な攻撃プロセス(どうやってチャンスが作られ、どこでシュートが蹴られたのか)の分析に加え、敵ディフェンダーまでの距離や、それらがシュートの質に及ぼす影響を考慮に入れることで、いっそう精緻なゴール期待値モデルが完成します。
すなわち、キーパーやディフェンダーの位置と、シュートが蹴られた位置を照らし合わせて検討することにより、もっとも正確なゴール期待値モデルを作り出せるかもしれません。
もっとも正確なゴール期待値モデルとは?
異なるゴール期待値モデルの仕組みは分かったので、次はどのモデルがもっとも正確な結果を生んでいるのか分析していきましょう。下の表は、2016/17年のPremier Leagueシーズンにおける、各チームの実際の得失点差(GD)を、上述の異なるゴール期待値モデルの予想した得失点差(xGD)と比較したものです。
チーム
|
実際のGD
|
モデル1のxGD
|
誤差
|
モデル2のxGD
|
誤差
|
モデル3のxGD
|
誤差
|
Arsenal
|
+33
|
+12.5
|
-20.5
|
+17
|
-16
|
+15.39
|
-17.61
|
Bournemouth
|
-12
|
-6.80
|
+5.20
|
-15
|
-3
|
-13.76
|
-1.76
|
Hull City
|
-43
|
-33.80
|
+9.20
|
-35
|
+8
|
-38.88
|
+4.12
|
Burnley
|
-16
|
-19.20
|
-3.20
|
-26
|
-10
|
-21.06
|
-5.06
|
Chelsea
|
+52
|
+25.90
|
-26.10
|
+31
|
-21
|
+31.91
|
-20.09
|
Crystal Palace
|
-13
|
-1.50
|
+11.50
|
-5
|
+8
|
-6.05
|
+6.95
|
Everton
|
+18
|
+5
|
-13
|
+1
|
-17
|
+1.82
|
-16.18
|
Sunderland
|
-40
|
-27.40
|
+12.60
|
-26
|
+14
|
-30.56
|
+9.44
|
Leicester City
|
-15
|
-7.60
|
+7.40
|
-7
|
+8
|
-6.65
|
+8.35
|
Liverpool
|
+36
|
+25.30
|
-10.7
|
+33
|
-3
|
+31.87
|
-4.13
|
Manchester City
|
+41
|
+41.80
|
+0.80
|
+44
|
+3
|
+51.13
|
+10.13
|
Manchester United
|
+25
|
+25
|
0
|
+24
|
-1
|
+29.48
|
+4.48
|
Middlesbrough
|
-26
|
-21
|
+5
|
-25
|
+1
|
-22.46
|
+3.54
|
Southampton
|
-7
|
+6.60
|
+13.60
|
+8
|
+15
|
+8.15
|
+15.15
|
Stoke City
|
-15
|
-0.60
|
+14.40
|
-2
|
+13
|
+0.45
|
+15.45
|
Swansea City
|
-25
|
-21.70
|
+3.30
|
-20
|
+5
|
-27.34
|
-2.34
|
Tottenham Hotspur
|
+60
|
+32.50
|
-27.50
|
+30
|
-30
|
+31.04
|
-28.96
|
Watford
|
-28
|
-12.20
|
+15.80
|
-13
|
+15
|
-16.14
|
+11.86
|
WBA
|
-8
|
-11.80
|
-3.80
|
-7
|
+1
|
-8.52
|
-0.52
|
West Ham United
|
-17
|
-11.10
|
+5.90
|
-7
|
+10
|
-9.83
|
+7.17
|
ここで取り上げた各モデルの精度を評価するには、平均二乗誤差(RMSE)とも呼ばれる、平均平方根偏差(RMSD)を求めるのが最適でしょう。具体的には、各チームの実際の得失点差と予想の得失点差の誤差を二乗し、それらの誤差の平均値を計算した上で、その平均値の平方根を求めます。
|
モデル1のxGD
|
モデル2のxGD
|
モデル3のxGD
|
RMSD
|
12.92
|
12.55
|
12.01
|
見てお分かりのように、2016/17年のPremier Leagueシーズンの得失点差を予想するという点において、3つの異なるアプローチの結果は信じられないほど似通っています。様々なレベルのデータが使われたにもかかわらず、3つのモデルの精度の差はRMSDで見ると、わずか0.91の数値内に収まっているのです。
もっとも、1シーズン(380試合)というサンプル数は、特定のモデルの優劣を何らかの確信をもって断言するには、十分とは言えません。さらに1試合ごとのRMSDを計算すれば、各モデルの精度に関してさらなる知見が得られ、それらのモデルが1試合の得点数をどこまで正確に予想できるのか、見極められる可能性が高まりそうです。
ゴール期待値についてもっと知りたいですか?
ゴール期待値についてもっと知り、その知識をベッティングに応用したいという方は、Andrew Beasleyがこれらの指標をPremier Leagueベッティングに応用する方法について執筆しています。
また、TwitterでPaul Rileyや11tegen11をフォローし、2017年9月10日(地域による時差にご注意ください)に行われる、ゴール期待値をテーマにしたピナクルの「ディスカッションデー」に参加することもできます。
