予想ゴール数の指標は、1年半かけてサッカーの分析ブログから主流メディアへと広がりました。人々がこの指標とそのメリットを理解し始めましたが、落とし穴があることに気づいていないように思います。予想ゴール数の限界とは? 詳しくは続きをお読みください。
予想ゴール数の広がり
予想ゴール数(xG)の限界を見ていく前に、まずこの指標がどんなもので、どのように広まったのかを紹介したいと思います。簡単に言うと、xGはチャンスの質を測るものです。これは、サッカーのピッチで同じポジションから放ったシュートの多数のサンプルと比べて、あるシュートがゴールに入る「可能性」がどれくらいあるかを教えてくれます(もっと掘り下げることもできますが、それは後ほど取り上げます)。
予想ゴール数は通常、0~1の目盛りで示されます(0は必ず外す、1は必ず入る)。しかし、ゴールに入るチャンスの質をパーセンテージで表すこともできます(これは0~1のxGの数字をパーセンテージに変換するだけです)。例えば、0.5 xGのシュートはゴールする可能性が50%のシュートとして表されます。
xGはパフォーマンスの分析に最適な手段ですが(学習と改善に取り組むサッカーチーム、または新しい選手を探しているサッカーチームにメリットがあります)、他の一般的な指標(シュート数、得失点差、イーブンポイントなど)よりも予想ツールとして優れていることが証明され、サッカーコミュニティで人気が高まりました。
モデルには何が含まれ、何を教えてくれるのか?
xGを使用することに対してさまざまな議論が巻き起こっていますが、これは時々、予想ゴール数について内部の仕組みまでじっくり学んだ人たちの意見であることがあります。残念ながら、これらの批判は予想ゴール数がスポーツの伝統を汚していると考える人たちか、予想ゴール数の意味や仕組みをよくわかっていない人たちが主張しているものであることがほとんどです。
使用するデータはどのモデルにも欠かせないものですが、そのデータをどのように解釈するかも同じくらい大事です。
予想ゴール数を批判する人は、「サッカーはスプレッドシートではなくピッチ上でプレーされる」、「重要な数字は90分後のスコア」といったことを言うでしょう。こうした人たちの多くは「あそこからシュートを入れるべきだった」、「結果を出すことができず不運だった」というようなことも言いますが、これは、データを使用することでxGによる裏付け(または反証)が可能です。
予想ゴール数の否定的な概念は、根拠がなく、論理的でない理由に由来しているようですが、この指標の使用には限界もいくつかあります。予想ゴール数を使用しようとするとき、特にサッカーのベッティングの予想モデルを組み立てようとするときは、そうした欠点の見落としは問題になります。
モデルを賢く選ぶ
これは必ずしも否定的なものではありませんが、普遍的な予想ゴール数モデルが存在しないことを認識しておくことが大切です。予想ゴール数モデルは数えきれないほどあり(そのうちの多くは無料でオンラインでアクセスできるものです)、各モデルは最終的な予想ゴール数を導く独自のパラメーターセットを持ちます。例えば、あるモデルはチャンスを0.52 xGと評価するかもしれませんが、他のモデルは0.47や0.58であったり、0.60以上であったりすることもあります。
- 参照記事:さまざまな予想ゴール数モデルの分析
どのxGモデルが「一番優れている」かについてはさまざまな解釈ができ、モデルを組み立てるときにパラメーターが多い方が良いと勘違いしやすい傾向があります。シュートを打つ場所などの基本的な情報だけでなく、ゴールを狙う角度、シュートするために使用する身体の部分、アシストの種類、ディフェンスのプレッシャー量、ゴールキーパーの位置取りを加味することで、より細かなモデルを作り出すことができますが、これも過剰適合と言われるモデルの議論につながります。
サッカーにはたくさんのノイズ(無作為性)があり、xGを活用するとそのノイズを減らし、より明確なイメージを得ることができますが、予想ゴール数モデルを発展させると、物事を複雑にしすぎるリスクもあります。モデルにパラメーターを追加しすぎると、予想を導くのではなく、単にデータを反映させたものになってしまいます。
プレイヤーそれぞれの情報が必要?
xGで一番難しいことの1つは、xGが何を教えてくれるかではなく、何を教えてくれないかです。予想ゴール数は、各プレイヤー(またはプレイヤーの才能)を考慮していません。ほとんどのモデルは数千のデータベースと数千本のシュートに基づいて組み立てられますが、最終的な結果は平均の数字であり、シュートを打つ選手に限ったものではありません。
特定のプレイヤー情報が欠けていると、ハリー・ケインとパブロ・サバレタの両者がまったく同じポジションにいて同じシュートを打った場合、同じxGの数字が導かれることになります(たとえハリー・ケインの方が得点できる可能性が高いとわかっていたとしても)。
両方のチームと各選手のパフォーマンスを分析する場合、シュートを打つ選手が重要となりますが、誰がゴールにいるか(xGが考慮できない別のパラメーター)も重要となります。では、先ほどと同じ可能性を持つハリー・ケインについて考えてみましょう。彼はダビド・デ・ヘアやイングリッシュリーグ第4部のゴールキーパーに対してシュートを打つ可能性がありますが、予想ゴール数モデルで評価すると、どの相手でも得点できる可能性は同じになります。
この問題は、特定のプレイヤー(ハリー・ケインなど)が過去数年間にわたって大半の予想ゴール数モデルを上回るパフォーマンスを維持しているという事実によって浮き彫りにされています。さらに同じ期間にわたって、一部のゴールキーパー(デ・ヘアなど)は所属チームが予想ゴールアゲインスト数(xGa)を上回る一因となっています。
予想ゴール数の使用方法とタイミング
予想ゴール数の他の「問題」は、指標自体ではなくその使い方にあります。問題は予想ゴール数にあるのではなく、それを使用する人に関係しています。簡潔に言うと、xGは1試合ではほとんど役に立たず、特定の期間に対して、またはデータのサンプルが多い場合に最も効果を発揮します。
予想ゴール数を使用するとき、サッカーのベッティングの場合は、そうした欠点の見落としは問題になります。
サッカーは、得点、ピッチにいる選手の数、試合の残り時間、何がリスクか(これは特にノックアウト試合に当てはまります)など、分単位で変化する非常に流動的なスポーツです。(時と場合によりますが)予想ゴール数を単独のゲームで使用する場合、全体の物語や重要なコンテクストを教えてくれないので、数字は誤解を招くことがあります。
それが予想ゴール数と同じくらい役立つことを理解した上で、いつでも使用すべきというわけではないことを理解することも大切です。シーズンの初期、その時点の競争勢力図内でわずかな試合しかプレイされていない場合、データを歪めてしまう可能性が高くなります(しかも、これは対戦相手のレベルを考慮していません)。
国内シーズンの6試合目は、よくキャンペーンの正念場と言われています。この時点が、データが十分集まるタイミングといってよいでしょう。対処するノイズも少なくなっています。シーズンのだいたい6試合目以降に、xGは本領を発揮し、この時点以降に最も役に立ちます。
シーズンの早すぎる時期に予想ゴール数を使ってしまうことがあるように、使うのが遅すぎる(もしくはあまりにも遅すぎる)と主張する人がいます。もちろん、傾向を見るには長い期間が必要となりますが、同時にチームは特定の理由によって予想を下回ったり、上回ったりして、(回帰を待つのではなく)データ以上のものを見なければならない時がきます。
マジックナンバーはありませんが、通常の国内キャンペーンのファイナルサードでは、(xGを使用してさらに情報を得ようとしていても)特に実際のパフォーマンスをより詳しく見ることをお勧めします。
予想ゴール数が長期間役に立たないとは言っていません。xGを使用することは、チームの改善や不振を評価するのに優れた方法です。特に新しいマネージャーや新しい選手が入ったときに最適です。ただし、このデータの有用性はシーズンによって変化し、チーム内の変化の傾向はそのデータがすぐに必要なくなることも意味しています。
予想ゴール数は素晴らしいものですが、正しく使う必要があります
多くの人にとって、予想ゴール数はサッカーのパフォーマンス指標として最高に素晴らしいものです。しかし、アナリストなら誰でも、統計的な分析をする場合のコンテクストの重要性や1つの指標に頼り切ることの危険性に気付くはずです。特に一度に1試合を対象とする場合はなおさらです。
xGを使用している人はおそらくすぐにメリットに気づくと思いますが、限界も把握しておく必要があります。使用するデータはどのモデルにも欠かせないものですが、そのデータをどのように解釈するかも同じくらい大事です。(良い面も悪い面も含めて)十分に理解している場合のみ、xGの最大の可能性を引き出せます。