6 5, 2019
6 5, 2019

ピナクルとFiveThirtyEightの比較:予想能力の比較

FiveThirtyEightのサッカー予想モデル

FiveThirtyEightの予想モデルで利益を得ることはできるでしょうか?

ベッターにどのような価値をもたらすでしょうか?

ピナクルとFiveThirtyEightの比較:予想能力の比較

FiveThirtyEightはサッカー予想を提供していることでよく知られていますが、その予想はどれくらい正確でしょうか? ピナクルのベッティングオッズと比べてどうでしょうか? FiveThirtyEightはベッターに何か価値を提供しているでしょうか? 詳しくは続きをお読みください。

基本的に、ブックメーカーのオッズではスポーツの結果予想のそのままの確率を提示します。デシマル式で表記されている場合は、その数値を逆数にするだけで、暗示的確率が得られます(ただし、マージンを除外するために多少の作業が必要です)。たとえば、2.50のオッズ(マージンを除外済み)は、結果の確率が1/2.50、0.4、40%であることを意味します。

もちろん、ブックメーカーが必ずしも正しいとは限りません。誤りがあると、顧客は期待値を見つけ、長期的に利益を得る機会が生まれます。しかし、読者の皆さんは、少なくともサッカー試合のベッティングマーケットに関しては、ピナクルの誤りはランダムに分布していること、ピナクルのオッズは、平均すれば、何かが起きる可能性を非常に高い信頼度で反映しているという私の主張にもそろそろ慣れてくる頃でしょう。その意味では、ピナクルのクロージングオッズは最高であり、ベッターが期待できる利益を予想するのに使用できます。

しかし、サッカーの試合結果についての予想を提供するグループなら他にもあります。最もよく知られているグループの1つがFivethirtyeight.comです。これは、アメリカの統計学者であり、元ポーカープレーヤーであり、『The Signal and the Noise(シグナル&ノイズ)』の著者でもあるNate Silverが作成したウェブサイトで、政治、経済、スポーツ予想に関するブログを掲載しています。Nateは、2008年のアメリカ大統領選挙で50州のうち49州、その4年後には50州すべての結果を正しく予想して名を上げました。

スポーツファンやベッターの観点から見ると、FiveThirtyEightの試合予想は、ホーム、ドロー、アウェイの確率を明示的に提示しているため、極めて有用です。数値を逆数にするだけで、暗示的なフェアオッズを得ることができます。バリューベッターが目指すのは、ブックメーカーよりもさらに正確なフェアオッズを見つけることです。それができれば、ブックメーカーのオッズの方がロングの場合に、そのオッズにベットすればいいだけです。ベッターが長期にわたって利益を上げている場合、ブックメーカーよりも正確なオッズを手にしているという確かな証拠となります。この記事では、@PlusEVAnalyticsと共同で、FiveThirtyEightでそれが可能かどうかを調べました。

FiveThirtyEightのサッカー予想モデル

FiveThirtyEightは、2017年1月からサッカーの試合予想の発表を開始しました。ただし、結果データベースは2016年8月まで網羅しています。FiveThirtyEightの技法はNate Silverが最初に考案した「ESPNのサッカーパワーインデックス(SPI)の重訂版」に基づいており、予想ゴール数(xG)とポアソン統計分析を利用して、起こり得る試合スコアのマトリックスを生成し、そこから、ホーム、ドロー、アウェイの確率を計算します。

FiveThirtyEightは、自分たちのサッカー予想が非常に優れていると考えており、その予想は当て推量ではなく、より有用であると主張しています。この点についてはFiveThirtyEightは正しいと私も確信していますが、ピナクルの暗示的確率よりも優れているのでしょうか。検証してみましょう。

FiveThirtyEightの予想モデルで利益を得ることはできるでしょうか?

ピナクルの過去のクロージングオッズのデータベースとFiveThirtyEightから入手できる暗示的確率を合わせて、2016年8月12日から2019年3月31日までに行われた欧州サッカーリーグの16,635試合のサンプルを集め、ホーム/ドロー/アウェイの合計49,905件のオッズペアを調査しました。

20,093件のケースで、ピナクルのクロージングオッズの方が、FiveThirtyEightの確率予想が暗示する値よりもロングでした。これらのオッズ(平均4.12)の平均優位性は16.2%でした。つまり、FiveThirtyEightのオッズが、平均して、正確または効率的に反映された「真の」オッズであると仮定し、これらのオッズに均等賭けでベットしたら、約16.2%の利益を生み出すはずだったことを示唆しています。実際は、-6.0%の損失を示しています。これは、49,905件すべての価格をベットした場合の-4.3%の損失よりもさらに悪い結果となりました(ただし、統計的に有意ではありません)。

次の最初のグラフは、FiveThirtyEightの暗示的オッズが、ピナクルのクロージングオッズのベットから実際のリターンを予想できなかったことを示しています。FiveThirtyEightのオッズが効率的であるという仮説が真実であると仮定し、ピナクルのクロージングオッズをFiveThirtyEightの暗示的オッズで割ると、そのベットに対する予測リターンが得られます。

ベットを予測リターンの増分で分類(0.01単位)すると、予測リターンと実際のベッティングリターンは相関がまったく取れないことがわかります。ピナクルのクロージングオッズとFiveThirtyEightの暗示的オッズの比率に関係なく、平均リターンは約-6%の損失です。ピナクルのクロージングオッズに対して、FiveThirtyEightのオッズは予想値を一切提供しないようです。

five-thirty-eight-in-article-1.png

ピナクルが事態を好転させるとしたらどうでしょうか。ここでは、FiveThirtyEightがブックメーカー、ピナクルが予想モデルであるとしましょう。予測リターンの基準として、ピナクルの公正なクロージングオッズに対するFiveThirtyEightのオッズの比率(マージンを除外)を使用します。

FiveThirtyEightの「オッズ」をベットすると、25,557件のケースでピナクルの公正なクロージングオッズを上回り、実際のリターンは15.5%で、平均優位性15.9%(平均オッズ4.49)に非常に近くなります。この散布図から、この逆仮説の予測リターンと実際のリターンの間に強い相関関係を確認できます。傾向線の傾きはほぼ1であり、原点を通っています(グラフのy = mx + cの式を参照)。これは、平均して、ピナクルのクロージングオッズが非常に効率的であり、FiveThirtyEightはそうではないことを示唆しています。

five-thirty-eight-in-article-2.png

リンゴとオレンジを比較する

これらの調査結果を4月に私のTwitterで発表したとき、リンゴとオレンジを比較している、条件が違うではないかと指摘されましたが、それはその通りです。FiveThirtyEightでは、予想確率は試合日程より前に作成され、最終的な確率予想は、チームが1戦を残している時点で公表されます。これは、対象の試合日程よりだいぶ前になる可能性があります。FiveThirtyEightの予想は、その時点で入手可能だった情報と同程度のものにしかなりえません。

対照的に、ピナクルのクロージングオッズでは、実際の試合開始時刻まで市場で入手可能なすべての情報が反映されます。選手の怪我、チーム選択の変更、天気、ピッチの状態など、FiveThirtyEightの予想に含まれない、含めることができない要素が含まれることになります。

ピナクルのクロージングオッズと完全に公正なモデル比較を行うには、同時刻すなわちキックオフの時間にFiveThirtyEightに確率予想を発表してもらう必要があります。しかしながら、それは無理というものです。代替手段としては、FiveThirtyEightが試合の最終的な予想確率を発表した時点のピナクルのオッズを使用することができるでしょう。しかし残念なことに、ピナクルのオッズのタイムスタンプ付きデータを入手していません。また、たとえ入手したとしても、ピナクルのオープニングオッズの発表は多くの場合、FiveThirtyEightの最終予想発表より後になるでしょう。

とはいうものの、ピナクルのオープニングオッズを使用すれば、クロージングオッズよりは公正なモデル比較ができる可能性があるので、その結果を見ることにしましょう。18,952件のケースで、ピナクルのオープニングオッズはFiveThirtyEight(平均3.97)よりロングであり、オッズの平均優位性は14.2%、-4.1%の損失を示し、49,905件すべての価格をベットした場合の-4.4%の損失よりわずかに良好な結果になりました(ただし、統計的に有意ではありません)。今回も、予測リターンと実際のリターンの間には相関がほとんどありませんでした。

five-thirty-eight-in-article-3.jpg

さきほどと同様に、モデル比較を逆にして実行すると(ピナクルのオープニングオッズを「真」のベンチマークとして使用)、クロージングオッズの場合ほど正確ではないですが、やはり一致に近く、はるかに良い相関関係がありました。FiveThirtyEightの「オッズ」をベットすると、25,775件のケースでピナクルの公正なクロージングオッズを上回り、実際のリターンは12.8%で、今回も平均優位性14.8%(平均オッズ4.54)にかなり近くなります。

シグナル&ノイズ

Twitterにオープニングオッズのデータを掲載すると、この記事の共同執筆者である@PlusEVAnalyticsは、「FiveThirtyEightがピナクルより優れているかどうかを自問すれば、答えは明らかでしょう」とコメントしました。

おそらく、ピナクルの方が優れているという答えになるでしょう。ここまででわかったことはすべて、ある程度はわかりきったことです。ピナクルの予想確率と比較すると、FiveThirtyEightの予想確率が情報的に不足するだろうということは、やはり真実でしょう。これは1つには、タイミングが原因であり、もう1つには、ピナクルの最も重要なビジネスモデルがオッズを正しくすることにあるのに対して、FiveThirtyEightでは単に楽しむことが目的であるためです。FiveThirtyEightでは予想から利益を得る必要がありません。とにかく、直接的には必要ありません。さらに公平を期すなら、FiveThirtyEightでは、賭けを念頭に置いて予想を設計していないことを認めています。

しかしながら、@PlusEVAnalyticsは興味深い思考実験を提案しました。2つの予想モデルを組み合わせて、ピナクル単独のオッズよりも潜在的に優れた予想モデルを作成することで、FiveThirtyEightの予想のシグナルとピナクルのオッズのシグナルに残差があるかどうかを明らかにできるだろうという実験です。

これまで分析は二者択一の命題として組み立てられていました。つまり、2つの予想のうちどちらがより正確に真実を表しているかという問いです。結果は決定的で、驚くようなことはありません。そこで、次のように質問を言い換え、少しひねりを加えてみましょう。

任意のZが0 ≤ Z ≤ 1の場合、任意の結果の「最終的な」確率= Z *(FiveThirtyEightのその結果の確率)+(1 – Z)*(ピナクルのその結果の確率)

これらの最終的な確率の予想値を最大にするZの値はいくつですか?

このモデルは、すべてFiveThirtyEightの予想(Z = 1に設定)、すべてピナクルの予想(Z = 0に設定)、また、その間のすべて(Zを0から1の間に設定)を使用して、最終的な確率の構築に対応できる柔軟性があります。

Zのベストバリューは、どのように決めるのでしょうか。方法はいくつか考えられますが、ここでは、最尤推定(MLE)を使用します。MLEの目的は、観測データセットに最適な「適合」を提供する未知のパラメーターの値を1つ以上見つけることです。適合度は、どうように測定するのでしょうか? 未知のパラメーターの値を条件として、観測した内容を正確に観測する尤度を確認することで測定します。

上述の定義では、モデルに単一のパラメーターZが含まれます。Zに任意の値が与えられると、データセットの試合ごとに、Zのその値に基づいて最終的なホーム/ドロー/アウェイの確率セットを計算できます。試合ごとに、観測したことを観測する尤度は、最終的なホーム/ドロー/アウェイの確率と一致します。試合の結果は、ホームウィン、ドロー、アウェイウィンのいずれかとします。たとえば、H/D/Aの確率が0.5、0.3、0.2の場合、結果がドローであれば、観測したことを観測する尤度は0.3です。

すべての試合は独立事象であるため、観測した結果の完全な集合を観測する尤度は、個々の試合の尤度の積になります。この積が求める値であり、Zを調整することで、この値を最大化しようとするものです。

残念ながら、16,635個の確率の積は無限小です。16,635試合のパーレーと考えてみることができます。Excelなど、特定の閾値より小さい数を処理することができないソフトウェアツールを使用してMLEを解くと、計算上の問題を引き起こし、閾値よりより小さい値はゼロに切り捨てられます。

この問題は、代わりに尤度の対数を最大化することで回避できます。尤度の絶対値はMLEの手順とは無関係です。重要なのは、その尤度がパラメーターの調整に合わせてどのように変化するかということであり、いわゆる「対数尤度」の最大化は数学的に等価です。

最終的な試合確率の対数を取り、さらに、それらの積の代わりに、対数尤度の合計を取ることにしましょう。この分析をデータセットで実行すると、次の結果が得られます。

  • ピナクルのクロージングオッズを使用すると、対数尤度は、Z = 0のときに最大化されます。つまり、FiveThirtyEightの予想とピナクルの予想のみを考慮する場合、FiveThirtyEightは「最終的な」予想モデルに何も効果的に寄与しません。

  • ピナクルのオープニングオッズを使用すると、対数尤度は、Z = 0.04のときに最大化されます。つまり、FiveThirtyEightは「最終的な」モデルに約4%寄与します。

モデルの英知

興味深いのは、この2つの結果の2番目です。どちらか一方を選択しなければならないとしたら、ピナクルのオープニングラインの方が、客観的に見てFiveThirtyEightの予想よりはるかに優れた予想値を提供します。しかし、次のようにひねってみるのはどうでしょう。

4% x FiveThirtyEightの予想+ 96% x ピナクルのオープニングラインで構成される加重平均が、2つの予想のいずれかが個々に提供する予想値よりも優れた予想値を提供する!

ベッターにどのような価値をもたらすでしょうか? 実際のところ、それほど多くの価値はもたらしません。4%は有用というには小さすぎて、統計的に有意でさえないかもしれないからです。でも、Zがもっと大きかったらどうでしょうか。さらに、予想が2つだけではなく数多くあり、それぞれの予想に固有のZがあるとしたらどうでしょうか。これは「集合知」理論の変形であり、別々の予想を組み合わせると、それ単独で、複数の予想の最善よりもさらに有益になりうるということを述べています。

本質的に、これがピナクルのオッズを(平均すると)極めて正確にしている理論です。ピナクルでは、最も熟練した知識豊富なトレーダーがラインを設定しています。さらに、顧客を拒むことなく他の賢いベッターがプレーすることを認め、それにより、これまで以上に正確で賢いものになるようにピナクルのラインを調整することを促進しています。ピナクルのクロージングオッズは実質的に「予想モデルの知」を表し、そのオッズは「最終的な」結果の確率を反映します。これこそが、FiveThirtyEightがピナクルにかなわなかった理由と言えるでしょう。

ベッティングリソース - あなたのベッティングをパワーアップ

オンライン最高クラスの充実度を誇るピナクルのベッティングリソースでは、専門家によるベッティングのアドバイスをご覧いただけます。ベッティング経験の長さを問わず、ベッターの皆様がパワーアップできる知識をお伝えすることが目的です。