第2部: ベイズ因子を使ってベッティングスキルをアセスメント

ベイズ因子を使ってベッティングの記録を分析

ベイズ因子と結論の価値仮説

ベイズ因子の欠点

第2部: ベイズ因子を使ってベッティングスキルをアセスメント
本記事の第1部ではジョゼフ・ブチダールが、ベイズ因子を用いてベッティングスキルをテストするアイデアを導入しました。ここでは彼は、実際のベッティング履歴を用いて、運またはスキルのどちらに結果が左右されるかテストできる方法を示します。この記事を読んでお確かめください 

この2部構成の記事の第1部で私は、2つの競合する統計仮説における相対的な長所の比較に利用可能な測定基準として、ベイズ因子を導入しました。当然ながらこれは、ベッティング分析において用いられます。

こちら第2部では私は、この文脈においてベイズ因子がどのように利用可能か、そして特に利益回収においていかなる水準であれスキルをベッターが持つかどうか私たちがアセスメントを行える方法の例を、3つ検討いたします。

ベイズ因子を使ってベッティングの記録を分析

いかなるスキルであれベッターが持っているかを見定める最も明白な方法は、彼らの予測手法から実現すべきと思っているものを、ブックメーカーが彼らの達成を予想しているものと比較することです。当初の段階でブックメーカーは、彼らのマージンに基づいた収入の割合を、各ベッターが失うことを予想、または少なくとも期待しています。ピナクルの主要市場においては、これは一般的に-2.5%前後となります。

私たちはベイズ因子を用いて、これ以上の成績を達成できるとベッター自身が信じている確率が、スキルの尺度を示していると見積もることができます。

第1部で記述されたエクセルのNORMDIST関数を用いて以下のチャートは、アジアン・ハンディキャップ向け尤度比(LR)とベイズ因子(BF)を描写するか、予想が+5% (H1)でオッズが1.95の場合に1,000回ベッティングを行ったベッターの点差を示します。-2.5%のマージンの場合、各ベッティングでの公正なオッズと勝率はそれぞれ、2.00および50% (H0)となります。 

チャートでは、LRとBFが観察済みの収益と異なる度合いが示されます。

bayes-factor-in-article-2.jpg

BF = 13.7とLR = 19.3が予想された場合、ベッターは+5%の収益を達成します。ジェフリーによるとこれは、運よりもスキルを通じて達成される、強力なものの決定的ではない証拠を示唆するということです。これを、0.75%(または133分の1)であるp値を比較してみましょう。

もちろんベイズ因子分析は、p値よりもはるかに控えめな結論を引き出すことになり、実際その通りです。ベッターは往々にして低いp値に騙され、これがスキルの証拠を示唆していると信じる一方、実際にはスキルを全く想定しない運のみにより起きていることの蓋然性を伝えるのみです。

+5%もの正当な結論に書けるなら、利益予想は5%であり、サッカーの試合のオッズデータの大量サンプルのテストにより、一般的に+5%の利益を得られることが明らかになります。

+5%スキルの決定的な証拠を得るべくベッターは、1,000回のベッティング後に約+7.4%の利益が必要となりますが、かかる成績を仮に達成した場合、H1の異なるバージョン(例えばH1 = 7.4%)が好まれ、当初のH1 = +5%に対して、またはH0 = -2.5%に対してテストすることができることになります。ベイズ因子分析では2つの仮説の相対的尤度を比較するだけであり、どちらかを「真実」と比較するわけではない点にご留意ください。

ブックマーカーのマージンが-2.5%である場合、観察される利益は+5%という予想されるアドバンテージに合致するという決定的なレベルの証拠(BF = 100)を達成するには、約1,675回のベッティングが必要となります。かかる記録に対しては、p値が0.08%、または1250分の1となることしょう。統計上の有意性を宣言する前に、はるかに厳しいp値しきい値を推奨する統計学者が増えています。Fooled by RandomnessThe Black Swanの著者であるナシム・タレブは、最低0.1%のp値を擁護しています。この例では、約100のベイズ因子に近づきます。

以下のチャートでは、H0 = -2.5%、H1 = +5%で観察済みの成績がH1に一致するこのシナリオの場合、ベッティングのサンプルサイズとLFおよびBFがどれだけ異なるかを示しています。H1を記述する蓋然性配分の使用のため、H1と観察結果が近似の場合にはBFは通常LRより小さくなります。これにより不確実性が増す一方、純粋な尤度率テストに使われるH1の特定の値の使用に関する信頼度が低くなります。

H1が観察からさらに離れると、上記のチャートが明確に示すようにBFはLRよりも多くくなる場合があり、これは第1部のコイントスの例で示された通りです。

bayes-factor-in-article-3.jpg

オッズの変更により、当然ながら数字も大幅に変わります。オッズが5.00の場合、H1 = +5%かつH0 = -2.5%で1,000回のベッティングを行う場合に+5%の観察済み成績だと、ベイズ因子はわずか2.89となります。オッズが大きくなると、分散や不確実性も高まります。

p値が4.57%の場合、観察者の中にはそれを行おうと思う人もいるかもしれませんが、ここでは運を排除することは不可能になります。BF = 100を達成するには、約3,500回のベッティングが必要です。同等のp値は再度、約0.08%、または1,250分の1です。7のオッズの場合、決定的なH1証拠を得るには10,400回のベッティングが必要となり、p値は再度0.08% (1,250分の1)です。タレブとジェフリーは、明らかに同じ水準にいます。

ベイズ因子を使って適合度を確認

適合度テストに準ずるものとして、ベイズ因子を使うこともできます。実際の結果が事前の予想(予測)値に非常に合致するテストの場合、当モデルが予想に即しているというしるしです。

2015年8月より私は、「真実の」結果蓋然性を決定する基盤としてピナクルのサッカー試合ベッティングオッズのウィズダム(効率)を使用する群衆の英知手法に基づいて、賭け倍率を発表し続けてきました。

この手法の仮説は、別のブックメーカーのオッズと、マージンを差し引いたピナクルのオッズの率が、予想値を提供するというものです。例えば、リバプールがマンチェスターシティに勝つという2.5のオッズをbet365が出し、マージンを除去してピナクルが2.4のという正当な価格にした場合、かかるベッティングからの予想値は2.5/2.4 = 4.17%となります。サンプルのベッティングを通じて総計された予想値は単に、それらベッティングを通じた平均期待値となります。

ベッティング履歴の予想値(H0)を特に知ることにより、各ベッティング後の実施後の収益(H1)と直接比較できるようになります。予想値と実際の収益が近ければ近いほど、予測通りに手法が機能している可能性があります。ベイズ因子により、かかる適合度比較を実現することができます。値が近ければそれだけ、予想と成績の適合が改善されます。

以下の時系列図では、時系列内の各ベッティング後の尤度率とベイズ因子の発展を示しています。

最初の1,000回のベッティング中の標準以下の成績は、予想成績(H0)が実際の成績(H1)と大幅に異なるという穏健な証拠があったことから、ベイズ因数分析では私のモデルに間違いがあると判断できなかったことを示しています。その後成績は予想された平均値に近づき、LRとBFの両方とも、1の数字から大きくはぶらつきませんでした。9,681回の試合後に予想された収益は4.18%でしたが、実際の収益は4.02%でした。

bayes-factor-in-article-4.jpg

ベイズ要素を用いることで、結論値仮説をテスト

私の著作に詳しい読者であれば、特に1X2のサッカー市場において結論値または最終オッズ(マージン前)は、勝利の確立の最高の尺度を表現しており、実際のベッティング収益の素晴らしい予測因であるという、結論値(CLV)仮説への私の支持にお気づきだと思います。

ベッターは往々にして低いp値に騙され、これがスキルの証拠を示唆していると信じる一方、実際にはスキルを全く想定しない運のみにより起きていることの蓋然性を伝えるのみです。

+5%もの正当な結論に書けるなら、利益予想は5%であり、サッカーの試合のオッズデータの大量サンプルのテストにより、一般的に+5%の利益を得られることが明らかになります。

とはいえ私は、この結論が必ずしも常に正しいものではないという可能性を受け入れています。実際2019年9月に私は、テニスの試合のベッティング市場における低能率を検討した一方で、CLVの予想値が-0.3%であるにも関わらず8.6%を出したテニスの予想屋@nishikoripicksの成績を見直していました。かかる食い違いは、少なくともテニスに関しては、CLV仮説が間違っていると非常に示唆しています。ベイズ因子を使って、それがどれだけ示唆的か見出すことができます。

繰り返しになりますが、第1部で記述した手法に従って私は、@nishikoripicksのベッティング記録における各ベッティング後に変動する尤度率とベイズ因子を計算し、以下のチャートに描きました。

このためevH0は、累積予想結論値であると想定されます。各回のベッティングごとに予想結論値は、ピナクルのマージンを差し引いた最終オッズと@nishikoripicksのアドバイスしたベッティングオッズとの割合で計算されます。例えば、彼が 2.5に賭け、マージンを差し引いた最終価格が2.45である場合、彼の予想結論値は(2.5/2.45) – 1 = 2.041%となります。

すると累積予想結論値は、以前のベッティング全ての平均値となります。evH1は各ベッティング後の現在の収益と同じとみなされ、このためevH0と同じく各ベッティング基盤により同様に更新されます。換言するなら、各回のベッティング後の@nishikoripicksの現在の収益が、実際の予想値の最高の尺度とみなされます。

bayes-factor-in-article-5.jpg

ベイズ因子が一般的には尤度率 (観察されたデータがH1に合致する場合について以前着目したように)よりも控えめであるとはいえ、両者は多くの場合同様です。約2,000回のベッティング後、@nishikoripicksの収益として予想すべきものに対して、両モデルの間で持続的かつ決定的な差異があります。 

彼の履歴の終了時においては、BF = 1,912およびLR = 2,704となります。@nishikoripicksの実際の収益が彼の予想収益の正確な尺度であると想定すると、結論値仮説がこの場合には不正確となる可能性が非常に高いことが示唆されます。 

もちろんこのベイズ因子分析は、@nishikoripicksの実際の収益が彼の予想収益の正確な尺度であることを伝えるものではなく、本分析においてそのように想定したまでです。ここでは単に、もしそうであれば、結論値仮説よりも明らかによいものであることを示すまでです。

しかし、彼は予想よりも幸運であった場合があります。彼の本当の予想収益は5%であったかもしれません。この場合、H1 = +5%とH0 = -0.3%という2つのモデルの比較により、わずか11.8というBFが示されます。

さらに、市場の不効率以外の理由により、ピナクルが[email protected]の市場活動に対応していない可能性もあります。彼やその顧客の賭け金額、さらにはそれら顧客がピナクルでそもそもベッティングを行うかどうかがわからない以上、彼らの活動がそれだけの移動に十分ではないという理由のみのため、予想した形(例えば8.6% + マージン)に結論が従わない可能性も残ります。 

結論値仮説に従って線を動かすという@nishikoripicksの失敗とは対照的に、ベッティングスキルをテストするという結論を用いた上の私の記事向けに私が分析した記録を持つ別のベッターは、オッズの動きの大半が仮説に沿うことを示しています。

この個人の2019年におけるテストのベッティング記録は、2,223回のベッティングから構成されており、予想された結論値の2.96%と、実際水準のベッティング収益の 4.37%(賭け金の変動を考慮すると、彼の実際のリターンは若干少ないが)を示しています。H1 = 4.37%でH0 = 2.96%の場合、LR = 1.22およびBF = 0.86となり、いかなるモデルももう片方より優れてはいないことが示唆されています。

彼の別のスポーツも考慮すると、今日までの2019年の彼の規則は以下の通りです: ベッティング数 = 14,333; 予想収益 = 2.92%、実際水準のベッティング収益 = 3.51%、LR = 1.25、BF = 0.88。

このベッターが目にするこの種類のオッズ変動が、運により高まる可能性を完全に排除した場合、有効なものである結論値仮説(CLVH)とかかる数字が一致することになります。@nishikoripicks は(約3%の)オッズの縮小を確かに目にするものの、なぜこれがそれ以上のものではなく、実際の彼のリターンに見合っていないかは、今後解かれるべき問題であり続けています。

ベイズ因子の欠点

私にとってベイズ因子の重大な欠点は、仮説またはモデルが真実である場合に発生するデータの蓋然性に基づく限り、依然として頻度主義の p値に非常に似たものであるという点です。Bayesの統計の本当の成功は、私たちが目にするデータが与えられると仮説が真実であるという蓋然性という、まさにその裏面と一致している点です。

これによりベイズ因子は、多少欠点を売り込んでいるのです。実際のところ、仮説が真実であるという蓋然性に基づいた完全主義的な表現が、以下に見られます。

bayes-skill-formula9.png

P(H0)とP(H1)が2つの競合する仮説が真実であるという事前確率である一方、 P(H1|D)とP(H0|D)は、観察データをもとに H1とH0 が真実となる事後確率です。

P(H1) = P(H0)の場合ベイズ因子は事後確率の割合、そして片方のモデルがもう片方よりさらに真実である可能性です。

しかしベイズの統計における問題は、モデルの事前確率がどれだけ真実であるか、私たちが往々にして知らない場合があるというものです。結論の価値仮説が真実であるという事前確率はどれだけのものでしょうか? これは、@nishikoripicksの実際のパフォーマンスが、予想値の有効な尺度であるという事前確率と同じものでしょうか? 

事前確率に関する疑念が残る一方、ベイズの分析は常に限定的なものです。しかし、「真実」を絶対的ではなく蓋然論的なものとみなし、新しいデータにより常に更新可能であるベイズの統計に関しては疑念と不確実性が多く残ります。得られるデータが多ければ、それだけ「真実」に近づくのです。

ベイズ因子とベッティングスキルについて何を学べたでしょうか?

この部分の記事では、例えばスキル対運といった自らの成績についてベッターが得られる可能性のある競合仮説や、それが起きる理由、そしてそれが予想を反映するかどうかについてテストすべく、ベイズ因子を使用できることが明らかになりました。これはまた、彼ら自身が熟練したベッターであるかどうかを特定するツールを、彼らの能力ラインナップに提供します。

大半のベッティング成績において尤度比は、計算上より複雑なベイズ因子の代替として非常に適切です。

ベッティングリソース - あなたのベッティングをパワーアップ

オンライン最高クラスの充実度を誇るピナクルのベッティングリソースでは、専門家によるベッティングのアドバイスをご覧いただけます。ベッティング経験の長さを問わず、ベッターの皆様がパワーアップできる知識をお伝えすることが目的です。