九月 19, 2017
九月 19, 2017

体育博彩系统的陷阱:相关性vs. 因果性

体育博彩系统:什么是回归分析?

使用系统来预测博彩

回归分析的陷阱

体育博彩系统的陷阱:相关性vs. 因果性

如果要保障长期的博彩利润,博彩系统是必不可少的。然而,博彩玩家们在考察结果的时候,常常会混淆资金管理和博彩系统,还会把相关性和因果性混为一谈。博彩系统是什么?如何了解相关性和因果性之间的区别?请继续阅读,找出答案。

什么是博彩系统?

不同于投注方法或者资金管理策略(提出在投注上分配本金的方法),体育博彩系统是构建于历史数据量化分析的一套结构化预测方法,这套方法的目的是打败博彩公司的利润抽水并找到正预期价值

博彩玩家们常常混淆资金管理和博彩系统——在Google上搜索“博彩系统”,大部分搜索结果都是马丁格尔拉布谢尔或者斐波那契等策略——但它们其实完全不同。

资金管理只是改变与你的投注关联的风险性质;然而从长期来看,它并不能把一种输钱的预测方法变成赢钱的预测方法。博彩系统正好相反,它试图找到体育竞技比赛中事件发生的“真实”概率。

体育博彩系统:回归分析

设计体育博彩系统时应用最广泛的方法是统计回归分析。对于不熟悉统计学术语的人们,这可能听上去有点高深,但其实只是一种估测变量之间的关系的方法。

尽管回归分析是设计博彩系统的一个有用工具,它的潜在弱点在于无法区分相关性和因果性。

其中最简单的是简单线性回归。它只需考虑两个变量,比如球队的进球数(预测变量或者自变量)以及他们赢得比赛的频率(响应变量或者因变量)。 

我在自己的第一本书固定赔率体育博彩:统计预测及风险管理中讨论过一个简单回归模型,该模型基于两支球队过去6场比赛中的相对进球优势。

使用大量的比赛作为样本(此处使用1993年到2001年8个赛季的样本),就可以画出图表,把计算的比赛评级(主队的6场比赛净胜球减去客队的6场比赛净胜球)与每种比赛结果的频率关联起来。下方显示的是比赛评级分布(自变量)对主队获胜频率(因变量)。

correlation-and-causation-inarticle.jpg

尽管图表中的单个数据点多少呈现出散布状态,仍有一个明显的线性趋势涉及到这两个变量:在球队最近6场比赛的净胜球方面,主队相对于客队的表现越好,主队会赢得比赛的可能性就越高。

图表中画出的回归线实质上描述了相对进球优势和主队获胜频率之间的一种理想化关系,没有考虑干扰或者随机的好运坏运。

我们可以用一个方程式来描述上述回归线;作为一个简单线性回归模型,它的函数形式为y = mx +c,其中y是因变量(获胜概率),x是自变量(比赛评级),比赛评级m是趋势线(以及关系强度的测量)的斜率或梯度,而c则是线与y轴交叉的常数或交点(即x = 0)。本例中的方程为:

主队获胜百分比 = (1.56 x 比赛评级) + 46.5

当比赛评级为零时(此时主队和客队在净胜球方面几乎不相上下),获胜概率为46.5%。考虑到大约46%的足球比赛的结果是主队获胜,这一数据在直观上看来是合理的。如果在过去六场比赛中主队的净胜球比客队的多十个,回归模型显示此类球队有62%的可能获胜。如果领先20个净胜球,这个概率会升至78%。 

通过回归分析,我们还能知道这种博彩系统模型可以解释多少获胜频率的变异性。在这个例子中是86%。趋势线和数据之间的极佳吻合性也说明了这一点。我们从中可以知道两个变量之间存在强有力的相关性。

使用系统来预测博彩

为了把我们的回归模型变成一个充分发挥功能的博彩系统,我们现在需要对未来比赛做出预测,用它们来辨认出含有正预期价值的投注。

资金管理只是改变与你的投注关联的风险性质;然而从长期来看,它并不能把一种输钱的预测方法变成赢钱的预测方法。

如同大多数建模方法学,标准假设都是:过去是开启未来的钥匙。如果之前比赛评级为+10的比赛的主队胜率为62%,那么对于一支在对手身上有10分进球优势的主队,就应假设这支球队赢得比赛的概率为62%。 

然后我们只需把这些概率解读为“真实”赔率,从而可以在提供更高赔率的博彩公司那里找到预期价值。通过在2001/02英格兰足球联赛中应用这个模型,在可获取的最佳主队获胜赔率上我下了526个投注,以此成功地赚取了+2.1%的净利润,相比之下,如果我仅仅盲目投注在该赛季中所有主队获胜盘口上,损失为-3.7%。

相关性vs. 因果性

一个赛季的投注仅略多于500个,这并不能保证重复在每个赛季中盈利。看上去这是个用来确认博彩系统可信赖度的合适数字,不过博彩资源的老读者知道情况并非如此。

Pinnacle(平博)关于小数定律的文章提醒我们,哪怕1,000个投注的样本数量都有可能揭示出虚假的收益模式,实际上毫无因果基础,不过只是随机发生而已。可惜的是,在接下来五个赛季中使用这个博彩系统全都导致了损失。

尽管该简单进球优势回归模型确实很好地找到了更有可能胜利的主队,但是它不保证能找到获胜可能性高于博彩公司赔率暗示的概率的球队。

不幸的是,许多博彩玩家常常在研究自己的博彩历史时曲解精密度、准确度和效度,在过程中混淆相关性和因果性。

我的模型也许在预测方面表现不错,但是看起来它并不比博彩公司用来设置赔率的模型预测得更好,确实也不比其他博彩玩家用来帮助算出赔率的模型。

如果我的模型仅仅复制博彩公司使用的模型内容,就没法长期保持住收益,收益也只是反映随机性的变幻莫测罢了。看起来它并非构建于任何有效的相关性。我的模型预测没有“引发”那些利润,因为它的准确性不比其他同质的模型更高。

精密度 vs. 准确度

当然,在所有尝试找到预期价值的博彩系统中,二元线性回归模型绝不是最精密复杂的那一个。多元回归中使用更多的自变量或预测元,它是一种能够提高预测精密度的方法。然而分析师们应当留神,这不能以牺牲准确度为代价。

在精密模型中所有量度都非常接近彼此,就如上方我的简单线性回归模型中的趋势线所示。然而精密度不能保证准确度。准确度衡量的是你离“真实”赔率有多近。精密度与随机误差有关,准确度与系统误差(又称为“偏差”)有关。 

博彩系统要想有效,就是说它真的去做该做的事情(即持续地找到有利可图的预期价值),就必须兼备精密度和准确度。效度暗示了可预测性和持续性,即我们认为的原因是否是真正的原因,我们的测量方法是否持续指向该结论。

不幸的是,许多博彩玩家常常在研究自己的博彩历史时曲解精密度、准确度和效度,在过程中混淆相关性和因果性。他们的错误在于相信过去盈利的“因”在于他们的博彩系统,然而实际上常常仅因为好运气而已。

回归分析的陷阱

尽管回归分析是设计博彩系统的一个有用工具,它的潜在弱点在于无法区分相关性和因果性。回归分析能有效地辨识出变量之间的关联,比如进球数和失球数与比赛获胜概率的关联,但是它无法确定两者之间是否有因果关系。

回归分析也许能向我们显示当巴塞罗那输掉比赛时,里奥·梅西不进一球。然而我们不能下结论,认为里奥·梅西没进球是巴塞罗那输掉比赛的原因。

如果在我们的博彩系统中没有确立因果关系和效度,我们就应该警惕它可能不比别人用的预测模型更好。技能在体育博彩中是相对而言的,在这样的背景中仅仅对未来做出预测不会让我们赚钱,我们必须在这方面胜过所有人。

投注资源 - 让你的投注如虎添翼

Pinnacle(平博)的投注资源是最全面的专业精选投注建议,你可以随时在线访问。我们的目标就是满足所有经验级别的需求,帮助博彩玩家变得更加博学多闻。