十一月 2, 2015
十一月 2, 2015

如何在有限的数据中自助找到一条出路

如何在有限的数据中自助找到一条出路
在赛季刚开始且无充分数据得出可靠的结论的时候,您会怎么做呢?在本文章中,Dominic通过两个示例解释说明,如何使用自助法缩小由于样本小产生的任何参数错误所造成的影响。

用来计算足球比赛预期值的一个重要方法就是之前的Pinnacle文章中所解释的泊松分布。在此了解更多有关如何使用泊松分布预测足球投注胜出者的信息。

这种方法基本上是根据主场球队的攻击能力及客场球队的防御能力为主场球队分配一个平均得分进球预期值。 其也适用于为客场球队计算平均进球得分预期值。

但是,赛季刚开始时,我们可能无法使用这一方法,原因是没有足够的比赛可作为样本。除此之外,如果出现一场极端的比赛,比如得分很高的比赛或一系列无进球的比赛,将极大地影响我们的估算。

这样,我们实际上就会有一个极高的参数错误。在此了解更多有关如何构建体育博彩模型的信息。

测量参数错误数量的推荐方法是使用自助法技术。自助法与我们可在其中发明样本大小的解决方案有关。

写入的时候,大部分英超球队已参加不到5场主场比赛和5场客场比赛。

例如,我可以推荐两个方法。

方法1:简捷方法

此方法涉及回置抽样,例如,通过多次选取 相同的值来创建类似的样本大小。

所以,采用莱切斯特城队的主场比赛,到目前为止对战阿斯顿维拉、西汉姆、阿森纳和水晶宫的得分进球分别为3,2,2和1。此样本中的平均进球数量为每场比赛2个主场进球。 

现在,我们使用这些值生成另一个随机样本。这个方法类似于使用蒙特卡罗模拟创建随机值。这里生成的其他几组样本可能是:

  •       样本1:2,2,2,1
  •       样本2:1,1,3,2
  •       样本3:3,3,2,2
  •       样本4:1,2,1,1

 请注意,每次抽取样本值时,两个进球被抽到的机率是一个或三个进球的两倍,而且每种情况下的平均值可能不一样;并不是每次都抽到两个进球。

 在这种情况下,每个样本的平均值分别为1.75、1.75、2.5和1.25。我们以为平均值是2,但是我们的值显示,其在1.25到2.5之间。

我们也可以通过计算大量不同自助样本来扩充样本,从而分析结果的标准偏差

方法2:我们一起疯狂吧

所以,对于莱切城的比赛,我们可能已经生成了一个预期得分进球数量。这一数值通过与泊松分布相同的方式生成,但是使用上一赛季的数据。

 我们以对战阿斯顿维拉的比赛为例,进行分析。  2014/15 英超联赛的主场平均得分进球为1.474。莱切城在19场主场比赛中得分进球18个,而阿斯顿维拉仅在19场客场比赛中让出32个进球。

所得莱切城攻击强度为1,这表示他们只是和典型的主场球队一样。另一方面,阿斯顿维拉平均让出1.684个进球。

如果这个值除以1.474,我们的得到的结果是114.29%,表示阿斯顿维拉在客场比赛中让出的进球比正常比赛多14%。因此,莱切城主场对战阿斯顿维拉时,其预期平均得分进球数为 1*1.1429*1.474 = 1.684。 

将他们所有的比赛通过相同的流程进行计算,他们每场比赛的预期平均得分进球数量如下表所示。在此我们可以看出,除了对战水晶宫的比赛外,莱切城的得分进球数量超出预期值。

这些数据显示在“差值”一行,其技术术语为残差。

球队 阿斯顿维拉 西汉姆 阿森纳 水晶宫
预期进球 1.684 1.526 1.158 1.263
实际进球 3 2 2 1
差值 1.316 0.474 0.842 -0.263

类似于适应方法1,我们现在有替换了部分残差的样本。因此,部分可能的样本残差为:

  •       样本1:1.316,1.316,0.474,0.474
  •       样本2:0.474,-0.263,-0.263,0.474

我们现在可以将这些样本残差添加到预期得分进球中以获取其他主场得分进球样本:

  •       样本1:3.000,2.842,1.632,1.737
  •       样本2:2.158,1.263,0.895,1.737

每个样本都应该有其平均值,而且我们可以使用这个值来计算不同参数中主场球队的得分进球数量。

总结

这并不是一个无需精心计算的计算,但是无需广泛的编程知识。启动您的电子表格,您就能测试可能参数的范围。请记住,尽管如此,您也需要分析客场球队预期得分进球数量的残差,应使用上述第二种方法。 

strategy-openaccount.jpg

投注资源 - 让你的投注如虎添翼

Pinnacle(平博)的投注资源是最全面的专业精选投注建议,你可以随时在线访问。我们的目标就是满足所有经验级别的需求,帮助博彩玩家变得更加博学多闻。