一月 22, 2015
一月 22, 2015

如何运用标准偏差进行投注

如何运用标准偏差进行投注
作为博彩玩家,你是否意识到你能运用标准偏差预测投注结果?搞清楚标准偏差是什么,如何计算并将其应用在你的投注中。

前面的一篇文章中,我们解释了博彩玩家为什么不应单纯依赖于平均值,因为它往往受到异常值的影响,而且无法体现一组数字中的分散性情况。 

分散性可通过很多方法测量,其中之一就是标准偏差 - 表示一组数值与该组数值的平均值的差异程度。不同的数值统计或者直接使用,或者输入函数或分布的参数。

泊松分布vs 正态分布

例如,我们已经知道博彩玩家运用泊松分布模型预测一场足球比赛中每支球队的进球数。但是,这种分布只有一个输入参数(平均值),而且是一种离散型的分布,生成整数类型的输出。

泊松分布模型可直接估算进一个球的概率,而不是第25到第30分钟之间进球的概率(尽管这种模型可以通过推广来得到这种预测)。

正态分布(钟形或高斯分布)也同样流行。这是一种不同于泊松分布的模型,原因有很多种,但也是因为这种分布是一种连续分布,它基于两个参数:平均值标准偏差。

预测英超联赛的进球分布情况

作为一个测试案例,让我们来看一下足球比赛中的净胜球。每场比赛的净胜球看来呈正态分布。净胜球是主队进球数减去客队进球数得到的数,净胜球为零就是平局。

让我们看一下英超2013/14赛季的数据:

  • 曼城队录得最大的主场胜利,7-0胜诺维奇
  • 利物浦客场对阵托特纳姆时的5-0是最大的客场胜利
  • 平均净胜球是0.3789(中位数和众数 = 0)
  • 标准偏差是1.9188。

从数据可以得出很多结论。基本上最常见的净胜球是平局,分布接近于对称,偏向主队获胜一侧。但我们文章的重点是标准偏差。

标准偏差的计算

正态分布使用两个参数(平均值和标准偏差)来创建出一条标准曲线。在这张图中,大约68%的分布位于平均值两侧1倍标准偏差范围内,95%位于2倍标准偏差范围内。

在本例中我们预计68%的比赛落在-1.5399和2.2977个进球之间(即0.3789 ± 1.9188)。曲线的连续性质也有其局限性:-1.5399个净胜球是不可能的。

为了估算主队以一球取胜,可将1从离散(整数)值1移开,来表示0.5到1.5之间的连续范围。我们接下来可以计算每个值与平均值的差是几倍的标准偏差。

article-how-to-use-standard-deviation-betting-graph.jpg

这样做有一个好处就是我们可以按所示的样子重新模拟正态分布。在本例中我们需要找出橙色的阴影区面积。

显示净胜球小于1(或其连续等价值小于0.5个球)的概率是蓝色阴影面积,可以看到这个面积是52.15%。

我们并未打算过多深究这个值的具体计算,大多数电子表格软件均可以自动计算(在MS Excel中:=NORM.DIST(0.5,0.3789, 1.9188,1))。与此类似,1.5个球以下的概率是72.05%。因此我们预计这两个值之间概率为19.53%。

因此,在380场比赛中,我们估算出74.22场比赛以主队一球小胜而收场。现实中有75场比赛,因此非常接近预测结果。

通过对所有净胜球重复这个过程,我们可以对比实际和估算以不同净胜球结束的场次。

下表所示差异非常小,正态分布看来是一个很好的拟合 - (有很多方法来检验正态性,这种分布与2013/14赛季英超数据拟合得很好)。

article-how-to-use-standard-deviation-betting-graph-2.png

现在让我们假定这种分布对于当前英超赛季是正确的。所以作为一位让分投注者,你可能想知道在英超中主队赢一球或一球以上的概率是多少?因此,这相当于1 - 52.52%,即47.48%。

很明显这是一个总体的估算,适用于英超而非单独的球队 建议博彩玩家使用单独球队的数据进行计算而非英超的总体数据。

总之,标准偏差不仅仅是数据分散情况的量度,更高的数值表示集合中的数据存在更大的分散性;它还是衡量概率的重要参数,对体育博彩玩家非常有用。在未来的文章中,我们将专注于不同标准偏差如何影响概率和利差。

投注资源 - 让你的投注如虎添翼

Pinnacle(平博)的投注资源是最全面的专业精选投注建议,你可以随时在线访问。我们的目标就是满足所有经验级别的需求,帮助博彩玩家变得更加博学多闻。