标准差是概率统计中最常用的统计离差度量。标准偏差定义为每个单位的标准值与其平均值之间偏差的平方的算术平均值的平方根。它反映了一个群体中个体之间的分散程度。测量的分布结果原则上有两个特性:
1.它是一个与测量数据单位相同的非负值。
2.总量或随机变量的标准偏差与样本子集的标准偏差之间存在差异。
简单来说,标准差其实就是一组数据它的平均值的离散程度的度量。标准差大,说明大部分数值和它们的平均值相差很大;小的标准差意味着这些值更接近这个平均值。
例如,两组数字{5,6,8,9}和{0,5,9,14},它们的平均值都是7,但第一组的标准偏差就很小。
标准差是什么?标准差可以看作是不确定性的度量。例如,在物理科学中,当你要进行重复测量的时候,测量值集合的标准偏差就代表这些测量的精度。在确定测量值是否符合预测值方面测量值的标准偏差起着决定性的重要作用:
如果实际测量出来的平均值与预测值相差甚远(并与标准偏差值进行比较),则认为实际测量的值与预测值二者矛盾。这很容易理解,因为如果实际测量的值都落在某个数值范围之外,就可以合理地推断出预测值是否正确。
标准差还可以应用于投资,可以作为衡量收益稳定性的指标。标准差值越大,风险就越高,因为回报与过去的平均值相差甚远。相反,标准差越小,收益越稳定,风险越小。
比如A组和B组有6名学生参加了同一个语言测试,A组的成绩分别为95、85、75、65、55、45,B组的成绩分别为73、72、71、69、68、67,这两组的平均成绩是70分,但是A组的标准差约为17.08分,B组的标准差约为2.16分,说明A组学生之间的差距远大于B组学生之间的差距。
如果是总体(即估计总体方差),则根数除以n(对应excel函数:stdevp);
抽样的情况下(即估计样本方差),将根数除以(n-1)(对应excel函数:stdev);
因为我们接触到大量的样本,所以一般用来在根数内除以(n-1)。