方差标准差实际上就是把数据老毛头和标准差搅在一起了,别管啥数学符号,咱就直白点说。 求方差那个公式,说白了就是数大伙儿离中位数要么平均值有多远。假设你有一组数字:[1, 2, 3, 4, 5]。先把它们加起来除以 5,拿到平均值叫均值,也就是 3。接下来就是关键一步了,别嫌费事,直接算每个数字跟 3 的差,然后平方。1 离 3 差 2 平方是 4,2 离 3 差 1 平方是 1,3 离 3 是 0,4 离 3 差 1 平方是 1,5 离 3 差 2 平方是 4。把这些加起来 4+1+0+1+4 等于 10,还得除以 5,结局就是 2。

这就是方差,它告诉你这些数字普遍离中心点有两个单位如此远。 标准差呢,逻辑就好办多了,反正方差是个平方数,没法直接比较大小,得开根号。刚刚算出来的方差是 2,开根号那就是 1.414。

这意味着这组数据的波动实际上是 1.414 左右。

要是你看一组数据 [1, 3, 5, 7, 9],均值也是 5,方差算出来是 4,标准差就是 2。

这就好比你俩人的身高,一个是 160 厘米,一个是 170 厘米,高度差是 10 厘米(也就是标准差 5),但你俩的体重波动可能一样大。 说到协方差,这玩意儿跟标准差有点不一样,出于它俩行不通,出于方差是平方的,标准差是开根号,两个不一样的东西没法直接乘,那得先统一单位。

那得去乘原始数据对。假设你叫张三,李四,你们俩的身高分别是 [175, 170],体重分别是 [65, 70]。先算张三和李四的身高和体重的乘积:175 乘以 65 等于 11375,然后再算 170 乘以 70 等于 11900。把这些加起来是 23275。再算一遍身高和,175 加 170 是 345,体重和是 135。最终把那个乘积除以 345,拿到约 67.35。

这个数值叫协方差,具体来说,正数代表两人长得高、体重就差不多大,数据往一起走;负数代表是个怪胎,一个高体重就低,数据往反着走。 举个例子,假设你有一本厚厚的书,你翻了几页,又翻了几页,中间还翻了好多页,最终又翻了回来。

要是你只记下了“翻了几页”,那就是方差。出于你翻多了好多页,翻少了也没几页,反正都是翻了几页,平均下来你认定差不多。

可是你要是翻的是具体的页数,那就是标准差。翻 5 页比翻 4 页,翻 3 页,翻 6 页,这个波动比翻几页更真,更能反映真情况。 有时候我们会纠结方差标准差到底哪个好。方差是个平方数,有时候能超过 1 就连更大,比如有的数据波动极大,方差能达到 100。

这时候要是数据波动是个 100,一个 10,哪个大?方差大,但标准差才 10。

故此有时候我们挺厌恶方差的单位,出于有时候方差能挺大,有时候挺小,没法直接比较。

这时候标准差就派上用场了,只要你单位一致,如何算,标准差大就是波动大。 再聊聊协方差协方差实际上是个关系难题。

要是两个数据都往右跑,那就是协方差是正数,说明它们俩在一起时数值都变大。

要是都往左跑,那就是负数。

要是方向反之,那就是负数。

举个例子,你买彩票,中奖了挺快乐,输了挺委屈。

这时候你的情绪波动挺大。

要是另一个哥们儿也买彩票,你中奖他就高兴,你输了他也不悲伤,那他们的协方差就是正数。

要是那个哥们儿你中奖了高兴,输了就狂,那你俩的协方差就是负数,出于一场好一场坏。 数据这东西有时候挺累的,有时候让你认定这组数据波动挺大,有时候又认定差不多。方差标准差就是咱俩的度量衡。方差看的是离中位数要么平均值有多远,次数多了。标准差看的是数据均匀程度。协方差看的是两个数据之间是正相关还是负相关。 有时候你会认定方差是个平方数,没法直接比较,实际上不用纠结。

要是是同一个样本,数据波动差不多的样本,方差大就是波动大。但要是数据波动是 100,有时候是 1,标准差 10,10 就是波动大。 总结一下,方差是数据离散程度的直接度量,标准差是它开根号后的线性度量,协方差是两组数据之间关系的度量。算出来,标准差协方差在对比的时候要注意单位,方差有时候大得吓人,可是标准差更能直观告诉我们话说是不是实话。

反正要么说,要么不说,反正数据就如此回事。