excel计算标准差的公式-excel 计算标准差公式
在 Excel 里算标准差,实际上不用非得去念啥公式原理。平时大家为了省事,习惯用那个 DUO 图标点一下“变宽”,要么用那个库那个函数,反正最终一屏出来个数字就行。
实际上底层逻辑挺好办的,它就是在告诉 Excel:喂我一堆数,我嘛,得把这堆数散开,再算个平均数。
这个平均数就是均值,每个数都往这个平均数上凑,凑完再算,凑完的差值平方、再平均、开根号,就如此个弯弯绕。跟高中数学要么大学概率论比,哪有那么复杂?Excel 就是个计算器,别看它没机器算得那么快,但算准了,比那啥计算器靠谱多了。 说到计算标准差,那实际上就是把数据抖一抖,看抖不匀。
要是数据全是 1、1、1,那抖得特别了得,标准差就为零,意味着啥都没变;要是数据全是 10、10、10、20、20,中间都是 15,那抖得也就如此多了。但要是数据是 1、10、20、30、40 这种呢?这就全抖了。Excel 的函数名叫 STDEV.S,S 代表样本,要是你手头只有这组数,别偷懒用个平均值,得用这个来算。它有个特征,就是会把它当样本看,间或给你个略微偏一点的结局,但万一你拿去推翻自己刚刚用的平均值呢?那就得用那个带括号的那个版本,叫 STDEV.P,P 代表总样。
要是你只知道这组数的均值,让你算标准差,那得用那个不带 S 的版本。 具体如何操作,实际上就两步走。
第一步,你得先把这组数据放进一个单元格里,比如 A1 写个 1,A2 写个 2,A3 写个 3。
然后选中这三个单元格,按 Shift 键再按 Ctrl 键,再按 Enter,这样整个 A1:A3 区域就得统一了。
这时候,要是你直接在 A1 单元格里打几个字,Excel 就会自动识别这列是数据,然后去运算。
要是你想算的是这组数据的标准差,只输入这个公式,Excel 瞬间就会吐出结局。 那公式到底是啥样儿?实际上说白了就是一个逻辑链。它先把数据加起来求和,然后除以个数拿到一个平均值。接下来是关键的一步,它要把这平均数减去数据里的每个数,拿到一个个差值。
这一步最费脑,还得提个醒,要是某个数比平均值小,它就在差值里是个负数,要是大,就是正数。
然后这一步做完了,你得把这些差值平方一下。平方是个好办法,出于负负得正,平方之后全是正数,绝对值不管多大,平方后都变大,这就保证了所有数的结局都是正数,不会在计算过程中出现负数难题。
接着,你得把这平方后的所有数加起来,再除以个数。
最终,别急着开根号,得除以 n 的平方根。
说白了,就是把所有数据的波动放大再缩小一次,最终开根号,就拿到原始的波动幅度了。 举个例子,假设有五个数:5、7、6、8、9。先算平均值吧,(5+7+6+8+9)/5 = 35/5 = 7。每个数跟平均值 7 做差:5 减 7 是 -2,7 减 7 是 0,6 减 7 是 -1,8 减 7 是 1,9 减 7 是 2。
这时候你得把全平方:(-2)²=4,0²=0,(-1)²=1,1²=1,2²=4。加起来:4+0+1+1+4 = 10。再除以个数 5,拿到 2。最终开根号,根号 2 约等于 1.414。
这就是这组数据的标准差。 要是你用的是那个包含括号的那个版本,比如 STDEVP,逻辑是一样的,只是最终一步除以 n 的平方,而不是 n 的平方根。出于寻思到你用的是整组数据而不是样本,理论上一个数概率出错的可能性没那么高,故此除以 n 即可。
这里有个细节要注意,要是这组数据个数正好是 2,那开根号就是 1,也就是你俩数的中位数,标准差就是 1。
要是超过 2 个数呢,那个根号就起功能了,把波动压缩。 实际上 Excel 里还有个偏方差的功能,叫 VAR。它和标准差的区别在于,它直接把结局除以 n 的平方,没有开根号。方差是用来衡量数据离散程度的,标准差才是大家最关心的那个指标,出于它把方差“还原”成了原始单位的度量。
比如身高数据,方差是 100,标准差就是 10 厘米,这才是一般/平平人一看就懂的尺度。算方差有时候在工程上用得更多,知道偏差大小就行,不需求开根号;但算标准差的时候,大家一般都想要这个方式。 有时候数据量特别大,比如几千行数据,手动算肯定不中,得用那个公式,就连得用那个函数去算。
这时候 Excel 得按 Ctrl 加 Shift,把整列选进去,然后公式就会自动遍历。
要是你发现结局不对,可能是列头有数字,要么单元格里是空白,要么全是文本。
这时候得把格式改改,要么把数字格式改成 1.2E9 这种科学计数法,不然 Excel 可能看不懂。
要是公式报错,一般是引用范围不对,要么数据源没链接上。
这时候先把公式删了,重新点一下那个图标,要么把单元格区域搞对,再试一次。 最终,算完标准差,别急着去管显著性检验要么 P 值。大量时候我们只关心数据本身离中值有多远,不管外界环境有多干扰。
只要你能把公式调通,把结局算出来,这就够了。标准差只是描述数据的一个属性,它不能告诉你数据里有没有异常值,不能告诉你因果关系,也不能告诉你未来的走向。它只是一个统计工具,一把尺子,量一量这堆数据散不散。散得越开,标准差就越大,意味着这组数据越不稳定,波动越剧烈。
反之,数据越聚拢,标准差越小。
不过,要是发现标准差特别大,比如一个数值跟别的数相差十万八千里,那可能得停下来看看,是不是中间夹了个垃圾数据,要么是不是某个年份的异常记录搞混了。
毕竟,数据清洗比计算标准差还要头疼,特别是处理那些包含文本要么日期格式的数据时,略微弄错一个单元格类型,公式就得崩溃。 总的来说,Excel 里的标准差计算公式,实际上就是个逻辑链条,把每个数都拉回来往均值靠,然后算出离散的平方和,再除以总数开根号。别看看起来挺复杂,但只要脑子转得快,先把数据放进一个范围,公式会自动处理中间那些繁琐的加减乘除和开方。
只要公式能跑通,结局就准,不用揪心精度难题,Excel 的算法精度在那儿摆着,比人算的还稳。算完标准差,多想想这组数据到底咋样,它散不开吗?散不开说明数据可靠,散开了说明数据有波动,波动大说明需求进一步分析。
这就是 Excel 算标准差的全体意义,好办直接,不绕弯子。
声明:演示网站所有内容,若无特殊说明或标注,均来源于网络转载,仅供学习交流使用,禁止商用。若本站侵犯了你的权益,可联系本站删除。
