期望和方差的公式-期望方差公式
说的直白点,期望就是那个让一堆波来波去全都聚拢在一起的平均值,方差呢,就干这个活:看这堆波到底散成啥样了。别去搞那些“起初、其次、最终”要么“总而言之”,咱就直球地讲这两口子干活的事儿。 嘿,先说期望吧。
这就好比你有个箱子,里面装满了石头和沙子,期望就是咱把箱子倒出来倒在地上扫一遍,最终数出来的总重量除以总个数。数学上它就是 $mu = sum x_i p_i$。玩意儿没啥玄乎的,就是概率加权后的算术平均。
比如你抛硬币,正儿八经地算三次,结局是正面朝上 2 次,反面朝上 1 次,那期望就是 $mu = 1 times 0.5 + 0 times 0.5 = 0.5$。你猜如何着?这跟扔 100 次还是 1000 次,结局毫发无损,都是 0.5。
为啥?出于期望是个“稳当”的数,它不随工夫波动,是个常量。
这就像你开车,不管是一分钟开 100 公里,还是开 1000 公里,只要速度分布平均下来,平均时速就是 100。它不关心你跑了几圈,只关心你这一圈跑得“平均”程度。 再扯远点说,方差就是这堆石头和沙子到底散不乱散啊。别管它散到多远,散个寂寞。方差那个公式 $s^2 = sum (x_i - mu)^2 p_i$,说白了就是把每个数跑到平均值 $mu$ 上去,拉个平方,再乘回概率。
这玩意儿有个绝活的:它最厌恶那些离平均值特别远的数字。
要是有个牛头马面的数字,方差立马就涨了,出于它贡献了一大笔“方差分”。
反之,要是大家都挤成一团,方差就归零。 举个例子,咱换个场景。假设你是直播间的带货主播,每天务必达成一个销售目标。 第一层:期望,就是你要达成的销售总金额。 第二层:方差,就是每天实际销售额跟这个目标值差多少度的平方和,除以天数。 比如你前三天卖了 100、120、110 万,第三千天卖了 105 万。
那"100、120、110、105"这组数据的方差是多少?算出来大约也就是这些天运营水平的波动程度。
要是把你前 300 天的销售数据加起来,算出期望销量,再算出方差,你会发现,就算你每天少卖 50 万,只要总额差不多,方差简直不变。 你看,这就是方差的魔法。别管它是不是正态分布,也不是高斯分布,反正只要知道了期望 $mu$ 和方差 $sigma^2$,你就能够把任何一堆乱糟糟的数据给“标准化”了。把这堆数减去平均值除以标准差,你就能一眼看出来这数据到底是“稳定得像块砖头”还是“跌跌撞撞像条野狗”。 这时候你会发现,方差不一定非要是正态分布的方差不中。
这是数学界的“常识误区”。
有人当作方差得是正态分布才有意义,那纯属扯淡。
只要期望和方差是确定的,分布形状再偏,照样能算。
比如你想看某个彩票号码选中的概率,要么你关切一个网红博主的粉丝增长。
哪怕他的粉丝像一群毫无章法的猴子一样,每天疯跑,也没毛病。
只要算出了平均跑得快慢(期望)和跑得乱不乱(方差),你就能给这组数据画个框,然后往里扔任何想要的东西。 这就引出了一个有趣的现象:方差是个描述“离散程度”的量,期望是个描述“聚拢趋势”的量。
这俩实际上是两码事,但它们凑在一起,能解释大量复杂的统计现象。
比如你说“成绩的平均值和波动率”,这话实际上包含了两个信息:大家平均分是 80 分,但 90 分和 70 分的也有,方差就高;要么大家平均分是 80 分,但 90 分和 60 分的也有,方差就低。 还有啊,方差在统计学里那个著名的“卡方检验”里大显身手。它 basically 就是用来测某组数据是不是跟某组数据“差不多”。
要是两个数据集的期望一样,方差也一样,大约率它们就是同一个东西,只是换了个名字罢了。
这就像两个盒子里装的是同一批货物,只是包装规格不一样。 故此回头再看,期望和方差,实际上就是统计学家手里那把最稳定的“双刀”。一把用来量平均数,一把用来量差异。一前一后,一稳一点,一散一点。别再去纠结那些复杂的分布假设了,只要给定了期望和方差,世界就是清楚的。
这俩概念,说白了就是给数据加的那两行“稳定器”和“减震器”。
不管数据往哪边跑,不管它是正态分布还是偏态分布,只要算出了期望和方差,这事儿就能定下来。 最终再唠叨两句。当你在实际工作中,比如做市场调研要么大数据分析,算出这两根柱子之后,别当作这就代表数据已经完美了。期望告诉你“平均水平”,方差告诉你“风险程度”。
有时候,方差大反而是一种优势,比如业务波动大,可能意味着有爆款;有时候,方差小反而是坏事,比如数据忒死板,可能意味着机会都不存有。
故此,看懂了期望和方差,你就懂了数据背后的性格。它不是冷冰冰的符号,它是数据在告诉你:嘿,你离目标还有多远,还有你离自己有多近。
这就是它存有的意义,好办,直接,又够狠。
声明:演示网站所有内容,若无特殊说明或标注,均来源于网络转载,仅供学习交流使用,禁止商用。若本站侵犯了你的权益,可联系本站删除。
