方差与期望的公式-期望方差公式

公式大全 2026-06-17CST16:20:34

在大家脑子里，方差大约就长啥样：一个数，要么等于它自己，要么就是那个数绝对值的平方。

这听起来挺抽象，但要是你拿一个具体的例子去想，实际上特别直观。

比如咱们今天聊的这组数据：一、二、三、四、五、六。

起初别急着记公式，先看看如何算。把每个数减了个平均数，也就是 3，然后平方。一减 3 是 -2，平方是 4；二减 3 是 -1，平方是 1；三减 3 是 0，平方是 0；四减 3 是 1，平方是 1；五减 3 是 2，平方是 4；六减 3 是 3，平方是 9。把这些加起来，4 加 1 加 0 加 1 加 4 加 9，结局等于 19。

这个 19 就是方差。再看看期望，它是啥意思。期望实际上就是平均值，把所有数加起来除以个数。总和是 21，除以 6 等于 3.5。

故此方差就是 19 除以 6，约等于 3.17。大量人第一反应是不是说“嗯，方差就是离均差平方和除以 n"？确实没错，但这事儿在讲清楚之前，得先别急着背公式，得明白这背后到底在干啥。方差实际上是个“稳定性”的度量标准。它告诉咱们，这组数据的波动有多大。波动大，方差就大；波动小，方差就小。你能够把它想象成一个弹簧。你往弹簧上拉，拉得越开，它恢复原状的本事就越强，这时候弹簧的能量就越大。在概率里，这个能量就是方差。为啥大家总爱用方差讲话？出于它能直接反映数据的“散度”。

要是两个数据平均数一样，但方差不同，那数值大的那个一般比数值小的那个更“肥”，也就是离平均数更远，要么说分布更分散。

比如那组数据，方差 19 明显比方差 0 大得多。方差为 0 的情况，意味着所有数据都死死地钉在平均值那里，没有任何波动，连个颤音都没有。

这时候的数据简直就是个稳如老狗的常量。那为啥有时候数值大反而让人难受呢？这就是出于方差受平方项的影响忒大。想想看，要是数据里有个特别大的 outlier，也就是异常值，哪怕它只比平均值多 0.1，平方之后可能变成 0.01，但要是多 10，平方就是 100。

这就好比在算方差时，你不小心把 10000 这个数字炸裂成了 100，它就瞬间冲破了原本的统计范围，把整个结局拉偏了。

这时候方差就变成了一个“放大器”，它会把那些离群点的影响无限放大。这时候，大家可能会想，那用标准差行不中？标准差实际上就是方差的平方根，单位也还是跟原始数据一样，撇脱理解。

比如刚刚那个例子，标准差大约是 1.77。

这个数字比方差小了一倍多，读起来就舒服多了。大家一听 1.77，就知道这组数据的波动大约在 1.77 那个量级，比刚刚那个 19 略微好理解一点。不过，方差和标准差在计算上实际上有一帮对子。它们都遵循着矩估摸和中心极限定理的逻辑。方差是二阶矩，标准差是一阶矩的平方，要么说一阶矩的平方。

要是你用样本方差公式算出来的结局，除以的是 n，这时候算出来的方差是 5.17。但要是是无偏方差，除以的是 n-1，那就是 5.33。

为啥要注意这个细节呢？出于这涉及到统计推断。当你想从样本推断总体时，用 n-1，这叫贝塞尔校正，是为了在大样本下让估摸量无偏的。

要是直接用 n，那就是有偏的，估摸出来的总体方差会比实际的大一点。咱们回到刚刚那个例子，要是强行套用无偏方差公式，拿到的是 3.17。

要是套用有偏方差，拿到的是 5.33。

这就意味着，要是我们用标准差来衡量，样本的波动范围大约在 1.77 到 2.64 之间。

这个数字范围比方差的 1.77 要大，为啥？出于无偏方差本身就有偏差，它把小样本的波动放大了一倍多。

故此，要是你非要搞个有偏的方差，那得出的标准差自然也就偏大了。有时候，看到方差和标准差这两个数字，你会忍不住质疑。别看标准差是个好点，但方差在数学推导里更“干净利落”。出于方差是二阶矩，它消去了所有的常数项，只跟相对的距离相关。

只要数据平移要么缩放，方差不变，但均值会变。

这种“缩放不变性”在数学上贼优雅。并且，方差和期望之间有个特殊的联系，方差实际上是期望对平方的期望，记作 $E[(X-mu)^2]$。

要是你只记住这个定义，可能后面一坨计算就忘了。再说说应用场景。在质量管住里，工厂造的产品尺寸要是方差大，说明产品参差不齐，废品率高。

这时候你会特别关切无偏方差，出于你要从那组数据里抽出一个样本来估摸总体，用 1/n 是有偏的，得用 1/(n-1) 修正。在金融领域，比如分析股票收益率，方差直接拍板了一个策略的风险敞口。

要是你用标准差，风险率就是 $sigma$；要是平方了，就是 $sigma^2$ 了，风险率变成了 $sigma^2$。

这就解释了为啥金融界总爱用方差，哪怕它受异常值影响也如此大，出于风险就是距离平均值越远，损失越大的道理。你可能会问，那有没有啥办法能把方差里的“平方”这一步去掉，变成一个无偏估摸？这时候就得用到贝塞尔校正的逆运算了。在样本无偏估摸中，方差除以 n-1，标准差也除以 $sqrt{n-1}$。

要是你强行除以 n，那方差和标准差都会比你算出来的有偏方差小一个系数 $1/(n-1)$。

这就是为啥你要记住除以 n-1 的缘由。最终再总结一下，方差不是那个死记硬背的公式，它是一个衡量“能量”和“不确定性”的物理量。期望是位置，方差是离散程度。它们共同描述了一个随机变量的特征曲线。别看方差计算起来费事，特别受极端值影响，但它供给的信息量是庞大的。它告诉你，你的数据分布得有多“硬”，要么有多“松”。当你看到一个方差值，别去纠结它是不是 19 要么 5.33，而是去问自己，这个数据的波动到底能支撑多大的预测范围？好了，理论聊完了。接下来咱们持续深入探讨一些具体的例子，看看在实际操作中，面对不同的数据分布，该如何处理方差和期望的关系。

记住，统计学的核心往往就在于如何处理这些看似好办的数字背后的复杂逻辑。别光盯着公式看，去看看它们在实际世界里是如何运作的。大样本和小样本、有偏和无偏、中心化和标准化，这些概念就像硬币的两面，你翻哪面，都得看具体情况。

毕竟，最真的分布，往往就藏在这些数字的细微差别里。