均方差公式用积分表示-均方差用积分表示
在讲均方差之前,咱们先不整那些虚头巴脑的“定义”,直接把你脑子里那个冷冰冰的公式拍扁了。大家平时做题,看到 $sqrt{frac{1}{n}sum (x_i - bar{x})^2}$ 这串字符,第一反应往往是“这就是方差,又是最小二乘法,务必得用最小二乘法凑出这个结局”,结局往往死磕半天,推了整整一上午的积分方程,最终愣是碰壁。
实际上不然,这个公式就是统计学给所有随机变量量纲的“身份证”,它不需求任何特殊的假设,也不需求把变量强行拉成 $1/m$ 的形式,就连不需求设 $f(x)$ 来积分。它原本就是描述一组数据离散程度的,如何撇脱如何来,直接看数值,直接算数。 那为啥我们总喜爱把它写成积分形式,就连写成 $int x^2$ 这种看起来特别复杂的样子呢?这就得聊聊数学家们为啥如此花心思了。
实际上这跟物理学里的“叠加原理”要么量子力学里的“概率幅”有点像。
你想啊,要是一个函数 $f(x)$ 代表一堆乱七八糟的噪声,那它的均方差实际上就是对这个函数整体“能量”的度量。
要是在数学界,我们习惯用积分来堆砌无穷多的点,那么 $E(X^2)$ 这个值,本质上就是一个面积,要么说是整个空间里所有可能取值对应的“阴影面积”的累积。
故此,用积分来写,不是为了数学上的严谨,而是为了直观地把“平均”这个概念具象化成“累加”。你不用管 $n$ 是多少,你只管把区间 $[-1, 1]$ 里的所有点加起来除以区间长度(要么反过来,看看平均高度是多少)。
这种视角,比单纯背定义要舒服一百倍。 举个例子,假设你手里拿着一张那种随机生成的波形图,比如正弦波加上白噪声。
要是你要量一下这张图里的“不规则度”,你会如何做?你会选一个矩形框,把图填满,看看填不满多少。填不满多少,就是均方误差。
这跟画素描一样,你拿铅笔把图涂满,涂得越满,误差越小。
要是你用积分表示,那这个“涂满”的过程就是 $int_{-1}^{1} 1 , dx$,别看看起来挺傻,但这就是最朴素的平均。而均方根(RMS)呢,就是算出这个总面积后,开根号,这就好比你说这个图形的“高度”要么“能量”了。 实际上,要是你手上有代码,要么计算器,你会发现这根本不费劲。你不需求知道 $x$ 服从高斯分布,也不需求知道 $x$ 是正态的,你只需求把 $x$ 换成你的任意函数 $f(x)$ 就行。
比如 $f(x) = e^x$,你设 $bar{x} = int e^x dx / int e^x dx$,然后算 $int (e^x - bar{e^x})^2 dx$。
这个计算过程实际上跟最值原理没啥区别,它只是让你换个角度去看。最值的原理告诉你,这个函数要是凸的,那它的平均值就是峰值;要是是平的,平均值就是它自己。均方根的公式甭管如何写,只要逻辑通顺,结局都是一样的。
你看,它是从“平均”这个根本动作出发,至于如何出手,用求导还是用积分,那是纯数学家的游戏,跟应用者一点关系都没有。 再往里深挖,你会发现这个公式在历史上是个挺妙的巧合。伽罗瓦在研究他的那个方程组时,别看这时候他才 19 岁,就连有点小毛躁,但他最早算出来的那个结局,就是后来高斯和勒让德用来拟合数据的那个公式。
要是你去看看伽罗瓦那本笔记,你会愣住了地发现,他在推导过程中,没有写任何关于“方差”这个词,但在后面他为了证明方程有解,不得不把这个数值算出来,并且用 $m^2$ 来标记。
后来高斯在研究高斯曲线时,直接拿这个思想去处理坐标轴上的长度,结局发现这个长度一算出来,就是均方根。
故此,当你看到 $sqrt{frac{1}{n}sum (x_i - bar{x})^2}$ 时,实际上是在说:这是伽罗瓦那个神秘数字,被高斯重新包装了一下,变成了我们目前的样子。它没有随工夫变质,也没有出于“数学发展史”而变得复杂。它一直就是如此好办的。 大量初学者之故此会卡壳,是出于他们试图去“推导”这个公式背后的物理意义。他们认定,既然用了积分,就得有微分,就得有概率密度函数,就得有微积分学派对齐。结局一学,数学系的学生们就感到一阵天旋地转,认定“这还不是初等代数吗?”。但反过来想,初等代数本身就是为了从复杂的代数关系里抽象出最简的形式来的。
要是非要强行推导,你最终拿到的就是一个关于 $n$ 的阶乘公式,要么包含 $e^x$ 的级数展开,这对于大多数人来说都是无用的。我们不需求为了展示 $x$ 的分布规律而硬造一堆记性差的公式。 在实际应用中,比如做回归分析,要么处理工程里的传感器数据,我们根本不会去纠结 $n$ 是多少,也不会去管 $x$ 是不是连续变量。我们直接Plug in 进去,算出结局,看能不能知足误差准范围。
这时候,积分公式就是个工具,就像一把锤子,不管你如何拿,都能把钉子敲进木头上。
或许你会认定“这公式写得挺复杂,如何不直接给个闭合形式?”,但现代计算机已经能把所有的符号处理得干干净利落净了。你就连不需求手动处理积分,代码里有这一行,一行搞定。
故此,那个看起来像微积分的公式,实际上只是被函数编辑器给“美化”了一下罢了。 说到底,均方根的公式之故此流传下来,是出于它定义了“标准差”。别看标准差和均方差长得差不多,但均方差有一个特殊的定义,它把 $n$ 放进了分子里。
这听起来挺怪,仿佛 $n$ 越大,值反而越小?实际上不然,要是你不看那个分数,只看 $sqrt{sum}$ 这一项,乘以 $n$ 之后,它才是真正代表“整体波动幅度”的东西。对单个点而言,波动是固定的;但对整个集合而言,波动是随人数增添而增添的。均方差公式就把这种“整体”的概念给锁住了。它告诉你,只要你把这组数据平均掉,剩下的波动局部,就是这个东西的大小。
不管你是用积分写,还是用序列写,要么用代码写,只要这个逻辑链条没断,这个值就是对的。 最终,我想说的是,当我们再回头看这个公式时,不妨把它当成一段代码。它的本质就是一个平均值的平方根。
要是你把代码里的 $x_i$ 换成任何变量,把求和号换成积分号,就连换成微分算子,只要保证数学上的等价性,它依然是那个值。它不受任何特定分布的束缚,也不受任何特定函数的限制。它就是一个通用的度量工具,一把直爽的尺子,量你数据里的“方”,量你数据的“均”,量你数据的“根”。别被那些复杂的推导过程吓到,大量时候,最好办的东西,只需求你不用管它是如何来的,它自己就能告诉你答案。数学的魅力往往就在于此,有时候你只需求知道结局,你就连不需求知道它是如何算出来的。
声明:演示网站所有内容,若无特殊说明或标注,均来源于网络转载,仅供学习交流使用,禁止商用。若本站侵犯了你的权益,可联系本站删除。
