ssr残差平方和公式-ssr残差平方和公式
SSR 残差平方和(Sum of Squared Residuals)说白了,就是模型预测出来的结局跟真值之间那组“打架”的总数的平方。别听我扯虚的,咱们就把它当成一个尺子。假设我们有 $n$ 个样本,模型给每个点都算出了一个预测值 $hat{y}$,真正的值是 $y$,那这个差值就是 $y - hat{y}$,也就是“残差”。
要是你数学好,记得一个经典的数学结论:$(a+b)^2 = a^2 + b^2 + 2ab$。
故此,把每个残差加起来,再乘以 2,实际上就是求和公式,再加上所有 $y$ 和 $hat{y}$ 的乘积。为了算出“和”,你能够加个常数;为了算出“平方”,你就得平方。
这时候你拿到了残差平方和,一般写成 $SSR$。 大量初学者好办犯的大毛病是当作 SSR 越大越好,要么反过来,当作 SSR 越小越好。
这彻底取决于你是在哪种情况下使用这个公式。
要是你是在做回归分析来看模型好不好,那确实希望 SSR 尽可能小,出于这代表模型预测得准,浪费的能量(误差)少。但要是你是在做拟合优度检验,要么是在做 ANOVA 方差分析,那 SSR 的大小就没啥意义了。出于不管 SSR 是多少,总有些数据点在模型外,这些点本身的总变异(也就是总平方和 SST)是固定的。模型越复杂,能解释的变异就越多,剩下的解释不了的就越少,SSR 就会变小。
故此这时候,我们根本不能单看 SSR,还得看它是占总变异比例多少,这也就是 R 平方要么 $R^2$ 的概念。 举个例子,假设我们拟合了一条线去预测一组数据。算法心里算出的理论值跟实际值差不多,误差挺小,那 SSR 自然也就是一堆细小的平方数加起来,结局肯定是个小数字。
反之,要是模型彻底不对,连直线都画歪了,预测值离实际值离谱,那残差就一大一小一大的,加起来平方之后,结局肯定是一个挺大的数字。
这就好比你做实验,模型拟合得越精准,实验误差越小,SSR 就越小;要是模型根本没用,那就是实验误差大,SSR 就大。 大量时候我们不敢直接看 SSR 的绝对值,出于不同数据集的数值差异忒大,比较起来毫无意义。
这时候我们会把 SSR 除以总平方和 SST,拿到一个系数,这就叫 $R^2$。
这个系数是个概率意义的东西,它告诉你你的模型能解释了多少数据的波动。
比如你算出来 $R^2$ 是 0.85,那意味着差不多 85% 的数据波动是被模型解释掉的,剩下的 15% 才是模型处理不好的地方。
要是你把 SSR 除以 SST 算出来是 0,那说明模型彻底没本事解释任何波动,模型就是个瞎子,输出全是乱码。自然,要是 $R^2$ 接近 1,说明模型解释的效果还不错,但也可能是模型忒复杂,把噪声也假装成了规律,这时候要警惕。 在实际应用里,SSR 时常和 MSE(均方误差)连在一起用。MSE 就是把 SSR 除以样本量 $n$,算出平均的误差平方。
这样对比起来更公平,不管数据集多大,平均误差的大小就能直观地反映模型的稳定性。
要是你发现 SSR 降了,但 MSE 没变,那可能只是样本量变大罢了,每个点的平均误差实际上没变。 SSR 这个概念实际上挺抽象的,出于它把数据的关系压缩成了一个单一的数值。
有时候为了节省代码空间,我们会把 SSR 写成矩阵的形式,但这本质上还是那个求和的过程。
只要你想把预测值和真值差一减,再平方,再加总,你就拿到了 SSR。你不用去纠结公式的推导过程,不用管 $n$ 到底是多少,也不用管维度 $p$ 是多少,你的目标只有一个:算出这个值,看看它在你的模型里意味着啥。它是个标量,是个数字,是个告诉我模型有多“诚实”的指标。 最终说句掏心窝子的话,任何统计方式都是用来解决难题的,不是为了证明数学公式有多优美。SSR 只是一个工具,它本身没有灵魂。
要是用它来衡量模型好坏,只能看它的数值。
要是你发现 SSR 突然变小,别高兴得忒早,可能只是加了个新变量罢了。
要是你发现 SSR 突然变大,也别慌,可能模型需求调整,要么数据本身就有难题。
记住,SSR 只能告诉你有多少“未解析”的局部,它不能告诉你模型到底对不对,对不对需求靠更复杂的检验。
声明:演示网站所有内容,若无特殊说明或标注,均来源于网络转载,仅供学习交流使用,禁止商用。若本站侵犯了你的权益,可联系本站删除。
