线性代数公式大全-线性代数公式大全

公式大全 2026-06-13CST16:35:50

在初看线性代数时，大量人认定它和微积分一样，就是堆砌一堆令人头大的公式，启动记数列，接着记矩阵乘法，最终被符号绕晕。

实际上不然，线性代数的核心压根儿不是那些好看的排版，而是如何用最笨的办法，把事儿搞明白。先说说向量空间吧，别听那个名字，它是所有线性映射的“舞台”。想象一下你手里有一堆向量，它们不只是是点的集合，而是能演算出法向量的机器。

要是你定义了两个向量 $vec{u}$ 和一个标量 $k$，那么组合 $vec{u}_1 = k_1vec{v}_1 + dots + k_nvec{v}_n$ 只要知足线性组合定义，就能在空间里自由穿梭。别被“基”这个词吓到了，它实际上就是定位器，一组线性无涉的向量就能唯一描述出空间里的每个点，就像你在房间里扔了三个不共线的木棍，整个空间就在这三条线上无限延伸。矩阵论是线性代数的另一大块，但千万别把它当成四则运算来看。矩阵是线性算子的“外骨骼”，它负责把输入转成输出。最关键的法则就是 $text{矩阵} times text{向量}$ 依然是一个向量，并且这一系列变换加起来，就是新的变换。别急着去推导行列式啥时候大于零，直接看它的物理意义： determinant 就是体积的缩放倍数。

要是行列式超过 1，空间被撑大了；要是小于 0，方向就反了；要是等于 0，空间就被压扁成一条线了。

这时候，特征值 $lambda$ 就显得特别关键，它告诉你每个方向上的伸缩比例。说到特征值，大量人第一反应是设 $(A - lambda I)vec{v} = 0$，然后硬凑解。

实际上没那么复杂。

要是 $lambda$ 是特征值，那么 $(A - lambda I)vec{v} = 0$ 这个方程一定有非零解。

这玩意儿本质就是求矩阵 $A$ 跟单位矩阵 $I$ 做差之后，还能凑出啥的。举个具体的例子，拿一个 $3times3$ 的矩阵动手算一下，你会发现 $lambda=2$ 时，对应的特征向量 $vec{v}$ 和 $vec{v}$ 实际上是同一个方向，只是长度变了。

这时候你只需求写出这个向量，就能还原出原矩阵在 $lambda=2$ 时的效果。再聊聊正交矩阵和奇异值分解。

这两个在压缩图中挺常见。奇异值分解（SVD）能够理解为把任意向量投影到不同方向上，然后分别压缩或放大。你能够不用复杂的三角分解，直接看矩阵的列向量，要是它们互相正交且长度相等，那它就是正交矩阵；否则就得先正交化，随意弄弄，反正最终能变成一个正交矩阵。

这就好比把你手里的几根棍子，要么让它们互相成直角，要么让它们长度一样，再用尺子量一量，这样你就拿到了正交矩阵。说到正交分解，这实际上是无处不在的。

比如想算两个向量之间的夹角，直接算点积再开根号即可，但这背后的几何意义就是投影。

要是你把两个向量拆解成在彼此方向上的分量，那个分量的大小就是投影长度。别被“正交性”这两个字搞糊涂了，它只是指这两个向量互相垂直，要么都是零向量，要么是共线的。

要是是共线的，那它们之间的夹角要么 $0$ 要么 $180$，这时候正交分解就退化成标量乘了。差分方程也是线性代数的老面孔，别看形式上有点不一样，但本质上还是在解系数矩阵的方程。大量同学一上来就求特征值，实际上没必要。

要是你知道 $lambda_1, lambda_2, dots$ 这些特征值，并且对应的特征向量 $vec{v}_1, vec{v}_2, dots$ 都不共线，那你就直接写成 $vec{y}_n = a_1lambda_1^nvec{v}_1 + dots + a_klambda_k^nvec{v}_k$ 就行了。

这种写法比矩阵幂运算快多了，特别是在手算要么快速估算的时候。还有矩阵的秩，这玩意儿定义了系统的自由度。矩阵的秩是多少，就说明有多少个独立的线性约束，要么说在求解方程组时，有 $n-r$ 个未知数能自由取值。

要是秩挺小，那系统挺可能无解要么无穷多解；要是秩接近全秩，那就大约率有唯一解。别被 $r$ 和 $n$ 的差搞晕了，实际上它代表的是“信息丢失”的程度。最终提一下数值稳定性，线性代数在计算机里不是纯数学，全是浮点数。大量时候，略微一点点误差，误差就会开指数级增长。

这时候搞数值线性代数，得学会用 Gram-Schmidt 正交化顺便单位化，用 QR 分解做最小二乘估摸，就连用 SVD 做鲁棒性分析。

比如处理过大的矩阵，先做列缩放到单位长度，再做行缩放到单位长度，过程慢但准度极高。总而言之，别死磕那些证明过程，公式背后的几何故事才是王道。向量是点，矩阵是机器，特征值是伸缩系数，正交是直角，差分是迭代，秩是自由度。

只要把这些概念串起来，线性代数就不是死记硬背，而是变成了一套处理世界复杂关系的工具。