线性代数公式|线性代数核心公式权威汇总

从行列式到奇异值分解,从几何直观到计算实践——系统梳理线性代数核心公式,揭示其内在逻辑与实用价值,助您真正理解数学的简洁之美。

立即查看核心公式

为什么线性代数是“数学语言”的基石?

在理工科的课程体系中,线性代数公式-线性代数核心公式常被误读为“一堆冷冰冰的符号运算”。然而,它远不止如此——它是一套描述空间、变换与关系的通用语言,是机器学习、计算机图形学、信号处理乃至量子力学的共同基础。

想象一下:当你用Python调用NumPy计算矩阵乘法时,背后是向量空间的线性变换;当你用PCA降维时,本质是在寻找最优正交基;当你训练神经网络时,反向传播过程本质上是对权重矩阵的梯度更新。这些看似高级的应用,其根基都深植于线性代数核心公式之中。

本页面并非简单罗列公式,而是以“理解→记忆→应用”为脉络,结合大量实例、历史背景与现实场景,帮助您构建完整的线性代数公式-线性代数核心公式认知框架。每一项公式都配有几何解释、代数推导与实际代码/计算提示,确保您不仅“知道”,更“懂为什么”。

个关键洞察

“矩阵乘法”不是简单的“行×列求和”,而是:
将输入向量在一组基上的坐标,通过线性变换映射为另一组基上的新坐标

线性代数的三大直观视角

  • 代数视角:以Ax = b为原型,研究线性方程组的解结构
  • 几何视角:把矩阵看作空间的拉伸、旋转、投影等线性变换
  • 抽象视角:在向量空间中,对象不限于“数列”,而是任意满足加法与数乘封闭性的实体(如函数、多项式)

本页面内容结构说明

  • 基础公式:行列式、矩阵加法、逆矩阵、伴随矩阵、秩、初等变换
  • 矩阵运算:转置、分块矩阵、正交矩阵、对称矩阵、幂等矩阵等特殊矩阵性质
  • 特征值与特征向量:特征方程、对角化、相似变换、谱定理
  • 分解方法:LU分解、QR分解、Schur分解、SVD奇异值分解
  • 应用实例:最小二乘法、主成分分析(PCA)、图像压缩、微分方程组求解
  • 网友关注:高频误区解析、考研重点、机器学习中的应用技巧

基础公式:线性代数的“字母表”

所有高级理论都建立在基础公式之上。掌握这些公式,是理解线性代数核心公式体系的第一步。

行列式(Determinant)

行列式是方阵的一个标量值,反映矩阵是否可逆、线性变换的体积缩放因子。

×2矩阵行列式

对矩阵 A = [[a, b], [c, d]],其行列式为:

det(A) = ad − bc

几何意义:平行四边形面积(向量 [a,c][b,d] 张成)。

×3矩阵行列式(展开法)

对矩阵 A = [[a,b,c],[d,e,f],[g,h,i]]

det(A) = a(ei − fh) − b(di − fg) + c(dh − eg)

或使用线性代数核心公式中的“拉普拉斯展开”:沿第一行展开,递归计算余子式。

n阶行列式性质(关键公式)

  • det(A^T) = det(A)
  • det(AB) = det(A)·det(B)
  • det(A⁻¹) = 1 / det(A) (当A可逆)
  • 若A有两行/列相同,则det(A) = 0
  • 若某行乘以k,则det = k·原det
  • 行加法不变性:det(A + k·Row_i → Row_j) = det(A)

这些性质是推导线性代数核心公式的基石,尤其在证明相似变换、特征值不变性时至关重要。

矩阵基本运算

矩阵是线性代数的核心对象。掌握其运算规则是应用的前提。

矩阵加法

同型矩阵对应元素相加:
(A + B)_{ij} = A_{ij} + B_{ij}

满足交换律与结合律。

数乘

标量k与矩阵A相乘:
(kA)_{ij} = k·A_{ij}

几何意义:向量空间的均匀缩放。

矩阵乘法

(AB)_{ij} = Σ_k A_{ik} B_{kj}

关键性质:
• 不满足交换律(AB ≠ BA)
• 满足结合律((AB)C = A(BC))
• 分配律:A(B+C) = AB + AC

实例:矩阵乘法的几何理解

A = [[2, 0], [0, 3]],向量 x = [1, 1]^T
Ax = [2, 3]^T——相当于将x在x轴方向拉伸2倍、y轴方向拉伸3倍。

这就是线性代数核心公式中“线性变换”的直观体现:矩阵A定义了一个从输入空间到输出空间的映射。

逆矩阵与伴随矩阵

AB = BA = I,则称B为A的逆矩阵,记作A⁻¹

×2矩阵的逆

A = [[a, b], [c, d]],若det(A) ≠ 0,则:

A⁻¹ = (1 / (ad − bc)) · [[d, −b], [−c, a]]

⚠️ 注意:顺序不可颠倒!右下角是a,不是d。

n阶逆矩阵求法

  • 高斯-约当消元法:将[A | I]化为[I | A⁻¹]
  • 伴随矩阵法:A⁻¹ = (1/det(A)) · adj(A)
  • 分块矩阵求逆(如对角块矩阵)

适用于线性代数核心公式中的解方程组与变换分析。

伴随矩阵(Adjugate Matrix)

adj(A) 是A的代数余子式矩阵的转置:
[adj(A)]_{ij} = C_{ji},其中C_{ji}是A的(j,i)代数余子式。

恒等式:A · adj(A) = adj(A) · A = det(A) · I

此公式是连接行列式与逆矩阵的关键桥梁。

矩阵的秩(Rank)

矩阵的秩是其行(或列)向量组的最大线性无关组所含向量个数,记作rank(A)

等价定义

  • 非零子式的最高阶数
  • 行阶梯形矩阵中非零行的行数
  • 列空间的维数
  • 线性变换的像空间维数

核心公式

  • rank(A^T) = rank(A)
  • rank(AB) ≤ min(rank(A), rank(B))
  • rank(A + B) ≤ rank(A) + rank(B)
  • rank(A) + rank(B) − n ≤ rank(AB) ≤ min{rank(A), rank(B)}(Sylvester不等式)

在解线性方程组Ax = b时:

  • rank(A) = rank([A|b]) = n → 唯一解
  • rank(A) = rank([A|b]) < n → 无穷多解
  • rank(A) < rank([A|b]) → 无解

矩阵运算:从平凡到特殊

并非所有矩阵都“平平无奇”。正交矩阵、对称矩阵、幂等矩阵等特殊结构,蕴含着优美的线性代数核心公式,极大简化计算与理论分析。

正交矩阵(Orthogonal Matrix)

满足Q^T Q = Q Q^T = I的方阵称为正交矩阵。

关键性质

  • 列(行)向量组是标准正交基
  • Q⁻¹ = Q^T,计算逆矩阵极简
  • 保持向量长度与夹角:||Qx|| = ||x||
  • det(Q) = ±1

D旋转矩阵

绕原点逆时针旋转θ角的矩阵:

Q = [[cosθ, −sinθ], [sinθ, cosθ]]

验证:Q^T Q = I,且det(Q) = cos²θ + sin²θ = 1

这是线性代数核心公式中“保距变换”的典型代表。

D绕轴旋转(罗德里格斯公式)

绕单位向量u = [u_x, u_y, u_z]^T旋转θ角的矩阵:

Q = I cosθ + (1−cosθ)uu^T + [u]_× sinθ

其中[u]_×是叉乘的反对称矩阵:
[u]_× = [[0, −u_z, u_y], [u_z, 0, −u_x], [−u_y, u_x, 0]]

此公式广泛应用于计算机图形学与机器人学。

对称矩阵(Symmetric Matrix)

满足A^T = A的矩阵。其元素关于主对角线对称。

谱定理(Spectral Theorem)

实对称矩阵必可正交对角化:
A = Q Λ Q^T,其中Q为正交矩阵,Λ为对角矩阵(特征值)。

这意味着存在一组标准正交基,使得A在此基下仅为缩放操作。

次型

任意二次型可写为x^T A x(A对称)。
通过正交变换x = Qy,可化为标准形:
x^T A x = y^T Λ y = λ₁y₁² + ⋯ + λₙyₙ²

实例:椭圆的标准形

次型 5x₁² + 4x₁x₂ + 5x₂² = [x₁,x₂] [[5,2],[2,5]] [x₁;x₂]

特征值:λ₁=7, λ₂=3 → 标准形为 7y₁² + 3y₂² = 1 → 椭圆长轴/短轴比为√(1/3) : √(1/7)

幂等矩阵(Idempotent Matrix)

满足P² = P的矩阵。常见于投影变换。

性质

  • 特征值只能是0或1
  • rank(P) = trace(P)
  • I−P也是幂等矩阵

正交投影到子空间

设A列满秩,向量b在A列空间上的投影为p = A x̂,其中x̂ = (A^T A)⁻¹ A^T b

投影矩阵:P = A (A^T A)⁻¹ A^T,满足P² = PP^T = P

这是最小二乘法的线性代数核心公式基础!

对角矩阵与三角矩阵

对角矩阵D = diag(d₁,…,dₙ)仅主对角线非零,满足D⁻¹ = diag(1/d₁,…,1/dₙ)(当所有dᵢ≠0)。

上三角矩阵(如Jordan块)在广义特征向量分析中至关重要,是Schur分解的基础。

特征值与特征向量:矩阵的“灵魂”

特征值与特征向量揭示了线性变换的本质——在某些特定方向上,变换仅表现为缩放,不改变方向。这是理解线性代数核心公式动力学行为的关键。

定义与特征方程

对n阶方阵A,若存在非零向量v与标量λ,使得:

A v = λ v

则称λ为A的特征值,v为对应特征向量。

移项得:(A − λI)v = 0,有非零解的充要条件是:

det(A − λI) = 0

此即线性代数核心公式中的特征方程(特征多项式=0)。

实例:求特征值与特征向量

A = [[4, 1], [2, 3]]

特征方程:det([[4−λ, 1], [2, 3−λ]]) = (4−λ)(3−λ) − 2 = λ² − 7λ + 10 = 0

解得:λ₁=5, λ₂=2

λ₁=5时:(A−5I)v=0 → [[−1,1],[2,−2]]v=0 → v₁ = [1,1]^T

λ₂=2时:(A−2I)v=0 → [[2,1],[2,1]]v=0 → v₂ = [1,−2]^T

几何意义:A将向量v₁拉伸5倍,v₂拉伸2倍,方向不变。

对角化条件

矩阵A可对角化 ⇔ 存在可逆矩阵P,使得P⁻¹AP = Λ(对角阵)。

充分条件:A有n个线性无关的特征向量

判据

  • 所有特征值互异 ⇒ 必可对角化
  • 重根时,需几何重数=代数重数
  • 实对称矩阵必可正交对角化

对角化步骤(以A为例)

  1. 求特征值λ₁,…,λₖ(含重数)
  2. 对每个λᵢ,解(A−λᵢI)x=0得基础解系(特征向量)
  3. 将所有特征向量组成矩阵P
  4. 计算Λ = P⁻¹AP,其对角元为对应特征值

矩阵函数:Aⁿ的快速计算

A = PΛP⁻¹,则Aⁿ = PΛⁿP⁻¹,而Λⁿ = diag(λ₁ⁿ,…,λₙⁿ)

应用:斐波那契数列通项、马尔可夫链稳态分析、微分方程组求解。

特征值的物理意义

?

振动模态

结构动力学中,特征值对应固有频率平方,特征向量为振型。

?

主成分分析(PCA)

协方差矩阵的特征值表示各主成分方差,特征向量为新坐标轴方向。

?

PageRank算法

网页链接矩阵的主特征向量(λ=1)给出网页重要性排名。

实例:PCA降维中的特征值

设数据协方差矩阵:Σ = [[2.5, 1.0], [1.0, 1.5]]

特征值:λ₁≈3.218, λ₂≈0.782
总方差:3.218 + 0.782 = 4.0
第一主成分解释方差比例:3.218/4.0 ≈ 80.5%

因此,用第一主成分可保留80%以上信息,实现有效降维。

矩阵分解:将复杂问题模块化

矩阵分解是数值线性代数的核心。它们将原矩阵拆解为结构更简单或性质更优的矩阵乘积,极大提升计算效率与理论分析能力,是线性代数核心公式工程化落地的关键。

LU分解

将A分解为下三角L与上三角U的乘积:A = LU

Doolittle分解步骤

A = [[a₁₁,a₁₂,a₁₃],[a₂₁,a₂₂,a₂₃],[a₃₁,a₃₂,a₃₃]],设:

L = [[1, 0, 0], [l₂₁, 1, 0], [l₃₁, l₃₂, 1]], U = [[u₁₁, u₁₂, u₁₃], [0, u₂₂, u₂₃], [0, 0, u₃₃]]

逐行计算:u₁ⱼ = a₁ⱼ;lᵢ₁ = aᵢ₁/u₁₁;u₂ⱼ = a₂ⱼ − l₂₁u₁ⱼ;依此类推。

计算复杂度:O(n³/3),比直接求逆快3倍以上。

Ax = b:两步走

  1. Ly = b(前代法,因L下三角)
  2. Ux = y(回代法,因U上三角)

特别适合求解多个右端项(如参数扫描),只需一次LU分解。

QR分解

将A分解为正交矩阵Q与上三角矩阵R:A = QR

Householder变换法

通过反射变换将A的第k列下方元素消为0,累积得到Q。

数值稳定,是MATLAB qr()的默认方法。

Gram-Schmidt正交化

将A的列向量组正交化再单位化,组成Q;R为正交化系数矩阵。

经典法数值不稳定;改进版(MGS)更可靠。

QR分解求特征值:QR算法

迭代过程:
A₀ = A
A₀ = Q₀R₀ ⇒ A₁ = R₀Q₀
A₁ = Q₁R₁ ⇒ A₂ = R₁Q₁

当k→∞时,Aₖ收敛至近似上三角阵,对角元即特征值。

这是计算中等规模矩阵特征值的工业标准方法。

奇异值分解(SVD)

任意m×n矩阵A均可分解为:A = U Σ V^T

  • U:m×m正交矩阵(左奇异向量)
  • Σ:m×n对角矩阵(奇异值σ₁≥σ₂≥…≥σᵣ>0)
  • V:n×n正交矩阵(右奇异向量)

几何意义

任意线性变换可分解为三步:
① 旋转/反射(V^T)
② 沿坐标轴缩放(Σ)
③ 再旋转/反射(U)

这是最通用的矩阵分解,不依赖矩阵是否可对角化。

低秩近似:Eckart-Young定理

A = Σᵢ σᵢ uᵢ vᵢ^T,则秩为k的最佳近似为:

Aₖ = Σᵢ₌₁ᵏ σᵢ uᵢ vᵢ^T

误差最小(Frobenius范数下)。

应用:图像压缩(如1024×1024图像用k=50的SVD可压缩至原1/10大小)。

伪逆矩阵(Moore-Penrose逆)

对任意矩阵A,其伪逆为:A⁺ = V Σ⁺ U^T,其中Σ⁺将非零σᵢ取倒数。

解最小二乘问题:x = A⁺b给出||Ax−b||最小解。

实例:图像压缩(Python伪代码)
import numpy as np
img = plt.imread('cat.jpg')
U, s, Vt = np.linalg.svd(img, full_matrices=False)
k = 50
img_approx = U[:, :k] @ np.diag(s[:k]) @ Vt[:k, :]
plt.imshow(img_approx.astype('uint8'))

原始图像1024×1024,SVD保留前50个奇异值后,存储量从1MB降至约50KB,视觉质量仍可接受。

Schur分解

任意方阵A可酉相似于上三角矩阵:A = Q T Q^H,其中Q为酉矩阵,T为上三角。

对实矩阵,若允许准对角块(2×2旋转块),则为实Schur形式。是特征值计算的理论基础。

应用实例:从公式到现实世界

理解线性代数核心公式的终极目标是应用。以下案例展示其在科学计算、数据科学与工程中的实际价值。

最小二乘法(Least Squares)

拟合直线y = ax + b到数据点(xᵢ,yᵢ),目标是最小化Σ(yᵢ − axᵢ − b)²

正规方程:A^T A x = A^T b

设设计矩阵A = [[x₁,1], [x₂,1], ..., [xₙ,1]],则解为:
[a; b] = (A^T A)⁻¹ A^T b

⚠️ 注意:当A病态时,A^T A条件数平方恶化,应改用SVD。

SVD解法:稳健可靠

A = U Σ V^T,解为:
x = V Σ⁺ U^T b

即使A秩亏(如数据共线),仍可给出最小范数解。

微分方程组求解

线性系统:dx/dt = Ax,其中A为常数矩阵。

特征值解法

若A可对角化:A = PΛP⁻¹,则解为:
x(t) = P e^{Λt} P⁻¹ x(0),其中e^{Λt} = diag(e^{λ₁t},...,e^{λₙt})

物理意义

每个特征值λᵢ决定对应模态的指数增长/衰减速率;特征向量决定空间方向。

实例:弹簧-质量系统

两个质量块由弹簧连接,运动方程:
m d²x/dt² = −Kx,其中K = [[2k, −k], [−k, 2k]]

特征值:λ₁=k/m, λ₂=3k/m → 固有频率ω₁=√(k/m), ω₂=√(3k/m)

对应振型:v₁=[1,1]^T(同步振动),v₂=[1,−1]^T(反相振动)

网页排名(PageRank)

网页链接构成有向图,转移矩阵M = d·A + (1−d)·E(d≈0.85)。

PageRank向量r满足:r = M r,即r是M的主特征向量(λ=1)。

迭代计算(Power Method)

任选初始向量r₀,迭代:rₖ = M rₖ₋₁

当k足够大时,rₖ收敛至主特征向量。

数学基础:线性代数核心公式中的特征值迭代法。

结语:公式之外的数学之美

线性代数公式绝非孤立符号的堆砌,而是人类理解空间与变换的智慧结晶。从克莱姆法则到奇异值分解,从二维平面到高维希尔伯特空间,每一项线性代数核心公式都承载着深刻几何意义与工程价值。

掌握它们,不是为了应对考试,而是为了在机器学习、计算机视觉、控制理论等前沿领域中,真正理解算法的底层逻辑。当你看到Ax = λx时,请记住:这不是一个方程,而是一个关于“不变方向”的哲学命题。

愿这份详实的线性代数公式-线性代数核心公式指南,成为您探索数学世界的可靠路标。公式终会遗忘,但理解一旦形成,便成为您思维的一部分。