在咱们聊这玩意儿之前,得先搞清个根本前提:初等矩阵啥个儿。它跟一般/平平矩阵不一样,它是那种“只动一招”的矩阵

比如把矩阵某行加了另一行,这招叫加行;某行乘个非零数,这叫标乘;某列加了另一列,这叫加列。

这三招,在矩阵理论里统称初等变换。 那这“初等”二字,到底是哪位发明的?是牛顿吧,他在那本《原理》里提过,用这招来解二次方程组。

不过,真正的系统化处理,还是高斯自己搞定的。大家都叫他高斯消元法,靠的是把矩阵变成最简形,也就是单位矩阵

这时候,矩阵的最简形式,实际上就是这个初等矩阵的逆矩阵。 故此,初等矩阵的平方,听着有点冷,实际上并不复杂。核心逻辑就是:你是哪位,它就代表啥。

只要记住这个好办原则,任何关于初等矩阵的运算,实际上都是“哪位动它就多乘一次哪位”的难题。 举个例子,看看具体的数字乘法。假设有个矩阵 $A$ 和一个 $1 times n$ 的向量 $x$。先算 $A cdot x$,结局是个数 $y$。再算 $(A cdot x) cdot A$,拿到 $y cdot A$。

这时候,要是 $A$ 是 $m times 1$ 的列向量,那 $y cdot A$ 就是一个 $1 times n$ 的标量矩阵,它的每一行都等于 $y$。

这时候,$A$ 的平方,实际上就是把 $A$ 竖着叠一个 $A$。 反过来,再看看标量乘法。假设 $A$ 是 $m times n$ 的矩阵,$c$ 是个标量,$k$ 是个新的标量。算 $A cdot (c cdot A)$,结局就是 $c cdot (A cdot A)$。

这说明,当你算出一个标量 $c$ 再乘进去,然后再乘回 $A$,效果实际上只是把 $A$ 的两次乘法结局再乘一次 $c$。

也就是说,标量矩阵的平方,就是把原来的矩阵的平方再乘一个 $c^2$。 再看那“加行”的初等变换。

比如把矩阵的第一行加上第二行。

这时候,初等矩阵 $E$ 就是 $m times n$ 的矩阵,只有第一行变了。当我们要算 $E cdot (E cdot x)$ 时,先算 $E cdot x$,拿到的是第一行原来加上第二行之后的结局。再算 $E cdot (E cdot x)$,这相当于再进行一次“加行”操作。结局就是,整个中间过程被连续加行了两次。

这跟一般/平平矩阵乘法不一样,一般/平平矩阵乘法的 $E cdot (E cdot x)$ 里,中间的 $E cdot x$ 只是一个数,再乘 $E$ 的时候,$x$ 只是跟着那个数跑,不会变。但在初等矩阵的世界里,$E cdot x$ 的结局本身就是一个新的矩阵行,再乘 $E$,这个新的结局行又会被“加行”操作影响。

故此,$E$ 的平方,就是像把“加行”这个操作连续执行两次,要么说执行两次“加行”。 再来看“加列”。

比如把矩阵的第一列加上第三列。

这相当于把矩阵 $A$ 的列向量 $Col_3$ 塞进 $Col_1$ 的位置。

这时候,$E$ 就是一个 $m times n$ 的矩阵。当算 $E cdot (E cdot x)$ 时,先算 $E cdot x$,拿到的是第一列变成了原来第一列加第三列的结局。再算 $E cdot (E cdot x)$,这相当于把之前那个“第一列变了”的结局,再塞进去一次“第一列加第三列”。结局就是,原来的第一列,先加了第三列,然后再把刚刚拿到的结局,再加一次第三列。

故此,初等矩阵的平方,就是“加列”这个动作连续执行两次。 不过,这里有个细节要注意。

要是矩阵 $A$ 本身就是个列向量,那初等矩阵的形式就挺特殊。

要是 $A$ 是 $1 times 1$ 的,那加行加列没啥意义,只能乘。

要是 $A$ 是 $n times 1$ 的,那就是个列向量,加行加列就是映射 $A$ 的不同位置,本质上是 $A$ 的不同行变成原来的 $A$ 的不同行。

这时候,$A$ 的平方,就是把 $A$ 的不同行变成原来的 $A$ 的不同行,然后再变成不同的行,也就是 $A$ 变成 $A$ 的不同行,然后又是 $A$ 的不同行。

本质上,就是 $A$ 的“不同行”集合,被复制并重新排列了两次。 要是 $A$ 是 $m times n$ 的矩阵,且我们加行,比如把第 $i$ 行加上第 $j$ 行。

这时候,$A$ 的平方,就是把 $A$ 的“第 $i$ 行变了”的结局,再塞进“第 $i$ 行加第 $j$ 行”这个动作里。

也就是说,不管 $A$ 原来第 $i$ 行是啥,经过 $E$ 的平方之后,$A$ 的第 $i$ 行,会先变成 $A$ 的第 $i$ 行加 $j$ 行,然后再变成 $(A text{ 的第 } i text{ 行} + j text{ 行}) + j text{ 行}$。

这听起来有点绕,实际上就是把 $A$ 的第 $i$ 行,重复加了一次 $j$ 行。 同理,要是是初等矩阵的逆矩阵,那逻辑就反过来了。逆矩阵 $E^{-1}$,就是把 $E$ 里的“加行”变回“减行”。算 $E^{-1} cdot (E^{-1} cdot x)$,就是先减行,再减行,结局就是原来加行两次再减行两次,也就是加两次再减两次,结局就是原来的 $x$ 没变。

这时候,$A$ 的平方就是 $begin{pmatrix} 4 & 0 \ 0 & 9 end{pmatrix}$。

这说明,把第 1 行乘 2,平方之后就是第 1 行乘 2 再乘 2。 再试一个非对角的。设 $A = begin{pmatrix} 1 & 1 \ 1 & 1 end{pmatrix}$。取 $E$ 把第 1 行加 1 到第 2 行。$E = begin{pmatrix} 1 & 0 \ 1 & 1 end{pmatrix}$。先算 $E cdot x = begin{pmatrix} x \ x+x end{pmatrix} = begin{pmatrix} x \ 2x end{pmatrix}$。再算 $E cdot (E cdot x)$,就是把第 1 行加 1 到第 2 行。

原来的第 2 行是 $2x$,目前变成 $2x + 1 cdot x = 3x$,原来的第 1 行是 $x$,不动。结局就是 $begin{pmatrix} x \ 3x end{pmatrix}$。

这说明,把第 2 行加到第 1 行,再把这个结局再加到第 2 行。也就是把第 2 行加两次 1。 最终,得提一下“零矩阵”的情况。

要是 $A = mathbf{0}$,那 $E cdot (E cdot mathbf{0})$ 还是 $mathbf{0}$。

这没啥毛病,自然,$A$ 也是初等矩阵的情况。

要是 $A$ 是单位矩阵,那 $E cdot (E cdot I)$ 就是 $E^2$。

要是 $E$ 是 $I$ 的倍数,比如 $E = 2I$,那 $E^2 = 4I$。

这时候,矩阵乘法就退化成标量乘法了。 总而言之,记住一句话,初等矩阵的平方,就是把这个变换重复执行两次。

不管是加行、加列还是标乘,原理都一样。

只要把“哪位动哪位”这个概念抛出来,下面的所有运算,都能像变魔术一样,顺理成章地解释清楚。

这就够了。数学这东西,有时候就是如此朴实无华,只有理解了它的内核,那些公式才不会让你认定是死记硬背的砖。