全篇的内容都在讲如何求解矩阵的逆

方法适用范围

定义法:解决抽象型问题

初等变换法:解决具体型的问题

伴随法:解决具体型的问题

矩阵的逆

存在性

只有双射函数f(x)f(x),有反函数f1(x)f^{-1}(x)

双射函数

反函数

同样的道理,只有矩阵函数为双射时才有反函数,所以根据矩阵函数双射的条件有:

当矩阵A\boldsymbol{A}为满秩矩阵时,对应的矩阵函数为双射,此时存A\boldsymbol{A}在反函数,称为A\boldsymbol{A}可逆。其反函数记作A1\boldsymbol{A}^{-1},称为A\boldsymbol{A}的逆矩阵。

比如,下面是某满秩矩阵A\boldsymbol{A},在它的作用下矩形变为了平行四边形:

1

而在它的反函数,或者说逆矩阵A1\boldsymbol{A}^{-1}的作用下,图形又变回了原来的样子,这就是逆矩阵的几何意义:

3

如果B\boldsymbol{B}不是满秩矩阵,在它的作用下矩形变成了线段,信息丢失了没有办法变回原来的矩形了(就好像易拉罐被踩扁了,没法复原了),所以没有逆矩阵:

2

定义

A,B\boldsymbol{A}, \boldsymbol{B}nn阶方阵,E\boldsymbol{E}nn阶单位矩阵, 若AB=BA=E\boldsymbol{A B}=\boldsymbol{B} \boldsymbol{A}=\boldsymbol{E},则称A\boldsymbol{A}是可逆矩阵,并称B\boldsymbol{B}A\boldsymbol{A}的逆矩阵,且逆矩阵是唯一的,记作A1\boldsymbol{A}^{-1}

之前学习过单位阵的几何意义,在它的作用下,图形不会发生变化:

2

因此,单位阵和AAA1A^{-1}的复合的效果是相同的,即有:

\begin{align}I=AA^{-1}=A^{-1}A\end{align}

A\boldsymbol{A}可逆的充分必要条件是A0|\boldsymbol{A}| \neq 0。当A0|\boldsymbol{A}| \neq 0时,A\boldsymbol{A}可逆,且

\begin{align}\boldsymbol{A}^{-1}=\frac{1}{|\boldsymbol{A}|} \boldsymbol{A}^{*}\end{align}

逆矩阵的性质与重要公式

A,B\boldsymbol{A}, \boldsymbol{B}是同阶可逆矩阵,则

  • (A1)1=A\left(\boldsymbol{A}^{-1}\right)^{-1}=\boldsymbol{A}

  • k0k \neq 0,则(kA)1=1kA1(k \boldsymbol{A})^{-1}=\frac{1}{k} \boldsymbol{A}^{-1}

  • AB\boldsymbol{A} \boldsymbol{B}也可逆,且(AB)1=B1A1(\boldsymbol{A B})^{-1}=\boldsymbol{B}^{-1} \boldsymbol{A}^{-1}

  • AT\boldsymbol{A}^{\mathrm{T}}也可逆,且 (AT)1=(A1)T\left(\boldsymbol{A}^{\mathrm{T}}\right)^{-1}=\left(\boldsymbol{A}^{-1}\right)^{\mathrm{T}}

    【注】此处可称为 “穿脱”原则,即穿衣时先内后外,脱衣时先外后内.

  • A1=A1\left|\boldsymbol{A}^{-1}\right|=|\boldsymbol{A}|^{-1}

    【注】A+B\boldsymbol{A}+\boldsymbol{B}不一定可逆,且(A+B)1A1+B1(\boldsymbol{A}+\boldsymbol{B})^{-1} \neq \boldsymbol{A}^{-1}+\boldsymbol{B}^{-1}

用定义求逆矩阵的方法

方法一

依定义,即求一个矩阵B\boldsymbol{B},使AB=E\boldsymbol{A B}=\boldsymbol{E},则A\boldsymbol{A}可逆,且A1=B\boldsymbol{A}^{-1}=\boldsymbol{B}

方法二

A\boldsymbol{A}分解成若干个可逆矩阵的乘积。因两个可逆矩阵的积仍是可逆矩阵,即若 A=BC\boldsymbol{A}=\boldsymbol{B} \boldsymbol{C},其中, B,C\boldsymbol{B}, \boldsymbol{C}均可逆,则A\boldsymbol{A}可逆,且

\begin{align}\boldsymbol{A}^{-1}=(\boldsymbol{B} \boldsymbol{C})^{-1}=\boldsymbol{C}^{-1} \boldsymbol{B}^{-1}\end{align}

方法三

一些简单分块矩阵的逆。若A,B\boldsymbol{A}, \boldsymbol{B}均是可逆方阵,则

\begin{align}\left[\begin{array}{ll} \boldsymbol{A} & \boldsymbol{O} \\ \boldsymbol{O} & \boldsymbol{B} \end{array}\right]^{-1}=\left[\begin{array}{cc} \boldsymbol{A}^{-1} & \boldsymbol{O} \\ \boldsymbol{O} & \boldsymbol{B}^{-1} \end{array}\right], \quad\left[\begin{array}{cc} \boldsymbol{O} & \boldsymbol{A} \\ \boldsymbol{B} & \boldsymbol{O} \end{array}\right]^{-1}=\left[\begin{array}{cc} \boldsymbol{O} & \boldsymbol{B}^{-1} \\ \boldsymbol{A}^{-1} & \boldsymbol{O} \end{array}\right]\end{align}

伴随矩阵

定义

将行列式A|\boldsymbol{A}|的代数余子式AijA_{ij}所构成的矩阵,称为A\boldsymbol{A}的代数余子式矩阵:

\begin{align}\boldsymbol{C}= \begin{pmatrix} A_{11}&A_{12}&\cdots&A_{1n}\\ A_{21}&A_{22}&\cdots&A_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ A_{n1}&A_{n2}&\cdots&A_{nn} \end{pmatrix}\end{align}

其转置称为A\boldsymbol{A}的伴随矩阵,记作A\boldsymbol{A}^{*}

\begin{align}\boldsymbol{A}^{*}=\boldsymbol{C}^\mathrm{T}= \begin{pmatrix} A_{11}&A_{21}&\cdots&A_{n1}\\ A_{12}&A_{22}&\cdots&A_{n2}\\ \vdots&\vdots&\ddots&\vdots\\ A_{1n}&A_{2n}&\cdots&A_{nn} \end{pmatrix}\end{align}

根据可逆和行列式的关系可知,若A0|\boldsymbol{A}|\neq 0,则矩阵A\boldsymbol{A}可逆。可证明此时有:

\begin{align}\boldsymbol{A}^{-1}=\frac{1}{|\boldsymbol{A}|}\boldsymbol{A}^{*}\end{align}

且有

\begin{align}\boldsymbol{A} \boldsymbol{A}^{*}=\boldsymbol{A}^{*} \boldsymbol{A}=|\boldsymbol{A}| \boldsymbol{E}\end{align}

证明

A=(aij)\boldsymbol{A}=(a_{ij}),记AA=(bij)\boldsymbol{A}\boldsymbol{A}^{*}=(b_{ij}),根据矩阵乘法的点积观点,可知bijb_{ij}A\boldsymbol{A}ii行和A\boldsymbol{A}^{*}的列点积的结果jj,其中A\boldsymbol{A}ii行为行向量(ai1,ai2,,ain)(a_{i1},a_{i2},\cdots,a_{in})A\boldsymbol{A}^{*}jj列为列向量(Aj1Aj2Ajn)\begin{pmatrix}A_{j1}\\A_{j2}\\\vdots\\A_{jn}\end{pmatrix},所以:

\begin{align}b_{ij}=a_{i1}A_{j1}+a_{i2}A_{j2}+...+a_{in}A_{jn}\end{align}

根据拉普拉斯展开以及推论可知:

\begin{align}b_{ij}=a_{i1}A_{j1}+a_{i2}A_{j2}+...+a_{in}A_{jn}= \begin{cases}|\boldsymbol{A}|,\quad i=j\\ 0, \quad i\neq j\end{cases}\end{align}

所以,结合上矩阵数乘可得:

\begin{align}\boldsymbol{A}\boldsymbol{A}^{*}=\begin{pmatrix}|\boldsymbol{A}|&0&\cdots&0\\ 0&|\boldsymbol{A}|&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&|\boldsymbol{A}| \end{pmatrix}=|\boldsymbol{A}|\boldsymbol{I}\end{align}

因为A0|\boldsymbol{A}|\neq 0,所以:

\begin{align}\frac{1}{|\boldsymbol{A}|}\boldsymbol{A}^{*}\boldsymbol{A}=\boldsymbol{I}\end{align}

根据逆矩阵的定义可得:

\begin{align}\boldsymbol{A}^{-1}=\frac{1}{|\boldsymbol{A}|}\boldsymbol{A}^{*}\end{align}

上述定理看上去有点复杂,尤其其中出现的伴随矩阵A\boldsymbol{A}^{*},下面就再给出一种视角。

之前学习过,可以通过一系列初等行变换来求出逆矩阵,比如这里的例题。所以对于某矩阵A=(a11a12a1na21a22a2nan1an2ann)\boldsymbol{A}=\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\a_{21}&a_{22}&\cdots&a_{2n}\\\vdots&\vdots&\ddots&\vdots\\a_{n1}&a_{n2}&\cdots&a_{nn}\end{pmatrix}的逆矩阵,如果可以像下面一样,通过矩阵B\boldsymbol{B}(代表了一系列的初等行变换)将之变为对角阵,再通过矩阵C\boldsymbol{C}(也代表了一系列的初等行变换)将之变为单位阵,那么就有A1=CB\boldsymbol{A}^{-1}=\boldsymbol{C}\boldsymbol{B}

\begin{align}\boldsymbol{C}\boldsymbol{B}\boldsymbol{A}=\boldsymbol{A}^{-1}\boldsymbol{A}=\boldsymbol{I}\end{align}

\begin{align}\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\a_{21}&a_{22}&\cdots&a_{2n}\\\vdots&\vdots&\ddots&\vdots\\a_{n1}&a_{n2}&\cdots&a_{nn}\end{pmatrix}\xrightarrow{\quad\boldsymbol{B}\quad}\begin{pmatrix}b_{11}&0&\cdots&0\\0&b_{22}&\cdots&0\\\vdots&\vdots&\ddots&\vdots\\0&0&\cdots&b_{nn}\end{pmatrix}\xrightarrow{\quad\boldsymbol{C}\quad}\begin{pmatrix}1&0&\cdots&0\\0&1&\cdots&0\\\vdots&\vdots&\ddots&\vdots\\0&0&\cdots&1\end{pmatrix}\end{align}

因为之前学习了拉普拉斯展开以及推论:

\begin{align}b_{ij}=a_{i1}A_{j1}+a_{i2}A_{j2}+...+a_{in}A_{jn}= \begin{cases}|\boldsymbol{A}|,\quad i=j\\ 0, \quad i\neq j\end{cases}\end{align}

所以上面定理中介绍的伴随矩阵A\boldsymbol{A}^{*}就可以将矩阵A\boldsymbol{A}变为对角阵,最终变为单位阵:

\begin{align}\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\a_{21}&a_{22}&\cdots&a_{2n}\\\vdots&\vdots&\ddots&\vdots\\a_{n1}&a_{n2}&\cdots&a_{nn}\end{pmatrix}\xrightarrow{\quad\boldsymbol{A}^{*}\quad}\begin{pmatrix}|\boldsymbol{A}|&0&\cdots&0\\0&|\boldsymbol{A}|&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\0&0&\cdots&|\boldsymbol{A}|\end{pmatrix}\xrightarrow{\quad 除以|\boldsymbol{A}|\quad}\begin{pmatrix}1&0&\cdots&0\\0&1&\cdots&0\\\vdots&\vdots&\ddots&\vdots\\0&0&\cdots&1\end{pmatrix}\end{align}

伴随矩阵的性质与重要公式

  • 对任意nn阶方阵A\boldsymbol{A},都有伴随矩阵A\boldsymbol{A}^{*},且有公式

\begin{align}\boldsymbol{A A}^{*}=\boldsymbol{A}^{*} \boldsymbol{A}=|\boldsymbol{A}| \boldsymbol{E}, \quad\left|\boldsymbol{A}^{*}\right|=|\boldsymbol{A}|^{n-1}\end{align}

​ 当A0|\boldsymbol{A}| \neq 0时,有

\begin{align}\begin{array}{l} \boldsymbol{A}^{*}=|\boldsymbol{A}| \boldsymbol{A}^{-1}, \quad \boldsymbol{A}^{-1}=\frac{1}{|\boldsymbol{A}|} \boldsymbol{A}^{*}, \quad \boldsymbol{A}=|\boldsymbol{A}|\left(\boldsymbol{A}^{*}\right)^{-1} ; \\ (k \boldsymbol{A})(k \boldsymbol{A})^{*}=|k \boldsymbol{A}| \boldsymbol{E} ; \\ \boldsymbol{A}^{\mathrm{T}}\left(\boldsymbol{A}^{\mathrm{T}}\right)^{*}=\left|\boldsymbol{A}^{\mathrm{T}}\right| \boldsymbol{E} ; \\ \boldsymbol{A}^{-1}\left(\boldsymbol{A}^{-1}\right)^{*}=\left|\boldsymbol{A}^{-1}\right| \boldsymbol{E} ; \\ \boldsymbol{A}^{*}\left(\boldsymbol{A}^{*}\right)^{*}=\left|\boldsymbol{A}^{*}\right| \boldsymbol{E} \end{array}\end{align}

  • (AT)=(A)T,(A1)=(A)1,(AB)=BA,(A)=An2A\left(\boldsymbol{A}^{\mathrm{T}}\right)^{*}=\left(\boldsymbol{A}^{*}\right)^{\mathrm{T}},\left(\boldsymbol{A}^{-1}\right)^{*}=\left(\boldsymbol{A}^{*}\right)^{-1},(\boldsymbol{A} \boldsymbol{B})^{*}=\boldsymbol{B}^{*} \boldsymbol{A}^{*},\left(\boldsymbol{A}^{*}\right)^{*}=|\boldsymbol{A}|^{n-2} \boldsymbol{A}

【注】(A+B)A+B(\boldsymbol{A}+\boldsymbol{B})^{*} \neq \boldsymbol{A}^{*}+\boldsymbol{B}^{*}

用伴随矩阵求逆矩阵的方法

A0|\boldsymbol{A}| \neq 0,则A\boldsymbol{A}可逆,且A1=1AA\boldsymbol{A}^{-1}=\frac{1}{|\boldsymbol{A}|} \boldsymbol{A}^{*}

解题步骤

  1. A0|\boldsymbol{A}|\ne0
  2. A\boldsymbol{A}^{*}
  3. 写出A1=1AA\boldsymbol{A}^{-1}=\frac{1}{|\boldsymbol{A}|} \boldsymbol{A}^{*}

例题

已知A=[abcd]\boldsymbol{A}=\left[\begin{array}{ll}a & b \\ c & d\end{array}\right],写出A\boldsymbol{A}可逆的一个充要条件,当A\boldsymbol{A}可逆时,求A1\boldsymbol{A}^{-1}

解:A\boldsymbol{A}可逆A=abcd=adbc0\Leftrightarrow|\boldsymbol{A}|=\left|\begin{array}{ll}a & b \\ c & d\end{array}\right|=a d-b c \neq 0,且当adbc0a d-b c \neq 0时,

\begin{align}\boldsymbol{A}^{-1}=\frac{1}{|\boldsymbol{A}|} \boldsymbol{A}^{*}=\frac{1}{a d-b c}\left[\begin{array}{cc} d & -b \\ -c & a \end{array}\right]\end{align}

【注】利用公式A1=1AA\boldsymbol{A}^{-1}=\frac{1}{|\boldsymbol{A}|} \boldsymbol{A}^{*}A1\boldsymbol{A}^{-1}时,应注意:

  1. 不要忘记A\boldsymbol{A}^{*}要除以A|\boldsymbol{A}|
  2. A\boldsymbol{A}^{*}的元素是A|\boldsymbol{A}|中元素的代数余子式,注意正、负号
  3. AijA_{i j}位于矩阵A\boldsymbol{A}^{*}中相对于矩阵A\boldsymbol{A}的元素ajia_{j i}的位置上

对于2阶矩阵求A\boldsymbol{A}^{*},只需将a11,a22a_{11}, a_{22}互换,a12,a21a_{12}, a_{21}上添加负号


求矩阵A=[101210325]\boldsymbol{A}=\left[\begin{array}{ccc}1 & 0 & 1 \\ 2 & 1 & 0 \\ -3 & 2 & -5\end{array}\right]的逆矩阵

解:由A=101210325=20|\boldsymbol{A}|=\left|\begin{array}{ccc}1 & 0 & 1 \\ 2 & 1 & 0 \\ -3 & 2 & -5\end{array}\right|=2 \neq 0,知A\boldsymbol{A}可逆

\begin{align}\begin{array}{c} A_{11}=\left|\begin{array}{cc} 1 & 0 \\ 2 & -5 \end{array}\right|=-5, \quad A_{12}=-\left|\begin{array}{cc} 2 & 0 \\ -3 & -5 \end{array}\right|=10, \quad A_{13}=\left|\begin{array}{cc} 2 & 1 \\ -3 & 2 \end{array}\right|=7, \\ A_{21}=-\left|\begin{array}{cc} 0 & 1 \\ 2 & -5 \end{array}\right|=2, \quad A_{22}=\left|\begin{array}{cc} 1 & 1 \\ -3 & -5 \end{array}\right|=-2, \quad A_{23}=-\left|\begin{array}{cc} 1 & 0 \\ -3 & 2 \end{array}\right|=-2, \\ A_{31}=\left|\begin{array}{ll} 0 & 1 \\ 1 & 0 \end{array}\right|=-1, \quad A_{32}=-\left|\begin{array}{ll} 1 & 1 \\ 2 & 0 \end{array}\right|=2, \quad A_{33}=\left|\begin{array}{ll} 1 & 0 \\ 2 & 1 \end{array}\right|=1, \end{array}\end{align}

因此

\begin{align}\boldsymbol{A}^{-1}=\frac{1}{|\boldsymbol{A}|} \boldsymbol{A}^{*}=\frac{1}{2}\left[\begin{array}{ccc} -5 & 2 & -1 \\ 10 & -2 & 2 \\ 7 & -2 & 1 \end{array}\right]=\left[\begin{array}{ccc} -\frac{5}{2} & 1 & -\frac{1}{2} \\ 5 & -1 & 1 \\ \frac{7}{2} & -1 & \frac{1}{2} \end{array}\right]\end{align}


A=[120220345],A\boldsymbol{A}=\left[\begin{array}{lll}1 & 2 & 0 \\ 2 & 2 & 0 \\ 3 & 4 & 5\end{array}\right], \boldsymbol{A}^{*}A\boldsymbol{A}的伴随矩阵,则(A)1\left(\boldsymbol{A}^{*}\right)^{-1}等于多少

分析:利用公式AA=AE\boldsymbol{A} \boldsymbol{A}^{*}=|\boldsymbol{A}| \boldsymbol{E}。当A0|\boldsymbol{A}| \neq 0时,有AAA=E\frac{\boldsymbol{A}}{|\boldsymbol{A}|} \boldsymbol{A}^{*}=\boldsymbol{E},故 (A)1=AA\left(\boldsymbol{A}^{*}\right)^{-1}=\frac{\boldsymbol{A}}{|\boldsymbol{A}|},这样不需要先求出A\boldsymbol{A}^{*},再求(A)1\left(\boldsymbol{A}^{*}\right)^{-1}

解:

\begin{align}|\boldsymbol{A}|=\left|\begin{array}{lll} 1 & 2 & 0 \\ 2 & 2 & 0 \\ 3 & 4 & 5 \end{array}\right|=-10 \neq 0\end{align}

由公式AA=AE\boldsymbol{A} \boldsymbol{A}^{*}=|\boldsymbol{A}| \boldsymbol{E},得AAA=E\frac{\boldsymbol{A}}{|\boldsymbol{A}|} \boldsymbol{A}^{*}=\boldsymbol{E},故A\boldsymbol{A}^{*}可逆,且

\begin{align}\left(\boldsymbol{A}^{*}\right)^{-1}=\frac{\boldsymbol{A}}{|\boldsymbol{A}|}=-\frac{1}{10}\left[\begin{array}{lll}1 & 2 & 0 \\ 2 & 2 & 0 \\ 3 & 4 & 5\end{array}\right]\end{align}


A\boldsymbol{A}是3阶矩阵,已知A1=[211121112]\boldsymbol{A}^{-1}=\left[\begin{array}{lll}2 & 1 & 1 \\ 1 & 2 & 1 \\ 1 & 1 & 2\end{array}\right],则A\left|\boldsymbol{A}^{*}\right|等于多少

解:由AA=AE\boldsymbol{A} \boldsymbol{A}^{*}=|\boldsymbol{A}| \boldsymbol{E},当A\boldsymbol{A}可逆时,有

A=AA1\boldsymbol{A}^{*}=|\boldsymbol{A}| \boldsymbol{A}^{-1}

两边取行列式,得

\begin{align}\left|\boldsymbol{A}^{*}\right|=|| \boldsymbol{A}\left|\boldsymbol{A}^{-1}\right|=|\boldsymbol{A}|^{n} \cdot\left|\boldsymbol{A}^{-1}\right|=\frac{|\boldsymbol{A}|^{n}}{|\boldsymbol{A}|}=|\boldsymbol{A}|^{n-1}=\frac{1}{\left|\boldsymbol{A}^{-1}\right|^{n-1}}\end{align}

其中n=3n=3

\begin{align}\left|\boldsymbol{A}^{-1}\right|=\left|\begin{array}{lll} 2 & 1 & 1 \\ 1 & 2 & 1 \\ 1 & 1 & 2 \end{array}\right|=\left|\begin{array}{ccc} 0 & -3 & -1 \\ 1 & 2 & 1 \\ 0 & -1 & 1 \end{array}\right|=4\end{align}

A=1431=116\left|\boldsymbol{A}^{*}\right|=\frac{1}{4^{3-1}}=\frac{1}{16}


A,B\boldsymbol{A}, \boldsymbol{B}nn阶方阵,A=2,B=4|\boldsymbol{A}|=2,|\boldsymbol{B}|=-4,则2BA1\left|2 \boldsymbol{B}^{*} \boldsymbol{A}^{-1}\right|等于多少

解:kA=knA,AB=AB,A1=1A,B=Bn1|k \boldsymbol{A}|=k^{n}|\boldsymbol{A}|,|\boldsymbol{A} \boldsymbol{B}|=|\boldsymbol{A}||\boldsymbol{B}|,\left|\boldsymbol{A}^{-1}\right|=\frac{1}{|\boldsymbol{A}|},\left|\boldsymbol{B}^{*}\right|=|\boldsymbol{B}|^{n-1},故

\begin{align}\left|2 \boldsymbol{B}^{*} \boldsymbol{A}^{-1}\right|=2^{n}\left|\boldsymbol{B}^{*}\right|\left|\boldsymbol{A}^{-1}\right|=2^{n}|\boldsymbol{B}|^{n-1} \cdot \frac{1}{|\boldsymbol{A}|}=(-8)^{n-1}\end{align}

初等变换和初等矩阵

初等矩阵的定义

由单位矩阵经过一次初等变换得到的矩阵称为初等矩阵,以3阶矩阵为例。

  • E2(k)=[1000k0001]\boldsymbol{E}_{2}(k)=\left[\begin{array}{lll}1 & 0 & 0 \\ 0 & k & 0 \\ 0 & 0 & 1\end{array}\right]E\boldsymbol{E}的第2行(或第2列)乘kk倍,称为倍乘初等矩阵。

定义:Ei(k)(k0)\boldsymbol{E}_{i}(k)(k \neq 0)表示单位矩阵E\boldsymbol{E}的第ii行(或第ii列)乘以非零常数kk所得的初等矩阵。

  • E12=[010100001]\boldsymbol{E}_{12}=\left[\begin{array}{lll}0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1\end{array}\right]E\boldsymbol{E}的第1,2行(或第 1,2 列)互换,称为互换初等矩阵.

定义:Eij\boldsymbol{E}_{i j}表示单位矩阵E\boldsymbol{E}交换第ii行与第jj行(或交换第ii列与第jj列)所得的初等矩阵。

  • E31(k)=[100010k01]\boldsymbol{E}_{31}(k)=\left[\begin{array}{lll}1 & 0 & 0 \\ 0 & 1 & 0 \\ k & 0 & 1\end{array}\right]E\boldsymbol{E}的第1行的kk倍加到第3行(或第3列的kk倍加到第1列),称为倍加初等矩阵。

定义:Eij(k)\boldsymbol{E}_{i j}(k)表示单位矩阵E\boldsymbol{E}的第jj行的kk倍加到第ii行(或第ii列的kk倍加到第jj列))所得的初等矩阵。

初等行矩阵的作用

初等行矩阵乘上矩阵A\boldsymbol{A},就相当于在矩阵A\boldsymbol{A}上实施了对应的初等行变换。比如将单位矩阵的二、三行进行对换就得到了该初等操作对应的初等矩阵。再将该初等矩阵乘上矩阵A\boldsymbol{A},就相当于将矩阵A\boldsymbol{A}的二、三行进行了对换:

1

性质与重要公式

关于置换

初等矩阵的转置仍是初等矩阵

\begin{align}E_{i j}^{T}=E_{i j} ,\quad E_{i}^{T}(k)=E_{i}(k), \quad E_{i j}^{\top}(k)=E_{j i}(k)\end{align}

关于行列式

\begin{align}\left|\boldsymbol{E}_{i}(k)\right|=k \neq 0, \quad\left|\boldsymbol{E}_{i j}\right|=-1 \neq 0, \quad\left|\boldsymbol{E}_{i j}(k)\right|=1 \neq 0,\end{align}

故初等矩阵都是可逆矩阵,且

\begin{align}\left[\boldsymbol{E}_{i}(k)\right]^{-1}=\boldsymbol{E}_{i}\left(\frac{1}{k}\right), \quad \boldsymbol{E}_{i j}^{-1}=\boldsymbol{E}_{i j}, \quad\left[\boldsymbol{E}_{i j}(k)\right]^{-1}=\boldsymbol{E}_{i j}(-k),\end{align}

其逆矩阵仍是同一类型的初等矩阵。

关于可逆矩阵

AA是可逆矩阵,则AA可以表示成有限个初等矩阵的乘积,即A=P1P2PsA=P_{1}P_{2}\cdots P_{s},其中$P_{1},P_{2},P_{3},\cdots,P_{s} $是初等矩阵

关于矩阵的变换

nn阶矩阵AA进行初等行变换,相当于矩阵AA左乘相应的初等矩阵。同样,对AA进行初等列变换,相当于矩阵AA右乘相应的初等矩阵。(口诀:左行右列定理

举个例子

单位矩阵为E=[1001]E=\begin{bmatrix} 1 & 0\\ 0 &1 \end{bmatrix}​,初等变换矩阵为E12=[0110]E_{12}=\begin{bmatrix} 0 & 1\\ 1 &0 \end{bmatrix},矩阵A=[1123]A=\begin{bmatrix} 1 & -1\\ 2 & 3 \end{bmatrix}

可以看到下面的两个运输,如果初等矩阵在左边那么就是行变换,如果是在右边就是列变换

\begin{align}E_{12}A=\begin{bmatrix} 0 & 1\\ 1 &0 \end{bmatrix}\begin{bmatrix} 1 & -1\\ 2 & 3 \end{bmatrix}=\begin{bmatrix} 2 & 3\\ 1 & -1 \end{bmatrix}&\\ AE_{12}=\begin{bmatrix} 1 & -1\\ 2 & 3 \end{bmatrix}\begin{bmatrix} 0 & 1\\ 1 &0 \end{bmatrix}=\begin{bmatrix} -1 & 1\\ 3 & 2 \end{bmatrix}\end{align}

用初等变换求逆矩阵的方法(高斯若尔当法求逆矩阵)

\begin{align}\begin{array}{c} {\left[\begin{array}{l:l} \boldsymbol{A} & \boldsymbol{E} \end{array}\right] \xrightarrow{\text { 初等行变换 }}\left[\boldsymbol{E}: \boldsymbol{A}^{-1}\right]} \\ {\left[\begin{array}{l} \boldsymbol{A} \\ \boldsymbol{E} \end{array}\right] \xrightarrow{\text { 初等列变换 }}\left[\begin{array}{c} \boldsymbol{E} \\ \boldsymbol{A}^{-1} \end{array}\right] } \end{array}\end{align}

对角矩阵

nn阶方阵如下:

\begin{align}\Lambda_{n}=\begin{pmatrix}\lambda_1&0&...&0\\0&\lambda_2&...&0\\...&...&&...\\ 0&0&...&\lambda_n\end{pmatrix}\end{align}

对角线以外的元素都是0,这种方阵称为对角矩阵,简称对角阵,也记作:

\begin{align}\Lambda_{n}=diag(\lambda_1,\lambda_2,...,\lambda_n)\end{align}

单位矩阵

特别的,如果对角线上的元素全为1,也就是λ1=λ2==λn=1\lambda_1=\lambda_2=\cdots=\lambda_n=1

\begin{align}I_n=\begin{pmatrix}1&0&...&0\\0&1&...&0\\...&...&&...\\ 0&0&...&1\end{pmatrix}\end{align}

该对角阵称为nn阶单位矩阵,或者简称为单位阵。在国内教材中,单位阵一般用E\boldsymbol{E}表示。

例题

解题思路:大体流程先变成右上三角行列式,然后逐步变成对角矩阵,最后变成nn阶单位矩阵

A=[021112111]\boldsymbol{A}=\left[\begin{array}{ccc}0 & 2 & -1 \\ 1 & 1 & 2 \\ -1 & -1 & -1\end{array}\right],求A1\boldsymbol{A}^{-1}

注 :括号的内容表示行

\begin{align}\begin{array}{l} {\left[\begin{array}{ccc:ccc} 0 & 2 & -1 & 1 & 0 & 0 \\ 1 & 1 & 2 & 0 & 1 & 0 \\ -1 & -1 & -1 & 0 & 0 & 1 \end{array}\right] \xrightarrow{(1) \leftrightarrow(2)}\left[\begin{array}{ccc:ccc} 1 & 1 & 2 & 0 & 1 & 0 \\ 0 & 2 & -1 & 1 & 0 & 0 \\ -1 & -1 & -1 & 0 & 0 & 1 \end{array}\right]} \\ \xrightarrow{(3)+(1)}\left[\begin{array}{ccc:ccc} 1 & 1 & 2 & 0 & 1 & 0 \\ 0 & 2 & -1 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 & 1 & 1 \end{array}\right] \xrightarrow[(2)+(3)]{(1)-2(3)}\left[\begin{array}{ccc:ccc} 1 & 1 & 0 & 0 & -1 & -2 \\ 0 & 2 & 0 & 1 & 1 & 1 \\ 0 & 0 & 1 & 0 & 1 & 1 \end{array}\right] \\ \xrightarrow{\frac{1}{2}(2)}\left[\begin{array}{ccc:ccc} 1 & 1 & 0 & 0 & -1 & -2 \\ 0 & 1 & 0 & \frac{1}{2} & \frac{1}{2} & \frac{1}{2} \\ 0 & 0 & 1 & 0 & 1 & 1 \end{array}\right] \xrightarrow{(1)-(2)}\left[\begin{array}{ccc:ccc} 1 & 0 & 0 & -\frac{1}{2} & -\frac{3}{2} & -\frac{5}{2} \\ 0 & 1 & 0 & \frac{1}{2} & \frac{1}{2} & \frac{1}{2} \\ 0 & 0 & 1 & 0 & 1 & 1 \end{array}\right] \\ \end{array}\end{align}

所以

\begin{align}\boldsymbol{A}^{-1}=\begin{bmatrix} -\frac{ 1}{2} & -\frac{ 3}{2} &-\frac{ 5}{2} \\ \frac{ 1}{2} & \frac{ 1}{2} &\frac{ 1}{2} \\ 0 & 1 &1 \end{bmatrix}\end{align}


A\boldsymbol{A}是3阶可逆矩阵,将A\boldsymbol{A}的第1行和第2行互换后得到矩阵B\boldsymbol{B},其中A1=[a11a12a13a21a22a23a31a32a33]\boldsymbol{A}^{-1}=\left[\begin{array}{lll}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{array}\right],则B\boldsymbol{B}可逆,且B1\boldsymbol{B}^{-1}等于多少?

B=E12A\boldsymbol{B}=\boldsymbol{E}_{12}\boldsymbol{A},其中E12=[010100001]\boldsymbol{E}_{12}=\left[\begin{array}{lll}0&1&0\\1&0&0\\0&0&1\end{array}\right],故

\begin{align}\boldsymbol{B}^{-1}=\left(\boldsymbol{E}_{12}\boldsymbol{A}\right)^{-1}=\boldsymbol{A}^{-1}\boldsymbol{E}_{12}^{-1}=\boldsymbol{A}^{-1}\boldsymbol{E}_{12}=\left[\begin{array}{ccc}a_{12}&a_{11}&a_{13}\\a_{22}&a_{21}&a_{23}\\a_{32}&a_{31}&a_{33}\end{array}\right]\end{align}

分块矩阵

对于行数和列数较多的矩阵A\boldsymbol{A},运算时常采用分块法,使大矩阵的运算化成小矩阵的运算。具体操作就是像下面这样,将矩阵A\boldsymbol{A}用若干条纵线和横线分成许多个小矩阵,每一个小矩阵称为A\boldsymbol{A}子块

\begin{align}A=\left( {\begin{array}{c|c} \overbrace{ \begin{matrix} a_{11}&\cdots&a_{1r}\\ \vdots& &\vdots\\ a_{s1}&\cdots&a_{sr}\\ \end{matrix}}^{\Large 子块A_{11}} &\overbrace{ \begin{matrix} a_{1(r+1)}&\cdots&a_{1n}\\ \vdots& &\vdots\\ a_{s(r+1)}&\cdots&a_{sn}\\ \end{matrix}}^{\Large 子块A_{12}}\\ \hline \underbrace{ \begin{matrix} a_{(s+1)1}&\cdots&a_{(s+1)r}\\ \vdots& &\vdots\\ a_{m1}&\cdots&a_{mr}\\ \end{matrix}}_{\Large 子块A_{21}} &\underbrace{ \begin{matrix} a_{(s+1)(r+1)}&\cdots&a_{(s+1)n}\\ \vdots& &\vdots\\ a_{m(r+1)}&\cdots&a_{mn}\\ \end{matrix}}_{\Large 子块A_{22}} \end{array}} \right)\end{align}

因此A\boldsymbol{A}可以如下改写,其中每个元素都是子块(矩阵):

\begin{align}A=\begin{pmatrix}A_{11}&A_{12}\\A_{21}&A_{22}\end{pmatrix}\end{align}

改写后,以子块为元素的矩阵称为分块矩阵

基础运算方式

加法

A\boldsymbol{A}B\boldsymbol{B}的行数、列数都相同,并且采用相同的分块法:

\begin{align}A=\begin{pmatrix}A_{11}&\cdots&A_{1r}\\\vdots&&\vdots\\ A_{s1}&\cdots&A_{sr}\end{pmatrix},\quad B=\begin{pmatrix}B_{11}&\cdots&B_{1r}\\ \vdots&&\vdots\\B_{s1}&\cdots&B_{sr}\end{pmatrix}\end{align}

它们相加的结果为:

\begin{align}A+B=\begin{pmatrix}A_{11}+B_{11}&\cdots&A_{1r}+B_{1r}\\ \vdots&&\vdots\\A_{s1}+B_{s1}&\cdots&A_{sr}+B_{sr} \end{pmatrix}\end{align}

数乘

A=(A11A1rAs1Asr)\boldsymbol{A}=\begin{pmatrix}A_{11}&\cdots&A_{1r}\\ \vdots&&\vdots\\A_{s1}&\cdots&A_{sr}\end{pmatrix},那么:λA=(λA11λA1rλAs1λAsr),λR\lambda \boldsymbol{A}=\begin{pmatrix}\lambda A_{11}&\cdots&\lambda A_{1r}\\\vdots&&\vdots\\\lambda A_{s1}&\cdots&\lambda A_{sr}\end{pmatrix},\lambda\in\mathbb{R}

乘法

A\boldsymbol{A}m×lm\times l矩阵,B\boldsymbol{B}l×nl\times n矩阵,分块成:

\begin{align}A=\begin{pmatrix}A_{11}&\cdots&A_{1t}\\ \vdots&&\vdots\\A_{s1}&\cdots&A_{st}\end{pmatrix},\quad B=\begin{pmatrix}B_{11}&\cdots&B_{1r}\\\vdots&&\vdots\\ B_{t1}&\cdots&B_{tr}\end{pmatrix}\end{align}

其中Ai1A_{i1}Ai2A_{i2}\cdotsAitA_{it}的列数分别等于B1jB_{1j}B2jB_{2j}\cdotsBtjB_{tj}的行数,也就是都符合矩阵乘法的合法性,那么这两个分块矩阵的乘法结果为:

\begin{align}AB=\begin{pmatrix}C_{11}&\cdots&C_{1r}\\ \vdots&&\vdots\\C_{s1}&\cdots&C_{sr}\end{pmatrix}\end{align}

计算CijC_{ij}的方法和矩阵乘法的点积观点一样:

\begin{align}C_{ij}=\sum_{k=1}^{t}A_{ik}B_{kj} \quad(i=1,\cdots,s;j=1,\cdots,r)\end{align}

分块矩阵的转置

下面是分块矩阵A\boldsymbol{A}以及它的转置:

\begin{align}A=\begin{pmatrix}A_{11}&\cdots&A_{1r}\\ \vdots&&\vdots\\A_{s1}&\cdots&A_{sr}\end{pmatrix},\quad A^\mathrm{T}=\begin{pmatrix}A_{11}^\mathrm{T}&\cdots&A_{s1}^\mathrm{T}\\ \vdots&&\vdots\\A_{1r}^\mathrm{T}&\cdots&A_{sr}^\mathrm{T}\end{pmatrix}\end{align}

分块矩阵的逆

A=[0011000011000011300012000]\boldsymbol{A}=\left[\begin{array}{ccccc} 0 & 0 & 1 & -1 & 0 \\ 0 & 0 & 0 & 1 & -1 \\ 0 & 0 & 0 & 0 & 1 \\ 1 & 3 & 0 & 0 & 0 \\ -1 & 2 & 0 & 0 & 0 \end{array}\right],求A1\boldsymbol{A}^{-1}

A\boldsymbol{A}分块如下,可以记作[OBCO]\left[\begin{array}{ll} \boldsymbol{O} & \boldsymbol{B} \\ \boldsymbol{C} & \boldsymbol{O} \end{array}\right]

\begin{align}\boldsymbol{A}=\left[\begin{array}{cc:ccc} 0 & 0 & 1 & -1 & 0 \\ 0 & 0 & 0 & 1 & -1 \\ 0 & 0 & 0 & 0 & 1 \\ \hdashline 1 & 3 & 0 & 0 & 0 \\ -1 & 2 & 0 & 0 & 0 \end{array}\right] =\left[\begin{array}{ll} \boldsymbol{O} & \boldsymbol{B} \\ \boldsymbol{C} & \boldsymbol{O} \end{array}\right]\end{align}

其中

\begin{align}\boldsymbol{B}=\left[\begin{array}{ccc} 1 & -1 & 0 \\ 0 & 1 & -1 \\ 0 & 0 & 1 \end{array}\right], \quad \boldsymbol{C}=\left[\begin{array}{cc} 1 & 3 \\ -1 & 2 \end{array}\right]\end{align}

\begin{align}\boldsymbol{B}^{-1}=\left[\begin{array}{lll} 1 & 1 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{array}\right], \quad \boldsymbol{C}^{-1}=\left[\begin{array}{cc} \frac{2}{5} & -\frac{3}{5} \\ \frac{1}{5} & \frac{1}{5} \end{array}\right]\end{align}

\begin{align}\boldsymbol{A}^{-1}=\left[\begin{array}{cc} \boldsymbol{O} & \boldsymbol{C}^{-1} \\ \boldsymbol{B}^{-1} & \boldsymbol{O} \end{array}\right]=\left[\begin{array}{ccccc} 0 & 0 & 0 & \frac{2}{5} & -\frac{3}{5} \\ 0 & 0 & 0 & \frac{1}{5} & \frac{1}{5} \\ 1 & 1 & 1 & 0 & 0 \\ 0 & 1 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 & 0 \end{array}\right]\end{align}

【注】副对角线分块矩阵的逆,可推广如下

\begin{align}\boldsymbol{A}=\left[\begin{array}{llll} & & & \boldsymbol{A}_{1} \\ & & \boldsymbol{A}_{2} & \\ & \cdots & & \\ \boldsymbol{A}_{s} & & & \end{array}\right]\end{align}

其中Ai(i=1,2,,s)\boldsymbol{A}_{i}(i=1,2, \cdots, s)可逆,则A\boldsymbol{A}可逆,且

\begin{align}\boldsymbol{A}^{-1}=\left[\begin{array}{llll} & & & \boldsymbol{A}_{s}^{-1} \\ & & \therefore & \\ & \boldsymbol{A}_{2}^{-1} & & \\ \boldsymbol{A}_{1}^{-1} & & & \end{array}\right]\end{align}