线性代数学习笔记完整版

1 行列式

1.1 方程组与行列式

1.1.1 二元线性方程组和二阶行列式

1.1.2 三元线性方程组和三阶行列式

1.2 nn 阶行列式

1.2.1 排序与逆序数

1.2.2 nn 阶行列式

a11a12a1na21a22a2nan1an2ann=(j1j2jn)(1)τ(j1j2jn)a1j1a2j2anjn\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} = \sum_{(j_1j_2 \cdots j_n)} (-1)^{\tau (j_1j_2 \cdots j_n)} a_{1j_1}a_{2j_2} \cdots a_{nj_n}

每次计算, 每组每行取一个, 且每行不重复

例如:

a11a12a13a14a21a22a23a24a31a32a33a34a41a42a43a44\begin{vmatrix} a_{11} & \color{#00aaff}{a_{12}} & a_{13} & a_{14} \\ a_{21} & a_{22} & a_{23} & \color{#00aaff}{a_{24}} \\ \color{#00aaff}{a_{31}} & a_{32} & a_{33} & a{34} \\ a_{41} & a_{42} & \color{#00aaff}{a_{43}} & a_{44} \end{vmatrix}

则某一项为

a12a24a31a43\color{#00aaff}{a_{12}a_{24}a_{31}a_{43}}

判断符号为(按行 12341234 ) τ(2413)=3\tau (2413) = 3

或(按列 12341234 ) τ(3142)=3\tau (3142) = 3

1.3 行列式的性质和计算

1.3.1 行列式的性质

性质1 nn 阶行列式行列互换, 值不变, 记作 D=DTD = D^T

性质2 互换两行, 行列式变号, 记作 rirjr_i \leftrightarrow r_j

性质3 某行同乘 kk , 行列式乘 kk

性质4 行列式某行各元素为两数之和, 行列式等于两行列式之和

a11a12a1nai1+ai1ai2+ai2ain+ainan1an2ann=a11a12a1nai1ai2ainan1an2ann+a11a12a1nai1ai2ainan1an2ann\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ \vdots & \vdots & & \vdots \\ a_{i1} + a'_{i1} & a_{i2} + a'_{i2} & \cdots & a_{in} + a'_{in} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ \vdots & \vdots & & \vdots \\ a_{i1} & a_{i2} & \cdots & a_{in} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} + \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ \vdots & \vdots & & \vdots \\ a'_{i1} & a'_{i2} & \cdots & a'_{in} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix}

性质5 某行乘 kk 加到另一行, 值不变, 记作 ri+krjr_i + kr_j

对于列, 则将 rr 换为 cc

推论1 某两行对应相等, 行列式为零

推论2 某两行成比例, 行列式为零

推论3 某行全为零, 行列式为零

1.3.2 行列式的计算

化为上三角

1.4 行列式按行展开

1.4.1 拉普拉斯展开定理

定义1 行列式中划去 aija_{ij} 所在行列, 剩下元素构成的行列式称 aija_{ij} 的余子式, 记作 MijM_{ij} ; 余子式加上代数符号 (1)i+j(-1)^{i + j} 称为代数余子式, 记作 AijA_{ij} , 即 Aij=(1)i+jMijA_{ij} = (-1)^{i + j} M_{ij}

定理1 (拉普拉斯展开定理)行列式等于其任一行各元素与其代数余子式乘积之和

D=k=1naikAik,i=1,2,,nD = \sum_{k = 1}^{n} a_{ik}A_{ik}, i = 1, 2, \cdots ,n

定理2 行列式任一行各元素与另一行对应元素代数余子式乘积之和为零

k=1naikAjk=0ij,i=1,2,,n\sum_{k = 1}^{n} a_{ik}A_{jk} = 0 \\ i \ne j, i = 1, 2, \cdots , n

1.4.2 拉普拉斯展开定理应用

范德蒙德行列式

Dn=111x1x2xnx12x22xn2x1n1x2n1xnn1=1j<in(xixj)D_n = \begin{vmatrix} 1 & 1 & \cdots & 1 \\ x_1 & x_2 & \cdots & x_n \\ x_1^2 & x_2^2 & \cdots & x_n^2 \\ \vdots & \vdots & & \vdots \\ x_1^{n - 1} & x_2^{n - 1} & \cdots & x_n^{n - 1} \end{vmatrix} = \prod_{1 \le j < i \le n} (x_i - x_j)

1.5 克拉默法则

定理1 (克拉默法则)

nn 个方程的 nn 元方程组

{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2an1x1+an2x2++annxn=bn\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots +a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \cdots +a_{2n}x_n = b_2 \\ \cdots \cdots \cdots \cdots \\ a_{n1}x_1 + a_{n2}x_2 + \cdots +a_{nn}x_n = b_n \end{cases}

若其系数行列式

D=a11a12a1na21a22a2nan1an2ann0D = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} \ne 0

则线性方程组有唯一解 记作

x1=D1D,x2=D2D,,xn=DnDx_1 = \frac{D_1}{D} , x_2 = \frac{D_2}{D} , \cdots , x_n = \frac{D_n}{D}

其中 Dj(j=1,2,,n)D_j(j = 1, 2, \cdots , n) 为用常数项 b1,b2,,bnb_1, b_2, \cdots , b_n 代替 DDjj 列对应元素所得行列式

Dj=a11a1,j1b1a1,j+1a1nan1an,j1bnan,j+1annD_j = \begin{vmatrix} a_{11} & \cdots & a_{1, j - 1} & b_1 & a_{1, j + 1} & \cdots & a_{1n} \\ \vdots & & \vdots & \vdots & \vdots & & \vdots \\ a_{n1} & \cdots & a_{n, j - 1} & b_n & a_{n, j + 1} & \cdots & a_{nn} \end{vmatrix}

2 矩阵

2.1 矩阵及其运算

2.1.1 矩阵的概念

定义1 m×nm \times n 个数 aij(i=1,2,,m;j=1,2,,n)a_{ij} (i = 1, 2, \cdots , m; j = 1, 2, \cdots , n) 有序排为 mmnn 列的数表称 mmnn 列的矩阵, 简称 m×nm \times n 矩阵, 记作 (aij)m×n(a_{ij})_{m \times n}

(a11a12a1na21a22a2nam1am2amn)\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}

矩阵可以和线性方程组形成一一对应关系

{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots +a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \cdots +a_{2n}x_n = b_2 \\ \cdots \cdots \cdots \cdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots +a_{mn}x_n = b_m \end{cases}

(a11a12a1nb1a21a22a2nb2am1am2amnbm)\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ \vdots & \vdots & & \vdots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} & b_m \end{pmatrix}

2.1.2 矩阵的运算

  1. 矩阵的加法与减法

定义2 两个同型矩阵的和, 为各个元素和构成的矩阵

A,B,CA, B, Cm×nm \times n矩阵, OO 为同型零矩阵

A=(aij)m×n,A=(aij)m×nA = (a_{ij})_{m \times n} , -A = (-a_{ij})_{m \times n} , 称为负矩阵

  1. 矩阵的数乘

定义3 矩阵 (λaij)m×n(\lambda a_{ij})_{m \times n} 为数 λ\lambda 与矩阵 AA 的乘积, 简称数乘, 记作 λA\lambda A , 为各元素与数乘积构成新矩阵

  1. 矩阵的乘法

定义4 矩阵 A=(aik)m×s,B=(bkj)s×nA = (a_{ik})_{m \times s}, B = (b_{kj})_{s \times n} , 则 C=(cij)m×nC = (c_{ij})_{m \times n}A,BA, B 乘积, 记作 C=ABC = AB

矩阵 ABABii 行第 jj 列元素为 AA 的第 ii 行与 BB 的第 jj 列各个元素乘积之和

一横乘一竖, 对应相乘后相加

A=(103210),B=(411120) AB=(14+0(1)+3211+01+3024+1(1)+0221+11+00)=(10173)A = \begin{pmatrix} 1 & 0 & 3 \\ 2 & 1 & 0 \end{pmatrix} , B = \begin{pmatrix} 4 & 1 \\ -1 & 1 \\ 2 & 0 \end{pmatrix} \\ \\ \ \\ AB = \begin{pmatrix} 1*4+0*(-1)+3*2 & 1*1+0*1+3*0 \\ 2*4+1*(-1)+0*2 & 2*1+1*1+0*0 \end{pmatrix} = \begin{pmatrix} 10 & 1 \\ 7 & 3 \end{pmatrix}

一般地, ABBAAB \ne BA , 即矩阵乘法不满足交换律

一般地, AC=ADAC = AD 时, 不一定有 C=DC = D , 即矩阵乘法不满足消去律

定义5 若 AB=BAAB = BA , 则称 AABB 可交换, 简称 ABAB 可换

  1. 矩阵的转置

定义6 将 m×nm \times n 矩阵 A=(aij)m×nA = (a_{ij})_{m \times n} 行列互换后, 得到的 n×mn \times m 矩阵称为 AA 的转置, 记作 ATA^T

2.1.3 方阵

行列数相同的矩阵成为方阵, 行(列)数成为阶数 nn , nn 阶方阵记作 AnA_n

AAnn 阶方阵, 可定义乘方运算

Am=AAAA^m = A \cdot A \cdot \cdots \cdot A

显然

AmAl=Am+l,(Am)l=AmlA^m \cdot A^l = A^{m + l}, (A^m)^l = A^{ml}

一般地, (AB)mAmBm(AB)^m \ne A^mB^m

方阵 AA 构成的行列式记作 A\left | A \right |det(A)det(A) . 若 A0\left | A \right | \ne 0 , 则称 AA 为非奇异矩阵

方阵 AA 主对角线元素成为对角元, 对角元全为 11 其余元素全为 00nn 阶方阵称 nn 阶单位矩阵, 记作 EnE_nInI_n , 即

En=(10101)n×nE_n = \begin{pmatrix} 1 & & & 0 \\ & 1 & & \\ & & \ddots & \\ 0 & & & 1 \end{pmatrix} _{n \times n}

对于任意矩阵 Am×nA_{m \times n}, 有

Am×nEn=Am×n,EnAm×n=Am×nA_{m \times n}E_n = A_{m \times n} , E_nA_{m \times n} = A_{m \times n}

几个重要方阵

2.1.3.1 对角矩阵

(a110a220ann)\begin{pmatrix} a_{11} & & & 0 \\ & a_{22} & & \\ & & \ddots & \\ 0 & & & a_{nn} \end{pmatrix}

简记为 diag(a11,a22,,ann)diag(a_{11}, a_{22}, \cdots , a_{nn})

若对角线都相等, 成为数量矩阵

两对角矩阵和或积仍为对角矩阵, 对角元为对应对角元和或积

2.1.3.2 三角形矩阵

分为上三角和下三角

2.1.3.3 对称矩阵与反称矩阵

AT=AA^T = A 的矩阵为对称矩阵, AT=AA^T = -A的矩阵为反称矩阵

对称矩阵沿主对角线对称, 反称矩阵沿主对角线成相反数

A+ATA + A^T 为对称矩阵, AATA - A^T 为反称矩阵

任意矩阵可表示为一个对称矩阵和一个反称矩阵和

A=12(A+AT)+12(AAT)A = \frac{1}{2} (A + A^T) + \frac{1}{2} (A - A^T)

2.2 矩阵的初等变换与秩

2.2.1 矩阵的初等变换

定义1 对矩阵执行下面三种变形, 称为矩阵的初等行变换

若对列执行, 称为矩阵的初等列变换

初等行变换和初等列变换统称矩阵的初等变换, AA 初等变换为 BB , 记作 ABA \rightarrow B

AA 进行如下初等行变换, 得到 BB , 称为行阶梯形矩阵

A=(11110012111210210321)r4r1r3+r1(11110012110121201211)r3r2r4+r2(11110012110000100002)r4+2r3(11110012110000100000)=BA = \begin{pmatrix} 1 & -1 & 1 & 1 & 0 \\ 0 & 1 & 2 & 1 & 1 \\ -1 & 2 & 1 & 0 & 2 \\ 1 & 0 & 3 & 2 & -1 \end{pmatrix} \xrightarrow[r_4 - r_1]{r_3 + r_1} \begin{pmatrix} 1 & -1 & 1 & 1 & 0 \\ 0 & 1 & 2 & 1 & 1 \\ 0 & 1 & 2 & 1 & 2 \\ 0 & 1 & 2 & 1 & -1 \end{pmatrix} \xrightarrow[r_3 - r_2]{r_4 + r_2} \begin{pmatrix} 1 & -1 & 1 & 1 & 0 \\ 0 & 1 & 2 & 1 & 1 \\ 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & -2 \end{pmatrix} \xrightarrow{r_4 + 2r_3} \begin{pmatrix} 1 & -1 & 1 & 1 & 0 \\ 0 & 1 & 2 & 1 & 1 \\ 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & 0 \end{pmatrix} = B

行阶梯形矩阵

(0000000)\begin{pmatrix} \star & \star & \cdots & \star & \cdots & \star \\ \color{#00aaff}{0} & \star & \cdots & \star & \cdots & \star \\ \vdots & \color{#00aaff}{\vdots} & & \vdots & & \vdots \\ 0 & \color{#00aaff}{0} & \color{#00aaff}{\cdots} & \star & \cdots & \star \\ \vdots & \vdots & & \color{#00aaff}{\vdots} & & \vdots \\ 0 & 0 & \cdots & \color{#00aaff}{0} & \color{#00aaff}{\cdots} & \color{#00aaff}{0} \end{pmatrix}

BB 再进行初等行变换得到 CC

Br1+r2r2r3(10320012100000100000)=CB \xrightarrow[r_1 + r_2]{r_2 - r_3} \begin{pmatrix} 1 & 0 & 3 & 2 & 0 \\ 0 & 1 & 2 & 1 & 0 \\ 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & 0 \end{pmatrix} = C

行最简形矩阵

每一个非零行的非零首元都是 11 , 且非零首元所在列的其余元都为 00

(10320012100000100000)\begin{pmatrix} 1 & \color{#00aaff}{0} & 3 & 2 & \color{#00aaff}{0} \\ 0 & 1 & 2 & 1 & \color{#00aaff}{0} \\ 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & 0 \end{pmatrix}

CC 进行初等列变换

Cc42c1c33c1c4c2c32c1(10000010000000100000)c3c5(10000010000010000000)=DC \xrightarrow[c_4 - 2c_1]{c_3 - 3c_1} \xrightarrow[c_4 - c_2]{c_3 - 2c_1} \begin{pmatrix} 1 & 0 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & 0 \end{pmatrix} \xrightarrow{c_3 \leftrightarrow c_5} \begin{pmatrix} 1 & 0 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 \end{pmatrix} = D

DD 称为 AA 的标准型

标准型

左上角为一个单位矩阵, 其余元素均为 00

D=(1000001000001000001000000)D = \begin{pmatrix} \color{#00aaff}{1} & \color{#00aaff}{0} & \color{#00aaff}{\cdots} & \color{#00aaff}{0} & 0 & \cdots & 0 \\ \color{#00aaff}{0} & \color{#00aaff}{1} & \color{#00aaff}{\cdots} & \color{#00aaff}{0} & 0 & \cdots & 0 \\ \color{#00aaff}{\vdots} & \color{#00aaff}{\vdots} & & \color{#00aaff}{\vdots} & \vdots & & \vdots \\ \color{#00aaff}{0} & \color{#00aaff}{0} & \color{#00aaff}{\cdots} & \color{#00aaff}{1} & 0 & \cdots & 0 \\ 0 & 0 & \cdots & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & & \vdots & \vdots & & \vdots \\ 0 & 0 & \cdots & 0 & 0 & \cdots & 0 \end{pmatrix}

任何一个矩阵 AA 经过有限次初等变换, 都可化为标准型 DD

2.2.2 初等矩阵

定义2 由单位矩阵 EE 经过一次初等变换得到的矩阵称为初等矩阵

记作

P(i,j)=(110111011) P(i(λ))=(11λ11) P(i.j(λ))=(11λ11)P(i, j) = \begin{pmatrix} 1 \\ & \ddots \\ & & 1 \\ & & & 0 & & \cdots & & 1 \\ & & & & \ddots \\ & & & \vdots & & 1 & & \vdots \\ & & & & & & \ddots \\ & & & 1 & & \cdots & & 0 \\ & & & & & & & & 1 \\ & & & & & & & & & \ddots \\ & & & & & & & & & & 1 \end{pmatrix} \\ \ \\ P(i(\lambda)) = \begin{pmatrix} 1 \\ & \ddots \\ & & 1 \\ & & & \lambda \\ & & & & 1 \\ & & & & & \ddots \\ & & & & & & 1 \end{pmatrix} \\ \ \\ P(i. j(\lambda)) = \begin{pmatrix} 1 \\ & \ddots \\ & & 1 & \cdots & \lambda \\ & & & \ddots & \vdots \\ & & & & 1 \\ & & & & & \ddots \\ & & & & & & 1 \end{pmatrix}

初等矩阵所对应行列式均不为零

定理1 对于m×nm \times n 矩阵 AA , 对 AA 进行一次初等行变换, 相当于在 AA 左边乘一个 m×nm \times n的初等矩阵; 对 AA 进行一次初等列变换, 相当于在 AA 右边乘一个 n×nn \times n的初等矩阵

例如

A=(a11a12a13a21a22a23a31a32a33)r1r2(a21a22a23a11a12a13a31a32a33)=A1A = \begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{pmatrix} \xrightarrow{r_1 \leftrightarrow r_2} \begin{pmatrix} a_{21} & a_{22} & a_{23} \\ a_{11} & a_{12} & a_{13} \\ a_{31} & a_{32} & a_{33} \end{pmatrix} = A_1

相当于

P(1,2)A=(010100001)(a11a12a13a21a22a23a31a32a33)=(a21a22a23a11a12a13a31a32a33)=A1P(1, 2)A = \begin{pmatrix} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix} \begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{pmatrix} = \begin{pmatrix} a_{21} & a_{22} & a_{23} \\ a_{11} & a_{12} & a_{13} \\ a_{31} & a_{32} & a_{33} \end{pmatrix} = A_1

BBAA 有限次初等变换得到, 则有

B=PtPt1P1AQ1Q2QlB = P_tP_{t-1} \cdots P_1AQ_1Q_2 \cdots Q_l

2.2.3 矩阵的等价

定义3 若 AA 经有限次初等变换得到 BB , 则称 A,BA, B 等价, 记作 ABA \approx BABA \cong B

矩阵等价关系基本性质

定理2 A,BA, B 等价的充要条件为 A,BA, B 有相同的标准形

2.2.4 矩阵的秩

定义4 设 AAm×nm \times n 矩阵, 在 AA 中任取 kkkk 列, 由这 kkkk 列交叉处的 k2k^2 个元素构成的 kk 阶行列式称为矩阵 AA 的一个 kk 阶子式

定义5 AA 中不为零的子式最高阶数称为矩阵 AA 的秩, 记作 r(A)r(A)

零矩阵的秩为零

非奇异方阵 AA 的秩等于它的阶数 (A0)(\because \left | A \right | \ne 0) , 故非奇异方阵又称满秩方阵, 奇异方阵又称降秩方阵

定理3 若 AA 中有一个 kk 阶子式不为零, 而所有 k+1k + 1 阶子式全为零, 则 r(A)=kr(A) = k

定理4 对矩阵进行初等变换后, 矩阵的秩不便, 即若 ABA \approx B , 则 r(A)=r(B) r(A) = r(B)

例, 求下列矩阵的秩

A=(12102242662102333334)r32r1r2+2r1r2r3r43r1r33r2r3r4r4+2r3(12102032210003100000)=BA = \begin{pmatrix} 1 & -2 & -1 & 0 & 2 \\ -2 & 4 & 2 & 6 & -6 \\ 2 & -1 & 0 & 2 & 3 \\ 3 & 3 & 3 & 3 & 4 \end{pmatrix} \xrightarrow[r_3 - 2r_1]{r_2 + 2r_1} \xrightarrow[r_2 \leftrightarrow r_3]{r_4 - 3r_1} \xrightarrow[r_3 - 3r_2]{r_3 \leftrightarrow r_4} \xrightarrow{r_4 + 2r_3} \begin{pmatrix} 1 & -2 & -1 & 0 & 2 \\ 0 & 3 & 2 & 2 & -1 \\ 0 & 0 & 0 & -3 & 1 \\ 0 & 0 & 0 & 0 & 0 \end{pmatrix} = B

120032003=9\begin{vmatrix} 1 & -2 & 0 \\ 0 & 3 & 2 \\ 0 & 0 & -3 \end{vmatrix} = -9

易得 r(B)=3r(B) = 3 , 则 r(A)=3r(A) = 3

定理5 等价矩阵具有相同的秩

推论1 矩阵 AA 经过有限次初等行变换 P1,P2,,PsP_1, P_2, \cdots , P_s 变为矩阵 BB , 则

r(B)=r(PsPs1P1A)=r(A)r(B) = r(P_sP_{s - 1} \cdots P_1A) = r(A)

推论2 矩阵 AA 经过有限次初等列变换 Q1,Q2,,QtQ_1, Q_2, \cdots , Q_t 变为矩阵 BB , 则

r(B)=r(AQ1Q2Qt)=r(A)r(B) = r(AQ_1Q_2 \cdots Q_t) = r(A)

推论3 矩阵 AA 经过有限次初等行变换 P1,P2,,PsP_1, P_2, \cdots , P_s 及有限次初等列变换 Q1,Q2,,QtQ_1, Q_2, \cdots , Q_t 变为矩阵 BB , 则

r(B)=r(PsPs1P1AQ1Q2Qt)=r(A)r(B) = r(P_sP_{s - 1} \cdots P_1AQ_1Q_2 \cdots Q_t) = r(A)

2.3 逆矩阵

2.3.1 逆矩阵的定义及性质

定义1 设 AAnn 阶方阵, EEnn 阶单位矩阵, 若存在 nn 阶方阵 BB , 使

AB=BA=EAB = BA = E

则称矩阵 AA 可逆, 称 BBAA 的逆矩阵

定理1 若矩阵可逆, 则逆矩阵唯一

推论

A=ATA1=(AT)1=(A1)TA = A^T \Rightarrow A^{-1} = (A^T)^{-1} = (A^{-1})^T

2.3.2 矩阵可逆的条件

定义2 设 nn 阶方阵

A=(a11a12a1na21a22a2nan1an2ann)A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{pmatrix}

AijA_{ij} 为行列式 A\left | A \right | 中元素 aija_{ij} 的代数余子式, 则矩阵

A=(A11A12A1nA21A22A2nAn1An2Ann)A^{\star} = \begin{pmatrix} A_{11} & A_{12} & \cdots & A_{1n} \\ A_{21} & A_{22} & \cdots & A_{2n} \\ \vdots & \vdots & & \vdots \\ A_{n1} & A_{n2} & \cdots & A_{nn} \end{pmatrix}

称为 AA 的伴随矩阵, 即当 A=(aij)A = (a_{ij}) 时, A=(aij)TA^{\star} = (a_{ij})^T

方阵 A=(aij)n×nA = (a_{ij})_{n \times n} 可逆的充要条件是 A0\left | A \right | \ne 0

方阵 A=(aij)n×nA = (a_{ij})_{n \times n} 可逆, 有 A1=1AAA^{-1} = \frac{1}{\left | A \right |} A^{\star}

2.3.3 用初等变换求逆矩阵

定理4 初等变换有如下性质

初等矩阵的逆矩阵也为初等矩阵

定理5 若 nn 阶方阵 AA 可逆, 则存在有限个初等矩阵 P1,P2,,PmP_1, P_2, \cdots , P_m , 使

A=P1P2PmA = P_1P_2 \cdots P_m

求逆矩阵

(AE)初等行变换(EA1)(A | E) \xrightarrow{初等行变换} (E | A^{-1})

(AE)初等列变换(EA1)(\frac{A}{E}) \xrightarrow{初等列变换} (\frac{E}{A^{-1}})

例如

A=(223110121)(AE)=(223100110010121001)(100143010153001164)A1=(143153164)\begin{aligned} & A = \begin{pmatrix} 2 & 2 & 3 \\ 1 & -1 & 0 \\ -1 & 2 & 1 \end{pmatrix} \\ & \\ & (A | E) = \begin{pmatrix} 2 & 2 & 3 & | & 1 & 0 & 0 \\ 1 & -1 & 0 & | & 0 & 1 & 0 \\ -1 & 2 & 1 & | & 0 & 0 & 1 \end{pmatrix} \rightarrow \begin{pmatrix} 1 & 0 & 0 & | & 1 & -4 & -3 \\ 0 & 1 & 0 & | & 1 & -5 & -3 \\ 0 & 0 & 1 & | & -1 & 6 & 4 \end{pmatrix} \\ & \\ & A^{-1} = \begin{pmatrix} 1 & -4 & -3 \\ 1 & -5 & -3 \\ -1 & 6 & 4 \end{pmatrix} \end{aligned}

2.3.4 逆矩阵的简单应用

2.3.4.1 解方程组

nn 个方程 nn 个未知量构成的线性方程组矩阵表示为 AX=bAX = b , 若 AA 可逆, 则方程组解为 X=A1bX = A^{-1}b

例如

{2x1+2x2+3x3=1x1x2=1x1+2x2+x3=3\begin{cases} 2x_1 + 2x_2 + 3x_3 = 1 \\ x_1 - x_2 = -1 \\ -x_1 + 2x_2 + x_3 = 3 \end{cases}

化为 AX=bAX = b

A=(223110121), X=(x1x2x3), b=(113)A1=(143153164), X=A1b=(435)\begin{aligned} & A = \begin{pmatrix} 2 & 2 & 3 \\ 1 & -1 & 0 \\ -1 & 2 & 1 \end{pmatrix} , \ X = \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} , \ b = \begin{pmatrix} 1 \\ -1 \\ 3 \end{pmatrix} \\ & \\ & A^{-1} = \begin{pmatrix} 1 & -4 & -3 \\ 1 & -5 & -3 \\ -1 & 6 & 4 \end{pmatrix} , \ X = A^{-1}b = \begin{pmatrix} -4 \\ -3 \\ 5 \end{pmatrix} \end{aligned}

x1=4,x2=3,x3=5x_1 = -4, x_2 = -3, x_3 = 5

2.3.4.2 解矩阵方程

( AA 矩阵可逆)

例如

A,BA, B 为三阶矩阵, EE 为三阶单位矩阵, 且 AB+E=A2+BAB + E = A^2 + B , A=(101020101)A = \begin{pmatrix}1 & 0 & 1 \\ 0 & 2 & 0 \\ -1 & 0 & 1 \end{pmatrix} , 求 BB

AB+E=A2+BABB=A2E, (AE)B=(AE)(A+E)AE=(001010100), AE=10, 即AE可逆B=A+E=(201030102)\begin{aligned} & AB + E = A^2 + B \Rightarrow AB - B = A^2 - E, \ \Rightarrow (A - E)B = (A - E)(A + E) \\ & A - E = \begin{pmatrix} 0 & 0 & 1 \\ 0 & 1 & 0 \\ -1 & 0 & 0 \end{pmatrix} , \ \left | A - E \right | = 1 \ne 0, \ 即 A - E 可逆 \\ & B = A + E = \begin{pmatrix} 2 & 0 & 1 \\ 0 & 3 & 0 \\ -1 & 0 & 2 \end{pmatrix} \end{aligned}

2.4 分块矩阵

2.4.1 矩阵的分块

A=(124130571201)=(A11A12A21A22)A = \begin{pmatrix} \color{#00aaff}{1} & \color{#00aaff}{2} & 4 & 1 \\ 3 & 0 & \color{#00aaff}{5} & \color{#00aaff}{7} \\ -1 & 2 & \color{#00aaff}{0} & \color{#00aaff}{1} \end{pmatrix} = \begin{pmatrix} \color{#00aaff}{A_{11}} & A_{12} \\ A_{21} & \color{#00aaff}{A_{22}} \end{pmatrix}

其中 A11=(12), A12=(41), A21=(3012), A22=(5701)A_{11} = \begin{pmatrix} 1 & 2 \end{pmatrix}, \ A_{12} = \begin{pmatrix} 4 & 1 \end{pmatrix}, \ A_{21} = \begin{pmatrix} 3 & 0 \\ -1 & 2 \end{pmatrix} , \ A_{22} = \begin{pmatrix} 5 & 7 \\ 0 & 1 \end{pmatrix} 为分块矩阵 AA 的子块

2.4.2 分块矩阵的计算

2.4.2.1 计算 A±BA \pm B 时, 要将 A,BA, B 用同样分块方式进行分块, 保证子块同型

2.4.2.2 计算 ABAB 时, 对 AA 列的分法应与对 BB 行分法一致, 保证子块能相乘

A=(aik)s×n, B=(bkj)n×mA = (a_{ik})_{s \times n}, \ B = (b_{kj})_{n \times m} , 分块如下

A=(A11A12A1lA21A22A2lAt1At2Atl) B=(B11B12B1rB21B22B2rBl1Bl2Blr)A = \begin{pmatrix} A_{11} & A_{12} & \cdots & A_{1l} \\ A_{21} & A_{22} & \cdots & A_{2l} \\ \vdots & \vdots & & \vdots \\ A_{t1} & A_{t2} & \cdots & A_{tl} \end{pmatrix} \\ \ \\ B = \begin{pmatrix} B_{11} & B_{12} & \cdots & B_{1r} \\ B_{21} & B_{22} & \cdots & B_{2r} \\ \vdots & \vdots & & \vdots \\ B_{l1} & B_{l2} & \cdots & B_{lr} \end{pmatrix}

其中每个小矩阵 AijA_{ij}si×njs_i \times \color{#00aaff}{n_j} 矩阵, 每个小矩阵 BijB_{ij}ni×mj\textcolor{#00aaff}{n_i} \times m_j 矩阵

C=AB=(C11C12C1rC21C22C2rCt1Ct2Ctr)C = AB = \begin{pmatrix} C_{11} & C_{12} & \cdots & C_{1r} \\ C_{21} & C_{22} & \cdots & C_{2r} \\ \vdots & \vdots & & \vdots \\ C_{t1} & C_{t2} & \cdots & C_{tr} \end{pmatrix}

其中

Cpq=Ap1B1q+Ap22q++Apllq=k=1lApkBkq (p=1,2,,t;q=1,2,,r)C_{pq} = A_{p1}B_{1q} + A_{p2}{2q} + \cdots + A_{pl}{lq} \\ = \sum_{k = 1}^{l} A_{pk}B_{kq} \ (p = 1, 2, \cdots , t; q = 1, 2, \cdots , r)

2.4.2.3 求 ATA^T 时, 将子块作为元素转置后, 再将各子块转置

(A11A12A13A21A22A23)=(A11TA21TA12TA22TA13TA23T)\begin{pmatrix} A_{11} & A_{12} & A_{13} \\ A_{21} & A_{22} & A_{23} \end{pmatrix} = \begin{pmatrix} A_{11}^T & A_{21}^T \\ A_{12}^T & A_{22}^T \\ A_{13}^T & A_{23}^T \end{pmatrix}

若方阵 AA 分块后得到如下形式

AB=(A1OOOA2OOOAm)AB = \begin{pmatrix} A_1 & O & \cdots & O \\ O & A_2 & \cdots & O \\ \vdots & \vdots & & \vdots \\ O & O & \cdots & A_m \end{pmatrix}

其中 Ai(i=1,2,,m)A_i (i = 1, 2, \cdots , m) 均为方阵, 称 AA 为准对角矩阵

例如

A=(1200034000001300020000001)=(A1A2A3)A = \begin{pmatrix} \color{#00aaff}{1} & \color{#00aaff}{2} & 0 & 0 & 0 \\ \color{#00aaff}{3} & \color{#00aaff}{4} & 0 & 0 & 0 \\ 0 & 0 & \color{#00aaff}{-1} & \color{#00aaff}{3} & 0 \\ 0 & 0 & \color{#00aaff}{2} & \color{#00aaff}{0} & 0 \\ 0 & 0 & 0 & 0 & \color{#00aaff}{1} \end{pmatrix} = \begin{pmatrix} A_1 \\ & A_2 \\ & & A_3 \end{pmatrix}

为准对角矩阵

准对角矩阵有着类似对角矩阵性质

Ak=(A1kA2kA3k)A^k = \begin{pmatrix} A_1^k \\ & A_2^k \\ & & A_3^k \end{pmatrix}

若方阵 A1,A2,,AmA_1, A_2, \cdots , A_m 均可逆, 则有

(A1A2Am)\begin{pmatrix} A_1 \\ & A_2 \\ & & \ddots \\ & & & A_m \end{pmatrix}

有逆矩阵, 且

(A1A2Am)1=(A11A21Am1)\begin{pmatrix} A_1 \\ & A_2 \\ & & \ddots \\ & & & A_m \end{pmatrix}^{-1} = \begin{pmatrix} A_1^{-1} \\ & A_2^{-1} \\ & & \ddots \\ & & & A_m^{-1} \end{pmatrix}

例 求下面矩阵的逆矩阵

D=(a11a1n00an1ann00c11c1nb11b1mcm1cmnbm1bmm)=(AOCB)D = \begin{pmatrix} a_{11} & \cdots & a_{1n} & 0 & \cdots & 0 \\ \vdots & & \vdots & \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn} & 0 & \cdots & 0 \\ c_{11} & \cdots & c_{1n} & b_{11} & \cdots & b_{1m} \\ \vdots & & \vdots & \vdots & & \vdots \\ c_{m1} & \cdots & c_{mn} & b_{m1} & \cdots & b_{mm} \end{pmatrix} = \begin{pmatrix} A & O \\ C & B \end{pmatrix}

D=ABA,B可逆,D可逆D1=(X11X12X21X22) (AOCB)(X11X12X21X22)=(EnOOEm)乘开得{AX11=EnAX12=OCX11+BX21=OCX12+BX22=Em由一二个方程得 X11=A1,X12=O代入四得 X22=B1代入三得 X21=B1CX11=B1CA1 则 D1=(A1OB1CA1B1)\begin{aligned} & \left | D \right | = \left | A \right | \left | B \right | \Rightarrow A, B可逆, 则D可逆 \\ & 设D^{-1} = \begin{pmatrix} X_{11} & X_{12} \\ X_{21} & X_{22} \end{pmatrix} \\ & \ \\ & 则 \begin{pmatrix} A & O \\ C & B \end{pmatrix} \begin{pmatrix} X_{11} & X_{12} \\ X_{21} & X_{22} \end{pmatrix} = \begin{pmatrix} E_n & O \\ O & E_m \end{pmatrix} \\ & 乘开得 \begin{cases} AX_{11} = E_n \\ AX_{12} = O \\ CX_{11} + BX_{21} = O \\ CX_{12} + BX_{22} = E_m \end{cases} \\ & 由一二个方程得 \ X_{11} = A^{-1}, X_{12} = O \\ & 代入四得 \ X_{22} = B^{-1} \\ & 代入三得 \ X_{21} = -B^{-1}CX_{11} = -B^{-1}CA^{-1} \\ & \ \\ & 则 \ D^{-1} = \begin{pmatrix} A^{-1} & O \\ -B^{-1}CA^{-1} & B^{-1} \end{pmatrix} \end{aligned}

2.5 矩阵理论在经济学中的应用

投入产出分析

任何国家或地区的经济可以划分成多个部门, 每个部门有双重身份

现考虑三个部门之间的投入产出情况, 设 C1,C2,C3C_1, C_2, C_3 三个部门,

现假设 C1,C2,C3C_1, C_2, C_3 哥哥们最终产品需求分别为 d1,d2,d3d_1, d_2, d_3 个单位, 需计算各部门总产出 x1,x2,x3x_1, x_2, x_3 , 使得供需平衡

对于 C1C_1 , 总产出等于最终产出加上各部门消耗 C1C_1 部门的产品数, 即

x1=d1+0.2x1+0.3x2+0.2x3x_1 = d_1 + 0.2 x_1 + 0.3 x_2 + 0.2 x_3

同理

x2=d2+0.4x1+0.1x2+0.2x3x3=d3+0.1x1+0.3x2+0.2x3x_2 = d_2 + 0.4 x_1 + 0.1 x_2 + 0.2 x_3 \\ x_3 = d_3 + 0.1 x_1 + 0.3 x_2 + 0.2 x_3

则有

X=(x1x2x3) , d=(d1d2d3) , A=(0.20.30.20.40.10.20.10.30.2) X=d+AX即 (EA)X=d 计算得,(EA)可逆,且 (EA)1=(1.720.780.630.891.610.630.550.701.56)则线性方程组有唯一解 X=(EA)1d=(1.720.780.630.891.610.630.550.701.56)(d1d2d3) {x1=1.72d1+0.78d2+0.63d3x2=0.89d1+1.61d2+0.63d3x3=0.55d1+0.70d2+1.56d3\begin{aligned} & X = \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} \ , \ d = \begin{pmatrix} d_1 \\ d_2 \\d_3 \end{pmatrix} \ , \ A = \begin{pmatrix} 0.2 & 0.3 & 0.2 \\ 0.4 & 0.1 & 0.2 \\ 0.1 & 0.3 & 0.2 \end{pmatrix} \\ & \ \\ & X = d + AX \\ & 即 \ (E - A)X = d \\ & \ \\ & 计算得, (E - A)可逆, 且 \ (E - A)^{-1} = \begin{pmatrix} 1.72 & 0.78 & 0.63 \\ 0.89 & 1.61 & 0.63 \\ 0.55 & 0.70 & 1.56 \end{pmatrix} \\ & 则线性方程组有唯一解 \\ & \ \\ & X = (E - A)^{-1}d = \begin{pmatrix} 1.72 & 0.78 & 0.63 \\ 0.89 & 1.61 & 0.63 \\ 0.55 & 0.70 & 1.56 \end{pmatrix} \begin{pmatrix} d_1 \\ d_2 \\d_3 \end{pmatrix} \\ & \ \\ & 即 \begin{cases} x_1 = 1.72 d_1 + 0.78 d_2 + 0.63 d_3 \\ x_2 = 0.89 d_1 + 1.61 d_2 + 0.63 d_3 \\ x_3 = 0.55 d_1 + 0.70 d_2 + 1.56 d_3 \end{cases} \end{aligned}

若由 nn 个部门 C1,C2,,CnC_1, C_2, \cdots , C_n , 假设 CiC_i 部门生产一个单位产品需要消耗 C1,C2,,CnC_1, C_2, \cdots , C_n 各部门产品数分别为 ai1,ai2,,aina_{i1}, a_{i2}, \cdots , a_{in} , CiC_i 部门的产品需求量为 did_i , CiC_i 部门总产出为 xi (i=1,2,,n)x_i \ (i = 1, 2, \cdots , n)

xi=di+ai1x1+ai2x2++ainxn ,  i=1,2,,nx_i = d_i + a_{i1} x_1 + a_{i2} x_2 + \cdots + a_{in} x_n \ , \ \ i = 1, 2, \cdots , n

X=(x1x2xn) , d=(d1d2dn) , A=(a11a12a1na21a22a2nan1an2ann)X = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} \ , \ d = \begin{pmatrix} d_1 \\ d_2 \\ \vdots \\ d_n \end{pmatrix} \ , \ A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{pmatrix}

则方程组用矩阵表示为

X=d+AXX = d + AX

$A$ 称为直接消耗系数矩阵

变形得

(EA)X=d(E - A)X = d

称为投入产出公式, EAE - A 称为列昂惕夫矩阵

实际问题中, 列昂惕夫矩阵一般是非奇异的, 它的逆矩阵 (EA)1(E - A)^{-1} 称为列昂惕夫逆矩阵, 用 RR 表示

投入产出公式变形为

X=RdX = Rd

利用列昂惕夫逆矩阵, 任何已知的 可预测的的最终产品需求代入上式, 可以确定各部门相应的总产出水平

各种最终需求量变化时, 对各部门的影响也可求

例如, 给 dd 以增量 Δd\Delta d , 则

X+ΔX=R(d+Δd)=Rd+RΔd=X+RΔdX + \Delta X = R(d + \Delta d) = Rd + R \Delta d = X + R \Delta d

ΔX=RΔd\Delta X = R \Delta d

对于前例, 列昂惕夫逆矩阵

R=(1.720.780.630.891.610.630.550.701.56)R = \begin{pmatrix} 1.72 & 0.78 & 0.63 \\ 0.89 & 1.61 & 0.63 \\ 0.55 & 0.70 & 1.56 \end{pmatrix}

Δd=(0,0,10)T\Delta d = (0, 0, 10)^T , 则

ΔX=RΔd=(1.720.780.630.891.610.630.550.701.56)(0010)=(6.36.315.6)\Delta X = R \Delta d = \begin{pmatrix} 1.72 & 0.78 & 0.63 \\ 0.89 & 1.61 & 0.63 \\ 0.55 & 0.70 & 1.56 \end{pmatrix} \begin{pmatrix} 0 \\ 0 \\ 10 \end{pmatrix} = \begin{pmatrix} 6.3 \\ 6.3 \\ 15.6 \end{pmatrix}

Δx1=6.3 ,  Δx2=6.3 ,  Δx3=15.6\Delta x_1 = 6.3 \ , \ \ \Delta x_2 = 6.3 \ , \ \ \Delta x_3 = 15.6

3 向量空间

3.1 向量

3.1.1 nn 维向量及其线性运算

定义1 由 nn 个数组成的有序数组 (a1,a2,,an)(a_1, a_2, \cdots , a_n) 称为一个 nn 维向量, 记作

α=(a1,a2,,an)\alpha = (a_1, a_2, \cdots , a_n)

其中数 ai(i=1,2,,n)a_i(i = 1, 2, \cdots , n) 称为向量 α\alpha 的第 ii 个分量或第 ii 个坐标

有时 nn 维向量也可写成一列的形式, 即

α=(a1a2an)\alpha = \begin{pmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix}

上述两种向量分别称为行向量和列向量, 列向量为也记作 $\alpha = (a_1, a_2, \cdots , a_n)^T$

nn 维向量可视为 1×n1 \times nn×1n \times 1 的矩阵, 则对于 n×mn \times m 矩阵 A=(aij)n×mA = (a_{ij})_{n \times m}

A=(α1,α2,,αm)=(β1β2βn)A = (\alpha_1, \alpha_2, \cdots , \alpha_m) = \begin{pmatrix} \beta_1 \\ \beta_2 \\ \vdots \\ \beta_n \end{pmatrix}

其中 αj=(a1j,a2j,,anj)T (j=1,2,,m)\alpha_j = (a_{1j}, a_{2j}, \cdots , a_{nj})^T \ (j = 1, 2, \cdots , m)nn 维列向量, βi=(ai1,ai2,,aim) (i=1,2,,n)\beta_i = (a_{i1}, a_{i2}, \cdots , a_{im}) \ (i = 1, 2, \cdots , n)mm 维行向量

若两个 nn 维向量对应分量都相等, 则向量相等

α=(a1,a2,,an) , β=(b1,b2,,bn)ai=bi , i=1,2,,n则 α=β\begin{aligned} & \alpha = (a_1, a_2, \cdots , a_n) \ , \ \beta = (b_1, b_2, \cdots , b_n) \\ & a_i = b_i \ , \ i = 1, 2, \cdots , n \\ & 则 \ \alpha = \beta \end{aligned}

分量均为零的向量为零向量, 记作 0\mathbf{0} , 即 0=(0,0,,0)\mathbf{0} = (0, 0, \cdots , 0)

向量 (a1,a2,,an)(-a_1, -a_2, \cdots , -a_n) 称为向量 (a1,a2,,an)(a_1, a_2, \cdots , a_n) 的负向量, 记作 α-\alpha

定义2 向量加法与数乘

两个 nn 维向量

α=(a1,a2,,an) , β=(b1,b2,,bn)\alpha = (a_1, a_2, \cdots , a_n) \ , \ \beta = (b_1, b_2, \cdots , b_n)

则有

α+β=(a1+b1,a2+b2,,an+bn)αβ=α+(β)=(a1b1,a2b2,,anbn)\begin{align} & \alpha + \beta = (a_1 + b_1, a_2 + b_2, \cdots , a_n + b_n) \\ & \alpha - \beta = \alpha + (-\beta) = (a_1 - b_1, a_2 - b_2, \cdots , a_n - b_n) \end{align}

3.1.2 向量组的线性组合

定义3 设 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_rrrnn 维向量, k1,k2,,krk_1, k_2, \cdots , k_rrr 个实数, 称

k1α1+k2α2++krαrk_1\alpha_1 + k_2\alpha_2 + \cdots + k_r\alpha_r

为向量组 α1,α2,,αr\alpha_1, \alpha_2 , \cdots , \alpha_r 的一个线性组合, k1,k2,,krk_1, k_2, \cdots , k_r 称相应的组合系数

β\beta 可以表示为向量组 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 的一个线性组合, 则称 β\beta 可以由向量组 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 线性表示

αi=0α1++1αi++0αr\alpha_i = 0 \alpha_1 + \cdots + 1 \alpha_i + \cdots + 0 \alpha_r

α=a1ε1+a2ε2+a3ε3\alpha = a_1 \varepsilon_1 + a_2 \varepsilon_2 + a_3 \varepsilon_3

R3R^3 中任意向量都可由向量组 ε1,ε2,ε1\varepsilon_1 , \varepsilon_2 , \varepsilon_1 线性表示

0=0α1+0α2++0αr\mathbf{0} = 0 \alpha_1 + 0 \alpha_2 + \cdots + 0 \alpha_r

{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm 令 αj=(a1ja2jamj) (j=1,2,,n) , β=(b1b2bm) 则有 β=x1α1+x2α2++xnαn则方程是否有解,即是否存在一组数k1,k2,,kn使下列线性关系式成立β=k1α1+k2α2++knαn\begin{aligned} & \begin{cases} a_{11} x_1 + a_{12} x_2 + \cdots + a_{1n} x_n = b_1 \\ a_{21} x_1 + a_{22} x_2 + \cdots + a_{2n} x_n = b_2 \\ \cdots \cdots \cdots \cdots \\ a_{m1} x_1 + a_{m2} x_2 + \cdots + a_{mn} x_n = b_m \end{cases} \\ & \ \\ & 令 \ \alpha_j = \begin{pmatrix} a_{1j} \\ a_{2j} \\ \vdots \\ a_{mj} \end{pmatrix} \ (j = 1, 2, \cdots , n) \ , \ \beta = \begin{pmatrix} b_1 \\ b_2 \\ \vdots \\ b_m \end{pmatrix} \\ & \ \\ & 则有 \ \beta = x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_n \alpha_n \\ & 则方程是否有解, 即是否存在一组数 k_1, k_2, \cdots , k_n 使下列线性关系式成立 \\ & \beta = k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_n \alpha_n \end{aligned}

定义4 两向量组

A: α1,α2,,αs ; B: β1,β2,,βtA: \ \alpha_1, \alpha_2, \cdots , \alpha_s \ ; \ B: \ \beta_1, \beta_2, \cdots , \beta_t

若向量组 BB 中每个元素都能由向量组 AA 线性表示, 则称向量组 BB 能由向量组 AA 线性表示

若向量组 AA 与向量组 BB 能互相线性表示, 则称这两个向量组等价

若向量组 BB 能由向量组 AA 线性表示, 则存在系数 kij(i=1,2,,s , j=1,2,,t)k_{ij}(i = 1, 2, \cdots , s \ , \ j = 1, 2, \cdots , t) , 使

{β1=k11α1+k21α2++ks1αsβ2=k12α1+k22α2++ks2αsβt=k1tα1+k21α2++kstαs\begin{cases} \beta_1 = k_{11} \alpha_1 + k_{21} \alpha_2 + \cdots + k_{s1} \alpha_s \\ \beta_2 = k_{12} \alpha_1 + k_{22} \alpha_2 + \cdots + k_{s2} \alpha_s \\ \cdots \cdots \cdots \cdots \\ \beta_t = k_{1t} \alpha_1 + k_{21} \alpha_2 + \cdots + k_{st} \alpha_s \end{cases}

上式可简记为

(β1,β2,,βt)=(α1,α2,,αs)(k11k12k1tk21k22k2tks1ks2kst)(\beta_1, \beta_2 , \cdots , \beta_t) = (\alpha_1, \alpha_2, \cdots , \alpha_s) \begin{pmatrix} k_{11} & k_{12} & \cdots & k_{1t} \\ k_{21} & k_{22} & \cdots & k_{2t} \\ \vdots & \vdots & & \vdots \\ k_{s1} & k_{s2} & \cdots & k_{st} \end{pmatrix}

B=(β1,β2,,βt) , A=(α1,α2,,αs)B = (\beta_1 , \beta_2 , \cdots , \beta_t) \ , \ A = (\alpha_1, \alpha_2, \cdots , \alpha_s) , 则上式表示 BB 的列向量组可以由 AA 的列向量组表示

K=(kij)s×tK = (k_{ij})_{s \times t} , 称 KK 为向量组 BB 由向量组 AA 表示的系数矩阵, 简写为

B=AKB = AK

定理1 向量组线性表示关系的传递性

若向量组 C: γ1,γ2,,γmC: \ \gamma_1, \gamma_2, \cdots , \gamma_m 可由向量组 B: β1,β2,,βtB: \ \beta_1, \beta_2, \cdots , \beta_t 线性表示, 向量组 B: β1,β2,,βtB: \ \beta_1, \beta_2, \cdots , \beta_t 可由向量组 A: α1,α2,,αtA: \ \alpha_1, \alpha_2, \cdots , \alpha_t 线性表示, 则向量组 CC 可由向量组 AA 线性表示

存在矩阵K1,K2有 C=BK1 , B=AK2则 C=BK1=AK2K1=A(K2K1) C可由A线性表,系数K=K2K1\begin{aligned} & 存在矩阵 K_1, K_2 \\ & 有 \ C = BK_1 \ , \ B = AK_2 \\ & 则 \ C = BK_1 = AK_2K_1 = A(K_2K_1) \\ & \ \\ & 则C可由A线性表, 系数K = K_2K_1 \end{aligned}

向量组之间等价关系也有传递性

例 求下列向量组 BB 由向量组 AA 线性表示的系数矩阵 KK

B: β1=(a11,a21,a31)T,β2=(a12,a22,a32)TA: ε1=(1,0,0)T,ε2=(0,1,0)T,ε3=(0,0,1)TB: \ \beta_1 = (a_{11}, a_{21}, a_{31})^T, \beta_2 = (a_{12}, a_{22}, a_{32})^T \\ A: \ \varepsilon_1 = (1, 0, 0)^T, \varepsilon_2 = (0, 1, 0)^T, \varepsilon_3 = (0, 0, 1)^T

{β1=a11ε1+a21ε2+a31ε3β2=a12ε1+a22ε2+a32ε3(β1,β2)=(ε1,ε2,ε3)(a11a12a21a22a31a32) 则 K=(a11a12a21a22a31a32)\begin{aligned} & \begin{cases} \beta_1 = a_{11} \varepsilon_1 + a_{21} \varepsilon_2 + a_{31} \varepsilon_3 \\ \beta_2 = a_{12} \varepsilon_1 + a_{22} \varepsilon_2 + a_{32} \varepsilon_3 \end{cases} \\ & (\beta_1 , \beta_2) = (\varepsilon_1 , \varepsilon_2 , \varepsilon_3) \begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \\ a_{31} & a_{32} \end{pmatrix} \\ & \ \\ & 则 \ K = \begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \\ a_{31} & a_{32} \end{pmatrix} \end{aligned}

3.2 向量组的线性相关性

3.2.1 线性相关与线性无关

定义1 对于向量组 α1,α2,,αs (s1)\alpha_1 , \alpha_2 , \cdots , \alpha_s \ (s \ge 1) , 若存在不全为零的实数 k1,k2,,ksk_1, k_2, \cdots , k_s , 使

k1α1+k2α2++ksαs=0k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_s \alpha_s = \mathbf{0}

则称向量组 α1,α2,,αs\alpha_1 , \alpha_2 , \cdots , \alpha_s 线性相关, 否则称之为线性无关

α1,α2,,αs (s1)\alpha_1 , \alpha_2 , \cdots , \alpha_s \ (s \ge 1) 线性无关, 则

k1α1+k2α2++ksαs=0k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_s \alpha_s = \mathbf{0}

必可得 k1=k2==ks=0k_1 = k_2 = \cdots = k_s = \mathbf{0}

两个单位向量线性相关即表示它们共线, 三个三位向量线性相关即表示它们共面, 反之仍成立

定理1 向量组 α1,α2,,αs (s2)\alpha_1 , \alpha_2 , \cdots , \alpha_s \ (s \ge 2) 线性相关, 当且仅当向量组里至少有一个向量可由其余向量线性表示

对于 α1,α2,,αs 若其中一个向量可由其他向量线性表示设 αs=k1α1+k2α2++ks1αs1则 k1α1+k2α2++ks1αs1+(1)αs=0 反之,α1,α2,,αs线性相关,则有k1α1+k2α2++ksαs=0ks0,αs=k1ksα1k2ksα2ks1ksαs1 αs可由其他向量线性表示\begin{aligned} & 对于 \ \alpha_1 , \alpha_2 , \cdots , \alpha_s \\ & \ \\ & 若其中一个向量可由其他向量线性表示 \\ & 设 \ \alpha_s = k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_{s - 1} \alpha_{s - 1} \\ & 则\ k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_{s - 1} \alpha_{s - 1} + (-1) \alpha_s = \mathbf{0} \\ & \ \\ & 反之, 若 \alpha_1 , \alpha_2 , \cdots , \alpha_s 线性相关, 则有 \\ & k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_s \alpha_s = \mathbf{0} \\ & 设 k_s \ne 0, 则 \\ & \alpha_s = - \frac{k_1}{k_s} \alpha_1 - \frac{k_2}{k_s} \alpha_2 - \cdots - \frac{k_{s - 1}}{k_s} \alpha_{s - 1} \\ & \ \\ & 即 \alpha_s 可由其他向量线性表示 \end{aligned}

含零向量的向量组一定线性相关

若向量组α1,α2,,αsα1=0则 1α1+0α2+0α3++0αs=0\begin{aligned} & 若向量组 \alpha_1 , \alpha_2 , \cdots , \alpha_s 中 \alpha_1 = \mathbf{0} \\ & 则 \ 1 \cdot \alpha_1 + 0 \cdot \alpha_2 + 0 \cdot \alpha_3 + \cdots + 0 \cdot \alpha_s = \mathbf{0} \end{aligned}

定理2 若向量组中有一个部分组线性相关, 则向量组也线性相关; 若向量组线性无关, 则其任何部分组线性无关

定理3 若向量组 α1,α2,,αs\alpha_1 , \alpha_2 , \cdots , \alpha_s 线性无关, 而向量组 α1,α2,,αs,β\alpha_1 , \alpha_2 , \cdots , \alpha_s, \beta 线性相关, 则 β\beta 可由向量组 α1,α2,,αs\alpha_1 , \alpha_2 , \cdots , \alpha_s 线性表示且表示法唯一

k1α1+k2α2++ksαs+kβ=0 k=0,则有 k1α1+k2α2++ksαs=0k1,k2,,ks不全为零,这与α1,α2,,αs线性无关矛盾k0 β=k1kα1k2kα2kskαsβ可由α1,α2,,αs线性表示 若存在两组数t1,t2,,ts , l1,l2,,ls使β=t1α1+t2α2++tsαs=l1α1+l2α2++lsαs则 (t1l1)α1+(t2l2)α2++(tsls)αs=0 α1,α2,,αs线性无关,ti=li (i=1,2,,s) ,表示法唯一\begin{aligned} & k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_s \alpha_s + k \beta = \mathbf{0} \\ & \ \\ & 若 k = 0, 则有 \ k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_s \alpha_s = \mathbf{0} \\ & 且 k_1, k_2, \cdots , k_s 不全为零, 这与 \alpha_1 , \alpha_2 , \cdots , \alpha_s 线性无关矛盾 \\ & 故 k \ne 0 \\ & \ \\ & 则 \beta = - \frac{k_1}{k} \alpha_1 - \frac{k_2}{k} \alpha_2 - \cdots - \frac{k_{s}}{k} \alpha_{s} \\ & 即 \beta 可由 \alpha_1 , \alpha_2 , \cdots , \alpha_s 线性表示 \\ & \ \\ & 若存在两组数 t_1, t_2, \cdots , t_s \ , \ l_1, l_2, \cdots , l_s 使 \\ & \beta = t_1 \alpha_1 + t_2 \alpha_2 + \cdots + t_s \alpha_s = l_1 \alpha_1 + l_2 \alpha_2 + \cdots + l_s \alpha_s \\ & 则 \ (t_1 - l_1) \alpha_1 + (t_2 - l_2) \alpha_2 + \cdots + (t_s - l_s) \alpha_s = \mathbf{0} \\ & \ \\ & 又 \alpha_1 , \alpha_2 , \cdots , \alpha_s 线性无关, 则 t_i = l_i \ (i = 1, 2, \cdots , s) \\ & \ \\ & 即, 表示法唯一 \end{aligned}

向量组 α,β,γ\alpha, \beta, \gamma 线性无关, 则向量组 α+β,β+γ,γ+α\alpha + \beta, \beta + \gamma, \gamma + \alpha 也线性无关

设有k1,k2,k3使 k1(α+β)+k2(β+γ)+k3(γ+α)=0即 (k1+k3)α+(k1+k2)β+(k2+k3)γ=0 α,β,γ线性无关,{k1+k3=0k1+k2=0k2+k3=0 由克拉默法则得,此方程组D=20,则方程组只有零解,k1=k2=k3=0α+β,β+γ,γ+α线性无关\begin{aligned} & 设有 k_1, k_2, k_3 \\ & 使 \ k_1 (\alpha + \beta) + k_2 (\beta + \gamma) + k_3 (\gamma + \alpha) = \mathbf{0} \\ & 即 \ (k_1 + k_3) \alpha + (k_1 + k_2) \beta + (k_2 + k_3) \gamma = \mathbf{0} \\ & \ \\ & 又 \alpha, \beta, \gamma 线性无关, 则 \\ & \begin{cases} k_1 + k_3 = 0 \\ k_1 + k_2 = 0 \\ k_2 + k_3 = 0 \end{cases} \\ & \ \\ & 由克拉默法则得, 此方程组 D = 2 \ne 0, 则方程组只有零解, 即 k_1 = k_2 = k_3 = 0 \\ & 则 \alpha + \beta, \beta + \gamma, \gamma + \alpha 线性无关 \end{aligned}

3.2.2 利用矩阵的秩判定向量组的线性相关性

定理4 设矩阵 AA 的秩为 rr , 则 AA 中存在 rr 个行向量(或列向量)线性无关, 且 AA 的任一行向量(或列向量)都可由这 rr 个行列式线性表示

A=(a11a12a1na21a22a2nam1am2amn)=(α1α2αm)其中 αi=(ai1,ai2,,ain) (i=1,2,,m) 由矩阵秩的定义,A存在一个不为零的r阶子式,A左上角的r阶子式不为零D=a11a12a1ra21a22a2rar1ar2arr0 α1,α2,,αr线性相关,则设αr=k1α1+k2α2++kr1αr1 D(r1,r2,,rr1)×(k1,k2,,kr1)+rrD最后一行圈化为零,D=0,与假设矛盾α1,α2,,αr线性无关 α1,α2,,αr向量组中每个向量都能由它本事线性表示,则只需证αk (k>r)时能由向量组线性表示 Dt=a11a1ra1ta21a2ra2tar1arrartak1akrakt, t=1,2,,n tr,Dt最后一列与前面某列相同,Dt=0t>r,DtAr+1阶子式,根据秩的定义,同样Dt=0 展开Dt最后一列,a1tA1+a2tA2++artAr+aktD=0A1,A2,,Ar分别为a1t,a2t,,art的代数余子式,取值与t无关 D0akt=A1Da1tA2Da2tArDart , t=1,2,,n则 (ak1,ak2,,akn)=A1D(a11,a12,,a1n)ArD(ar1,ar2,,arn)即 αk=A1Dα1A2Dα2ArDαrαk可由α1,α2,,αr线性表示 AAT,则可证关于列向量的结论\begin{aligned} & A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix} = \begin{pmatrix} \alpha_1 \\ \alpha_2 \\ \vdots \\ \alpha_m \end{pmatrix} \\ & 其中 \ \alpha_i = (a_{i1}, a_{i2}, \cdots , a_{in}) \ (i = 1, 2, \cdots , m) \\ & \ \\ & 由矩阵秩的定义, A 存在一个不为零的r阶子式, 设A左上角的r阶子式不为零 \\ & \left | D \right | = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1r} \\ a_{21} & a_{22} & \cdots & a_{2r} \\ \vdots & \vdots & & \vdots \\ a_{r1} & a_{r2} & \cdots & a_{rr} \end{vmatrix} \ne 0 \\ & \ \\ & 若 \alpha_1, \alpha_2, \cdots , \alpha_r线性相关, 则设 \\ & \alpha_r = k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_{r - 1} \alpha_{r - 1} \\ & \ \\ & \left | D \right | \xrightarrow[]{(r_1, r_2, \cdots , r_{r - 1}) \times (-k_1, -k_2, \cdots , -k_{r - 1}) + r_r} \cdots \\ & 则 \left | D \right | 最后一行圈化为零, 即 \left | D \right | = 0, 与假设矛盾 \\ & 则\alpha_1, \alpha_2, \cdots , \alpha_r线性无关 \\ & \ \\ & \alpha_1, \alpha_2, \cdots , \alpha_r向量组中每个向量都能由它本事线性表示, 则只需证\alpha_k \ (k > r)时能由向量组线性表示 \\ & \ \\ & \left | D_t \right | = \begin{vmatrix} \color{#00aaff}{a_{11}} & \color{#00aaff}{\cdots} & \color{#00aaff}{a_{1r}} & a_{1t} \\ \color{#00aaff}{a_{21}} & \color{#00aaff}{\cdots} & \color{#00aaff}{a_{2r}} & a_{2t} \\ \color{#00aaff}{\vdots} & & \color{#00aaff}{\vdots} & \vdots \\ \color{#00aaff}{a_{r1}} & \color{#00aaff}{\cdots} & \color{#00aaff}{a_{rr}} & a_{rt} \\ a_{k1} & \cdots & a_{kr} & a_{kt} \end{vmatrix}, \ t = 1, 2, \cdots , n \\ & \ \\ & t \le r时, D_t 最后一列与前面某列相同, \left | D_t \right | = 0 \\ & t > r 时, \left | D_t \right | 为A的r + 1阶子式, 根据秩的定义, 同样\left | D_t \right | = 0 \\ & \ \\ & 展开\left | D_t \right |最后一列, 得 \\ & a_{1t} A_1 + a_{2t} A_2 + \cdots + a_{rt} A_r + a_{kt} \left | D \right | = 0 \\ & A_1, A_2, \cdots , A_r分别为a_{1t}, a_{2t}, \cdots , a_{rt} 的代数余子式 , 取值与t无关 \\ & \ \\ & \left | D \right | \ne 0 \Rightarrow a_{kt} = - \frac{A_1}{\left | D \right |} a_{1t} - \frac{A_2}{\left | D \right |} a_{2t} - \cdots - \frac{A_r}{\left | D \right |} a_{rt} \ , \ t = 1, 2, \cdots , n \\ & 则 \ (a_{k1}, a_{k2}, \cdots , a_{kn}) = - \frac{A_1}{\left | D \right |} (a_{11}, a_{12}, \cdots , a_{1n}) - \cdots - \frac{A_r}{\left | D \right |} (a_{r1}, a_{r2}, \cdots , a_{rn}) \\ & 即 \ \alpha_k = - \frac{A_1}{\left | D \right |} \alpha_1 - \frac{A_2}{\left | D \right |} \alpha_2 - \cdots - \frac{A_r}{\left | D \right |} \alpha_r \\ & \alpha_k 可由 \alpha_1, \alpha_2, \cdots , \alpha_r 线性表示 \\ & \ \\ & A \rightarrow A^T , 则可证关于列向量的结论 \end{aligned}

推论1 向量组线性相关的矩阵判别法

α1,α2,,αs\alpha_1, \alpha_2, \cdots , \alpha_s 为一 nn 维列向量组, 令

A=(α1,α2,,αs)A = (\alpha_1, \alpha_2, \cdots , \alpha_s)

n×sn \times s矩阵, 则 α1,α2,,αs\alpha_1, \alpha_2, \cdots , \alpha_s 线性相关的充要条件是 r(A)<sr(A) < s, 线性无关的充要条件是 r(A)=sr(A) = s

特别地, 当 s=ns = n 时, 线性相关充要条件为 A=0\left | A \right | = 0

推论2 m>nm > n 时, mmnn维向量一定线性相关

3.2.3 向量组的秩

定义2 如果向量组 AA 中部分组 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 满足条件

则称 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 为向量组 AA 的一个最大无关组或极大无关组

一个向量组的最大无关组与该向量组等价, 且线性无关向量组最大无关组为它本身

例 向量组 α1=(1,0,0),α2=(1,1,0),α3=(2,1,0)\alpha_1 = (1, 0, 0), \alpha_2 = (1, 1, 0), \alpha_3 = (2, 1, 0) 中, α1,α2\alpha_1, \alpha_2 线性无关, 而 α3=α1+α2\alpha_3 = \alpha_1 + \alpha_2 , 所以 α1,α2\alpha_1, \alpha_2 为向量组的一个最大无关组,

同理 α1,α3\alpha_1, \alpha_3α2,α3\alpha_2, \alpha_3 也为向量组的最大无关组

定理5 由有限个行向量 α1,α2,,αs\alpha_1, \alpha_2, \cdots , \alpha_s 组成的向量组的任一最大无关组中所含的向量个数均相等, 且等于下列矩阵的秩

A=(α1α2αs)A = \begin{pmatrix} \alpha_1 \\ \alpha_2 \\ \cdots \\ \alpha_s \end{pmatrix}

证明

设向量组αi1,α12,,αik为向量组α1,α2,,αs的任一最大无关组 令 B=(αi1αi2αik) 因为αi1,α12,,αik线性无关,由推论1,r(B)=kB的行向量都是A的行向量,B的子式,要么是A的子式,要么与A的子式相差一个符号B的不为零的子式最高阶数小于或等于A的不为零子式的最高阶数,kr(A) 由于αi1,α12,,αik为向量组α1,α2,,αs的一个最大无关组,则对于每个aj (ji1,i2,,ik)有 aj=lj1αi1+lj2αi2++ljkαik Arj+(ri1,ri2,,rik)×(lj1,lj2,,ljk),则第j行化为零 , 通过若干次初等变换,sk行全为零,从而r(A)k kr(A)r(A)k,k=r(A),即向量组的任一最大无关组中所含的向量个数均相等,且等于矩阵A的秩\begin{aligned} & 设向量组 \alpha_{i_1}, \alpha_{1_2}, \cdots , \alpha_{i_k} 为向量组 \alpha_1, \alpha_2, \cdots , \alpha_s 的任一最大无关组 \\ & \ \\ & 令 \ B = \begin{pmatrix} \alpha_{i_1} \\ \alpha_{i_2} \\ \vdots \\ \alpha_{i_k} \end{pmatrix} \\ & \ \\ & 因为 \alpha_{i_1}, \alpha_{1_2}, \cdots , \alpha_{i_k} 线性无关, 由推论1得, r(B) = k \\ & 又B的行向量都是A的行向量, 则B的子式, 要么是A的子式, 要么与A的子式相差一个符号 \\ & 则B的不为零的子式最高阶数小于或等于A的不为零子式的最高阶数, 即 k \le r(A) \\ & \ \\ & 由于 \alpha_{i_1}, \alpha_{1_2}, \cdots , \alpha_{i_k} 为向量组 \alpha_1, \alpha_2, \cdots , \alpha_s 的一个最大无关组, 则对于每个a_j \ (j \ne i_1, i_2, \cdots , i_k) \\ & 有 \ a_j = l_{j1} \alpha_{i_1} + l_{j2} \alpha_{i_2} + \cdots + l_{jk} \alpha_{i_k} \\ & \ \\ & A \xrightarrow[]{r_j + (r_{i_1}, r_{i_2}, \cdots , r_{i_k}) \times (-l_{j1}, -l_{j2}, \cdots , -l_{jk})} , 则第 j 行化为零 \ , \ 通过若干次初等变换, s - k 行全为零, 从而r(A) \le k \\ & \ \\ & k \le r(A) 且 r(A) \le k, 则k = r(A), 即向量组的任一最大无关组中所含的向量个数均相等, 且等于矩阵A的秩 \end{aligned}

定义3 向量组的最大无关组中所含向量的个数称向量组的秩 定理6 矩阵 AA 的秩等于它行向量组的秩, 也等于它列向量组的秩

例 判断向量组 α1=(1,4,1,0)T,α2=(2,1,1,3)T,α3=(1,0,3,1)T,α4=(0,2,6,3)T\alpha_1 = (1, 4, 1, 0)^T, \alpha_2 = (2, 1, -1, -3)^T, \alpha_3 = (1, 0, -3, -1)^T, \alpha_4 = (0, 2, -6, 3)^T 是否线性相关, 并求它的秩

构建矩阵A=(α1,α2,α3,α4)=(1210410211360313)A(1210031300390000)r(A)=3<4,则向量组线性相关,它的秩为3\begin{aligned} & 构建矩阵 \\ & A = (\alpha_1, \alpha_2, \alpha_3, \alpha_4) = \begin{pmatrix} 1 & 2 & 1 & 0 \\ 4 & 1 & 0 & 2 \\ 1 & -1 & -3 & -6 \\ 0 & -3 & -1 & 3 \end{pmatrix} \\ & A \xrightarrow[\cdots]{\cdots} \begin{pmatrix} 1 & 2 & 1 & 0 \\ 0 & -3 & -1 & 3 \\ 0 & 0 & -3 & -9 \\ 0 & 0 & 0 & 0 \end{pmatrix} \\ & r(A) = 3 < 4, 则向量组线性相关, 它的秩为3 \end{aligned}

例 求上述向量组的一个最大无关组

B=(1210031300390000) B左上角的三阶子式不为零,B前三列三个列向量α1,α2,α3线性无关α1,α2,α3为向量组α1,α2,α3,α4的一个最大无关组B = \begin{pmatrix} 1 & 2 & 1 & 0 \\ 0 & -3 & -1 & 3 \\ 0 & 0 & -3 & -9 \\ 0 & 0 & 0 & 0 \end{pmatrix} \\ \ \\ \begin{aligned} & B左上角的三阶子式不为零, 则B前三列三个列向量 \alpha_1, \alpha_2, \alpha_3 线性无关 \\ & 即 \alpha_1, \alpha_2, \alpha_3 为向量组 \alpha_1, \alpha_2, \alpha_3, \alpha_4 的一个最大无关组 \end{aligned}

定理7 若线性无关向量组 α1,α2,,αs\alpha_1, \alpha_2, \cdots , \alpha_s 可由向量组 β1,β2,,βt\beta_1, \beta_2, \cdots , \beta_t 线性表示, 则 sts \le t

证明

n维列向量αi,βj (i=1,2,,s ; j=1,2,,t),A=(α1,α2,,αs) , B=(α1,α2,,αs,β1,β2,,βt) 由于A的任一子式都为B的一个子式,r(A)r(B)α1,α2,,αs线性无关,r(A)=sr(B) alpha1,α2,,αs可由β1.β2,,βt线性表示,B=(α1,α2,,αs,β1,β2,,βt)C=(0,0,,0,β1,β2,,βt)r(B)=r(C)t, st\begin{aligned} & 设n维列向量 \alpha_i, \beta_j \ (i = 1, 2, \cdots , s \ ; \ j = 1, 2, \cdots , t) , 令 \\ & A = (\alpha_1, \alpha_2, \cdots , \alpha_s) \ , \ B = (\alpha_1, \alpha_2, \cdots , \alpha_s, \beta_1, \beta_2, \cdots , \beta_t) \\ & \ \\ & 由于A的任一子式都为B的一个子式, 咕 r(A) \le r(B) \\ & 又 \alpha_1, \alpha_2, \cdots , \alpha_s 线性无关, 则r(A) = s \le r(B) \\ & \ \\ & 又 alpha_1, \alpha_2, \cdots , \alpha_s 可由 \beta_1. \beta_2, \cdots , \beta_t 线性表示, 则 \\ & B = (\alpha_1, \alpha_2, \cdots , \alpha_s, \beta_1, \beta_2, \cdots , \beta_t) \rightarrow C = (\mathbf{0}, \mathbf{0}, \cdots , \mathbf{0}, \beta_1, \beta_2, \cdots , \beta_t) \\ & 则 r(B) = r(C) \le t, \ s \le t \end{aligned}

定理7等价表示

向量组 α1,α2,,αs\alpha_1, \alpha_2, \cdots , \alpha_s 可由向量组 β1,β2,,βt\beta_1, \beta_2, \cdots , \beta_t 线性表示, 且 s>ts > t , 则向量组 α1,α2,,αs\alpha_1, \alpha_2, \cdots , \alpha_s 线性相关

推论3 设向量组秩为 rr 向量组中任意多余 rr 个向量构成的向量组一定线性相关, 从而向量组中任意 rr 个线性无关的向量都构成向量组的一个最大无关组

推论4 向量组任一线性无关部分组都可由扩充为向量组的一个最大无关组

推论5 若两个线性无关向量组 &\alpha_1, \alpha_2, \cdots , \alpha_s$ 和 β1,β2, dots,βt\beta_1, \beta_2, \ dots , \beta_t , 则 s=ts = t

推论6 向量组 AA 与向量组 BB 等价, 则它们有相同的秩

例 向量组 α1,α2,α3\alpha_1, \alpha_2, \alpha_3 线性相关, 向量组 α2,α3,α4\alpha_2, \alpha_3, \alpha_4 线性无关, 证明

证明

α2,α3,α4线性无关,则由定理2,α2,α3线性无关α1,α2,α3线性相关,由定理3,α1能由α2,α3线性表示 反证法: 假设α4能由α1,α2,α3线性表示,α1能由α2,α3线性表示α4能有α2,α3线性表示,α2,α3,α4线性无关相矛盾\begin{aligned} & \alpha_2, \alpha_3, \alpha_4 线性无关, 则由定理2, \alpha_2, \alpha_3 线性无关 \\ & 又 \alpha_1, \alpha_2, \alpha_3 线性相关, 由定理3, \alpha_1 能由 \alpha_2, \alpha_3线性表示 \\ & \ \\ & 反证法: \ 假设 \alpha_4 能由 \alpha_1, \alpha_2, \alpha_3 线性表示, 又 \alpha_1 能由 \alpha_2, \alpha_3 线性表示 \\ & 则 \alpha_4 能有 \alpha_2, \alpha_3 线性表示, 与 \alpha_2, \alpha_3, \alpha_4 线性无关相矛盾 \end{aligned}

定理8 若向量组线性无关, 则在各向量中相应增加分量后, 所得向量组仍线性无关

sm维向量α1,α2,,αs线性无关, 在每个向量中增加nm个分量后得到n维向量组β1,β2,,βs 先证明分量都添加在各个αi后面是结论成立,即若αi=(ai1,ai2,,aim)T则 βi=(ai1,ai2,,aim,ai,am+1,,ain)T , i=1,2,,s 设 x1β1+x2β2+xsβs=0展开得 {a11x1+a21x2++as1xs=0a12x1+a22x2++as2xs=0a1mx1+a2mx2++asmxs=0a1,m+1x1+a2,m+1x2++as,m+1xs=0a1nx1+a2nx2++asnxs=0则方程组前m个方程可写为 x1α1+x2α2++xsαs=0 α1,α2,,αs线性无关,则方程只有零解,即方程组只有零解故向量组β1,β2,,βs线性无关 若分量加在αi个分量之间,定理仍成立\begin{aligned} & 设s个m维向量 \alpha_1, \alpha_2, \cdots , \alpha_s 线性无关, \ 在每个向量中增加n - m个分量后得到n维向量组 \beta_1, \beta_2, \cdots , \beta_s \\ & \ \\ & 先证明分量都添加在各个\alpha_i后面是结论成立, 即若\alpha_i = (a_{i1}, a_{i2}, \cdots , a_{im})^T \\ & 则 \ \beta_i = (a_{i1}, a_{i2}, \cdots , a_{im}, a_i, a_{m + 1}, \cdots , a_{in})^T \ , \ i = 1, 2, \cdots , s \\ & \ \\ & 设 \ x_1 \beta_1 + x_2 \beta_2 \cdots + x_s \beta_s = \mathbf{0} \\ & 展开得 \ \begin{cases} a_{11} x_1 + a_{21} x_2 + \cdots + a_{s1} x_s = 0 \\ a_{12} x_1 + a_{22} x_2 + \cdots + a_{s2} x_s = 0 \\ \cdots \cdots \cdots \cdots \\ a_{1m} x_1 + a_{2m} x_2 + \cdots + a_{sm} x_s = 0 \\ a_{1, m + 1} x_1 + a_{2, m + 1} x_2 + \cdots + a_{s, m + 1} x_s = 0 \\ \cdots \cdots \cdots \cdots \\ a_{1n} x_1 + a_{2n} x_2 + \cdots + a_{sn} x_s = 0 \end{cases} \\ & 则方程组前m个方程可写为 \ x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_s \alpha_s = \mathbf{0} \\ & \ \\ & 又 \alpha_1, \alpha_2, \cdots , \alpha_s 线性无关, 则方程只有零解, 即方程组只有零解 \\ & 故向量组 \beta_1, \beta_2, \cdots , \beta_s 线性无关 \\ & \ \\ & 若分量加在 \alpha_i 个分量之间, 定理仍成立 \end{aligned}

推论7 若向量组线性相关, 则在个向量中减少响应和分量之后向量组仍线性相关

3.3 向量空间

3.3.1 向量空间

SS 为由 nn 维向量组成的集合, 若对任意 α,βS\alpha, \beta \in S , 有 α+βS\alpha + \beta \in S ,则称集合 SS 关于向量的加法封闭

若对于任意 αS,kR\alpha \in S, k \in R , 有 kαSk \alpha \in S , 则称集合 SS 关于向量的数乘封闭

定义1 设 VVnn 维向量组成的非空集合, 若 VV 关于向量的加法和数乘都封闭, 则称 VV 为向量空间

全体 nn 维向量的集合就是一个向量空间, 称为 nn 维向量空间, 记作 RnR^n

平面和空间中向量可分别由二维和三位表示, 故 R2, R3R^2, \ R^3 分别为通常都二维和三维空间

例 判断下列哪些是向量空间

A={(a1,0,,0)a1R}B={(a1,1,0,,0)a1R}C={(a1,a2,,an)a1+a2++an=0, aiR, i=1,2,,n}\begin{aligned} & A = \{ (a_1, 0, \cdots , 0) | a_1 \in R \} \\ & B = \{ (a_1, 1, 0, \cdots , 0) | a_1 \in R \} \\ & C = \{ (a_1, a_2, \cdots , a_n) | a_1 + a_2 + \cdots + a_n = 0, \ a_i \in R, \ i = 1, 2, \cdots , n \} \end{aligned}

A是向量空间, α=(a,0,,0), β=(b,0,,0), kRα+β=(a+b,0,,0)Akα=(ka,0,,0)AA关于向量的加法和数乘都封闭 B不是向量空间, α=(a,1,0,,0), β=(b,1,0,,0)α+β=(a+b,2,0,,0)BB关于向量加法不封闭 C是向量空间, α=(a1,a2,,αn), β=(b1,b2,,bn)其中a1+a2++an=0 , b1+b2++bn=0,α+β=(a1+b1,a2+b2,,an+bn)a1+b1+a2+b2++an+bn=(a1+a2++an)+(b1+b2++bn)=0α+βCk ,ka1+ka2++kan=k(a1+a2++an)=0kα=(ka1,ka2,,kan)CkαC,因此C关于向量的加法和数乘都封闭\begin{aligned} & A是向量空间, \forall \ \alpha = (a, 0, \cdots , 0), \ \beta = (b, 0, \cdots , 0), \ k \in R \\ & \alpha + \beta = (a + b, 0, \cdots , 0) \in A \\ & k \alpha = (ka, 0, \cdots , 0) \in A \\ & 即A关于向量的加法和数乘都封闭 \\ & \ \\ & B不是向量空间, \ \alpha = (a, 1, 0, \cdots , 0), \ \beta = (b, 1, 0, \cdots , 0) \\ & \alpha + \beta = (a + b, 2, 0, \cdots , 0) \notin B \\ & 即B关于向量加法不封闭 \\ & \ \\ & C是向量空间, \forall \ \alpha = (a_1, a_2, \cdots , \alpha_n) , \ \beta = (b_1, b_2, \cdots , b_n) \\ & 其中 a_1 + a_2 + \cdots + a_n = 0\ , \ b_1 + b_2 + \cdots + b_n = 0 , 有 \\ & \alpha + \beta = (a_1 + b_1, a_2 + b_2, \cdots , a_n + b_n) \\ & 且 a_1 + b_1 + a_2 + b_2 + \cdots + a_n + b_n = (a_1 + a_2 + \cdots + a_n) + (b_1 + b_2 + \cdots + b_n) = 0 \\ & 即 \alpha + \beta \in C \\ & 又 \forall k \ , k a_1 + k a_2 + \cdots + k a_n = k (a_1 + a_2 + \cdots + a_n) = 0 \\ & k \alpha = (k a_1, k a_2, \cdots , k a_n) \in C \\ & 即 k \alpha \in C, 因此C关于向量的加法和数乘都封闭 \end{aligned}

3.3.2 子空间

定义2 设 WW 是向量空间 VV 的一个非空子集, 若 WW 关于向量的加法和数乘都封闭, 称 WWVV 的一个子空间

向量空间 VV 的非空子集 WWVV 的向量子空间当且仅当 α,βW, k,lR\forall \alpha, \beta \in W, \ k, l \in R , 有 kα+lβWk \alpha + l \beta \in W

向量空间 VV 本身和 VV 中零向量组成的零空间都是 VV 的子空间, 这两个子空间称为平凡子空间, 它们分别构成 VV 的最大和最小子空间

$V$ 其他子空间称为非平凡子空间

上述例子中 A,CA, C 都是 RnR^n 的子空间, 同理

W1={(a1,a2,,an1,i=1n1ai)  aiR,i=1,2,,n1}W2={(a1,a2,,an)  a1=a2==anR}W3={(a,a+b,a+2b,,a+(n1)b  a,bR)}\begin{aligned} & W_1 = \{ (a_1, a_2, \cdots, a_{n - 1}, \sum_{i = 1}^{n - 1} a_i) \ | \ a_i \in R, i = 1, 2, \cdots, n - 1 \} \\ & W_2 = \{ (a_1, a_2, \cdots , a_n) \ | \ a_1 = a_2 = \cdots = a_n \in R \} \\ & W_3 = \{ (a, a + b, a + 2b, \cdots , a + (n - 1)b \ | \ a, b \in R) \} \end{aligned}

都是 RnR^n 的子空间

VV 是一个向量空间, α,α2,,αrV\alpha_, \alpha_2, \cdots , \alpha_r \in V , 则

W={k1α2+k2α2++krαr  kiR,i=1,2,,r}W = \{ k_1 \alpha_2 + k_2 \alpha_2 + \cdots + k_r \alpha_r \ | \ k_i \in R, i =1, 2, \cdots , r \}

VV 的子空间, 这个子空间称为由 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 生成的子空间, 记作 L(α1,α2,,αr)L(\alpha_1, \alpha_2, \cdots , \alpha_r)

α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 称为这个子空间的一组生成元

对于 αV,L(α)=kα  kR\alpha \in V, L(\alpha) = {k \alpha \ | \ k \in R} 是由 α\alpha 生成的 VV 的子空间

W1,W2W_1, W_2 为向量空间 vv 的两个子空间, 则 VV 的子集

{α  αW1αW2} {α  α=α1+α2,其中α1W1,α2W2}\{ \alpha \ | \ \alpha \in W_1 且 \alpha \in W_2 \} \\ \ \\ \{ \alpha \ | \ \alpha = \alpha_1 + \alpha_2 , 其中 \alpha_1 \in W_1, \alpha_2 \in W_2 \}

都是 VV 的子空间, 前者称两个子空间 W1,W2W_1, W_2 的交, 记作 W1W2W_1 \cap W_2 ; 后者称两个子空间 W1,W2W_1, W_2 的和, 记作 W1+W2W_1 + W_2

W1W2W_1 \cap W_2 关于向量的加法和数乘都封闭, 是 VV 的子空间

W!+W2W_! + W_2 也是 VV 的子空间

3.3.3 向量空间的基与维数

定义3 设 VV 为一个向量空间, α1,α2,,αrV\alpha_1, \alpha_2, \cdots , \alpha_r \in V , 若

则称向量组 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 为向量空间 VV 的一组基, rr 称为向量空间 VV 的维数, 记作 dim(V)=rdim(V) = r

零空间的维度规定为零

把向量空间看做一个向量组, 则其基就是它的一个最大无关组, 其维数就是它的秩

向量空间可以有很多组基, 但每组基所含向量个数相同, 故向量空间维数唯一确定

例 证明 ε1=(1,0,,0),ε2=(0,1,,0),,εn=(0,0,,1)\varepsilon_1 = (1, 0, \cdots , 0), \varepsilon_2 = (0, 1, \cdots , 0) , \cdots , \varepsilon_n = (0, 0, \cdots , 1)RnR^n 的一组基, 从而得 RnR^n 的维数为 nn

先证ε1,ε2,,εn线性无关它们构成矩阵E=(ε1,ε2,,εn)=(100010001)r(E)=n,则向量组线性无关 对于αRn , 设α=(a1,a2,,an)α=a1ε1+a2ε2++anεε1,ε2,,εn为向量空间Rn的基,dim(Rn)=n\begin{aligned} & 先证 \varepsilon_1, \varepsilon_2, \cdots , \varepsilon_n 线性无关 \\ & 它们构成矩阵 E = (\varepsilon_1, \varepsilon_2, \cdots , \varepsilon_n) = \begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \cdots & 1 \end{pmatrix} \\ & r(E) = n, 则向量组线性无关 \\ & \ \\ & 对于 \forall \alpha \in R^n \ , \ 设 \alpha = (a_1, a_2, \cdots , a_n) \\ & \alpha = a_1 \varepsilon_1 + a_2 \varepsilon_2 + \cdots + a_n \varepsilon \\ & 故 \varepsilon_1, \varepsilon_2, \cdots , \varepsilon_n 为向量空间 R^n 的基, 且 dim(R^n) = n \end{aligned}

ε1,ε2,,εn\varepsilon_1, \varepsilon_2, \cdots , \varepsilon_n 称为向量空间 RnR^n 的标准基

α1,α2,,αm\alpha_1, \alpha_2, \cdots , \alpha_mmmnn 为向量,

V=L(α1,α2,,αm)={k1α1+k2α2++kmαm  kiR,i=1,2,,m}V = L(\alpha_1, \alpha_2, \cdots , \alpha_m) = \{ k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_m \alpha_m \ | \ k_i \in R, i = 1, 2, \cdots , m \}

则向量组 α1,α2,,αm\alpha_1, \alpha_2, \cdots , \alpha_m 的一个最大无关组就是 VV 的一组基, 从而向量组 α1,α2,,αm\alpha_1, \alpha_2, \cdots , \alpha_m 的秩就等于 VV 的维数

定理1 设 VV 是一个向量空间, dim(V)=rdim(V) = r , 则 VV 中任意 rr 个线性无关的向量都是 VV 的一组基, 且 VV 的任一多于 rr 个向量的向量组一定线性相关

特别地, 任意 nn 个线性无关的 nn 维向量都是 RnR^n 的一组基

定理2 向量空间 VV 的任一线性无关向量组都可以扩充为 VV 的一组基, 特别地, VV 的任一子空间的基都可扩充为 VV 的基

3.3.4 向量在给定基下的坐标

α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 是向量空间 VV 的一组基, 则 VV 中每个向量 α\alpha 都可表示为

α=x1α1+x2α2++xrαr\alpha = x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_r \alpha_r

且有序数组 x1,x2,,xrx_1, x_2, \cdots , x_r 是唯一的

定义4 设 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 是向量空间 VV 的一组基, αV\alpha \in V , 若

α=x1α1+x2α2++xrαr\alpha = x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_r \alpha_r

rr维向量 (x1,x2,,xr)(x_1, x_2, \cdots , x_r) 称为向量 α\alpha 在基 alpha1,α2,,αralpha_1, \alpha_2, \cdots , \alpha_r 下的坐标

RnR^n 中任意向量在标准基下的坐标为它本身

例 设 α1=(1,1,1)T,α2=(1,1,1)T,α3=(1,1,1)T\alpha_1 = (1, 1, 1)^T, \alpha_2 = (1, 1, -1)^T, \alpha_3 = (1, -1, -1)^T , 证明 α1,α2,α3\alpha_1, \alpha_2, \alpha_3 是向量空间 R3R^3 的一组基, 并求 β=(1,2,1)T\beta = (1, 2, 1)^T 在此基下的坐标

A=(α1,α2,α3),A=111111111=40α1,α2,α3线性无关,从而是R3的一组基 β=x1α1+x2α2+x3α3,(121)=x1(111)+x2(111)+x3(111)=(x1+x2+x3x1+x2x3x1x2x3)则有 {x1+x2+x3=1x1+x2x3=2x1x2x3=1解得 x1=1,x2=12,x3=12β在基α1,α2,α3下的坐标为(1,12,12)\begin{aligned} & 令 A = (\alpha_1, \alpha_2, \alpha_3), 则 \\ & \left | A \right | = \begin{vmatrix} 1 & 1 & 1 \\ 1 & 1 & -1 \\ 1 & -1 & -1 \\ \end{vmatrix} = -4 \ne 0 \\ & 故 \alpha_1, \alpha_2, \alpha_3 线性无关, 从而是 R^3 的一组基 \\ & \ \\ & 令 \beta = x_1 \alpha_1 + x_2 \alpha_2 + x_3 \alpha_3 , 即 \\ & \begin{pmatrix} 1 \\ 2 \\ 1 \end{pmatrix} = x_1 \begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix} + x_2 \begin{pmatrix} 1 \\ 1 \\ -1 \end{pmatrix} + x_3 \begin{pmatrix} 1 \\ -1 \\ -1 \end{pmatrix} = \begin{pmatrix} x_1 + x_2 + x_3 \\ x_1 + x_2 - x_3 \\ x_1 - x_2 - x_3 \end{pmatrix} \\ & 则有 \ \begin{cases} x_1 + x_2 + x_3 = 1 \\ x_1 + x_2 - x_3 = 2 \\ x_1 - x_2 - x_3 = 1 \\ \end{cases} \\ & 解得 \ x_1 = 1, x_2 = \frac{1}{2}, x_3 = - \frac{1}{2} \\ & 即 \beta 在基 \alpha_1, \alpha_2, \alpha_3 下的坐标为 (1, \frac{1}{2}, - \frac{1}{2}) \end{aligned}

α,β\alpha, \beta 坐标分别为 (x1,x2,,xr)(x_1, x_2, \cdots , x_r)(y1,y2,,yr)(y_1, y_2, \cdots , y_r) , 则

(x1+y1,x2+y2,,xr+yr)=(x1,x2,,xr)+(y1,y2,,yr)(x_1 + y_1, x_2 + y_2, \cdots , x_r + y_r) = (x_1, x_2, \cdots , x_r) + (y_1, y_2, \cdots , y_r)

(λx1,λx2,,λxr)=λ(x1,x2,,xr)(\lambda x_1, \lambda x_2, \cdots , \lambda x_r) = \lambda (x_1, x_2, \cdots , x_r)

若向量 α\alpha 在基 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 下坐标为 (x1,x2,,xr)(x_1, x_2, \cdots , x_r) , 即

α=x1α1+x2α2++xrαr\alpha = x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_r \alpha_r

矩阵符号记作

α=(α1,α2,,αr)(x1x2xr)\alpha = (\alpha_1, \alpha_2, \cdots , \alpha_r) \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_r \end{pmatrix}

3.3.5 基变换与坐标变换

α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_rβ1,β2,,βr\beta_1, \beta_2, \cdots , \beta_rVV 的两组基. 由基的定义得, β1,β2,,βr\beta_1, \beta_2, \cdots , \beta_r 可以由 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 线性表示, 即

{β1=a11α1+a21α2++ar1αrβ2=a12α1+a22α2++ar2αrβr=a1rα1+a2rα2++arrαr\begin{cases} \beta_1 = a_{11} \alpha_1 + a_{21}\alpha_2 + \cdots + a_{r1} \alpha_r \\ \beta_2 = a_{12} \alpha_1 + a_{22}\alpha_2 + \cdots + a_{r2} \alpha_r \\ \cdots \cdots \cdots \cdots \\ \beta_r = a_{1r} \alpha_1 + a_{2r}\alpha_2 + \cdots + a_{rr} \alpha_r \end{cases}

写成矩阵的形式为

(β1,β2,,βr)=(α1,α2,,αr)A(\beta_1, \beta_2, \cdots , \beta_r) = (\alpha_1, \alpha_2, \cdots , \alpha_r) A

其中

A=(a11a12a1ra21a22a2ra1rar2arr)A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1r} \\ a_{21} & a_{22} & \cdots & a_{2r} \\ \vdots & \vdots & & \vdots \\ a_{1r} & a_{r2} & \cdots & a_{rr} \end{pmatrix}

矩阵 AA 的第 ii 列是 βi\beta_i 在基 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 下的坐标, 称 AA 为有基 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 到基 β1,β2,,βr\beta_1, \beta_2, \cdots , \beta_r 的过渡矩阵, 上式称为基变换公式

由于 β1,β2,,βr\beta_1, \beta_2, \cdots , \beta_r 也是一组基, α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 能由其表示, 即

(α1,α2,,αr)=(β1,β2,,βr)B(\alpha_1, \alpha_2, \cdots , \alpha_r) = (\beta_1, \beta_2, \cdots , \beta_r) B

从而

(β1,β2,,βr)=(α1,α2,,αr)A=(β1,β2,,βr)BA(\beta_1, \beta_2, \cdots , \beta_r) = (\alpha_1, \alpha_2, \cdots , \alpha_r) A = (\beta_1, \beta_2, \cdots , \beta_r) BA

β1,β2,,βr\beta_1, \beta_2, \cdots , \beta_r 线性无关可得 BA=EBA = E , 即 B=A1B = A^{-1}

VV 中向量 α\alpha 在基 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 和基 β1,β2,,βr\beta_1, \beta_2, \cdots , \beta_r 中坐标分别为 (x1,x2,,xr)(x_1, x_2, \cdots , x_r)(y1,y2,,yr)(y_1, y_2, \cdots , y_r) , 即

α=(α1,α2,,αr)(x1x2xr)=(β1,β2,,βr)(y1y2yr)\alpha = (\alpha_1, \alpha_2, \cdots , \alpha_r) \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_r \end{pmatrix} = (\beta_1, \beta_2, \cdots , \beta_r) \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_r \end{pmatrix}

代入得

α=(α1,α2,,αr)(x1x2xr)=(α1,α2,,αr)A(y1y2yr)\alpha = (\alpha_1, \alpha_2, \cdots , \alpha_r) \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_r \end{pmatrix} = (\alpha_1, \alpha_2, \cdots , \alpha_r) A \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_r \end{pmatrix}

向量坐标唯一, 可得

(x1x2xr)=A(y1y2yr)\begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_r \end{pmatrix} = A \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_r \end{pmatrix}

定理3 设 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_rβ1,β2,,βr\beta_1, \beta_2, \cdots , \beta_r 是向量空间 VV 的两组基, 由基 α1,α2,,αr\alpha_1, \alpha_2, \cdots , \alpha_r 到基 β1,β2,,βr\beta_1, \beta_2, \cdots , \beta_r 过渡矩阵为 AA , 向量 α\alpha 在两组基坐标分别为 (x1,x2,,xr)(x_1, x_2, \cdots , x_r)(y1,y2,,yr)(y_1, y_2, \cdots , y_r) , 则

(x1x2xr)=A(y1y2yr) , 或 (y1y2yr)=A1(x1x2xr)\begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_r \end{pmatrix} = A \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_r \end{pmatrix} \ , \ 或 \ \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_r \end{pmatrix} = A^{-1} \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_r \end{pmatrix}

上式称为坐标变换公式

例 已知 β\beta 在基 α1=(1,1,1)T,α2=(1,1,1)T,α3=(1,1,1)T\alpha_1 = (1, 1, 1)^T, \alpha_2 = (1, 1, -1)^T, \alpha_3 = (1, -1, -1)^T 下的坐标为 (1,12,12)(1, \frac{1}{2}, - \frac{1}{2}), 求它在标准基 ε1,ε2,ε3\varepsilon_1, \varepsilon_2, \varepsilon_3 下的坐标

(α1,α2,α3)=(ε1,ε2,ε3)(111111111)=(ε1,ε2,ε3)A A=(111111111),为由基ε1,ε2,ε3到基α1,α2,α3的过渡矩阵 则向量β在基ε1,ε2,ε3下坐标为(x1x2x3)=A(11212)=(111111111)(11212)=(121)\begin{aligned} & (\alpha_1, \alpha_2, \alpha_3) = (\varepsilon_1, \varepsilon_2, \varepsilon_3) \begin{pmatrix} 1 & 1 & 1 \\ 1 & 1 & -1 \\ 1 & -1 & -1 \end{pmatrix} = (\varepsilon_1, \varepsilon_2, \varepsilon_3) A \\ & \ \\ & A = \begin{pmatrix} 1 & 1 & 1 \\ 1 & 1 & -1 \\ 1 & -1 & -1 \end{pmatrix}, 为由基 \varepsilon_1, \varepsilon_2, \varepsilon_3 到基 \alpha_1, \alpha_2, \alpha_3 的过渡矩阵 \\ & \ \\ & 则向量 \beta 在基 \varepsilon_1, \varepsilon_2, \varepsilon_3 下坐标为 \\ & \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} = A \begin{pmatrix} 1 \\ \frac{1}{2} \\ - \frac{1}{2} \end{pmatrix} = \begin{pmatrix} 1 & 1 & 1 \\ 1 & 1 & -1 \\ 1 & -1 & -1 \end{pmatrix} \begin{pmatrix} 1 \\ \frac{1}{2} \\ - \frac{1}{2} \end{pmatrix} = \begin{pmatrix} 1 \\ 2 \\ 1 \end{pmatrix} \end{aligned}

3.4 欧几里德空间

3.4.1 向量的内积

定义1 设 α=(x1,x2,,xn),β=(y1,y2,,yn)\alpha = (x_1, x_2, \cdots , x_n), \beta = (y_1, y_2, \cdots , y_n) 为两个 nn 维向量, 则实数 x1y1+x2y2++xnynx_1 y_1 + x_2 y_2 + \cdots + x_n y_n 称为向量 α,β\alpha, \beta 的内积, 记作 (α,β)(\alpha, \beta) , 即

(α,β)=x1y1+x2y2+xnyn(\alpha, \beta) = x_1 y_1 + x_2 y_2 + \cdots x_n y_n

定义向量内积的向量空间称为欧几里德空间, 简称欧式空间

欧式空间 VV 的内积与三位向量空间 R3R^3 中的数量级一样具有以下性质

3.4.2 向量的长度与夹角

定义2 设 α=(x1,x2,,xn)\alpha = (x_1, x_2, \cdots , x_n) 为欧式空间 VV 中一向量, 定义 α\alpha 的长度为

α=(α,α)=x12+x22++xn2\parallel \alpha \parallel = \sqrt{(\alpha, \alpha)} = \sqrt{x_1^2 + x_2^2 + \cdots + x_n^2}

向量长度具有以下性质

长度为 11 的向量称为单位向量

α\alpha 为任一非零向量, 则 1αα\frac{1}{\parallel \alpha \parallel} \alpha 为单位向量, 即用数 1\frac{1}{\parallel \aleph \parallel} 乘向量 α\alpha , 则将向量单位化

对于欧式空间两个向量 α=(a1,a2,,an),β=(b1,b2,,bn)\alpha = (a_1, a_2, \cdots , a_n), \beta = (b_1, b_2, \cdots , b_n) , 定义它们的距离为 αβ\parallel \alpha - \beta \parallel , 即 (a1b1)2+(a2b2)2++(anbn)2\sqrt{(a_1 - b_1)^2 + (a_2 - b_2)^2 + \cdots + (a_n - b_n)^2}

定理1 向量内积满足柯西不等式

(α,β)2(α,α)(β,β) ,  α,βV(\alpha, \beta)^2 \le (\alpha, \alpha) (\beta, \beta) \ , \ \ \forall \alpha, \beta \in V

等号成立当且仅当 α,β\alpha, \beta 线性相关

此不等式也写做

(α,β)αβ\left | (\alpha, \beta) \right | \le \parallel \alpha \parallel \parallel \beta \parallel

证 若 α,β\alpha, \beta 线性相关, 设 α=kβ\alpha = k \beta , 则

(α,β)2=(kβ,β)2=k2(β,β)2=(kβ,kβ)(β,β)=(α,α)(β,β)(\alpha, \beta)^2 = (k \beta, \beta)^2 = k^2 (\beta, \beta)^2 = (k \beta, k \beta) (\beta, \beta) = (\alpha, \alpha) (\beta, \beta)

α,β\alpha, \beta 线性无关, 则 t,tα+β0\forall t, t \alpha + \beta \ne 0 , 则

(tα+β,tα+β)>0(t \alpha + \beta, t \alpha + \beta) > 0

(α,α)t2+2(α,β)t+(β,β)>0(\alpha, \alpha) t^2 + 2 (\alpha, \beta) t + (\beta, \beta) > 0

则判别式 Δ=4((α,β)2(α,α)(β,β))\Delta = 4((\alpha, \beta)^2 - (\alpha, \alpha) (\beta, \beta)) , 即

(α,β)2<(α,α)(β,β)(\alpha, \beta)^2 < (\alpha, \alpha) (\beta, \beta)

由可惜不等式得

(α,β)αβ1\frac{\left | (\alpha, \beta) \right |}{\parallel \alpha \parallel \parallel \beta \parallel} \le 1

定义3 设 α,β\alpha, \beta 为欧式空间 VV 的两个非零向量, α\alphaβ\beta 夹角定义为

α,β=arccos(α,β)αβ , α,β[0,π]\langle \alpha, \beta \rangle = arccos \frac{(\alpha, \beta)}{\parallel \alpha \parallel \parallel \beta \parallel} \ , \ \langle \alpha, \beta \rangle \in [0, \pi]

(α,β)=0(\alpha, \beta) = 0 时, 称 α,β\alpha, \beta 正交, 记作 αβ\alpha \perp \beta

α,β\alpha, \beta 非零时, 它们正交当且仅当它们夹角为 π2\frac{\pi}{2}

零向量与任意向量都正交

3.4.3 标准正交基

α1,α2,,αs\alpha_1, \alpha_2, \cdots , \alpha_s 是欧式空间 VV 的一组两两相交的非零向量, 则称向量组 α1,α2,,αs\alpha_1, \alpha_2, \cdots , \alpha_s 为一正交向量组

正交向量组一定线性无关, 设 α1,α2,,αs\alpha_1, \alpha_2, \cdots , \alpha_s 为一正交向量组, 令

k1α1+k2α2++ksαs=0k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_s \alpha_s = \mathbf{0}

等式两边与 αi\alpha_i 做内积, 得 ks(αi,αi)=0k_s (\alpha_i, \alpha_i) = 0 , 又 αi0\alpha_i \ne 0 , 则 (αi,αi)>0(\alpha_i, \alpha_i) > 0 , 故 k=0 (i=1,2,,s)k_- = 0 \ (i = 1, 2, \cdots , s) , 则 α1,α2,,αs\alpha_1, \alpha_2, \cdots , \alpha_s 线性无关s

定义4 欧式空间 VV 中有正交向量组构成的基称为 VV 的正交基, 若 VV 的一组正交基中的向量都是单位向量, 则称它为 VV 的标准正交基

若欧式空间 VV 维数为 mm , 则 VVmm 个向量 α1,α2,,αm\alpha_1, \alpha_2, \cdots , \alpha_mVV 的标准正交基的充要条件是

(αi,αj)={0,ij1,i=j , i,j=1,2,,m(\alpha_i, \alpha_j) = \begin{cases} 0, i \ne j \\ 1, i = j \end{cases} \ , \ i, j = 1, 2, \cdots , m

例如, RnR^n 中, 标准基 ε1,ε2,,εn\varepsilon_1, \varepsilon_2, \cdots , \varepsilon_n 就标准正交基

欧式空间标准正交基不是唯一的, 如 R3R^3 中标准基 ε1,ε2,ε3\varepsilon_1, \varepsilon_2, \varepsilon_3 和向量组

α1=(0,1,0) , α2=(12,0,12) , α3=(12,0,12)\alpha_1 = (0, 1, 0) \ , \ \alpha_2 = (\frac{1}{\sqrt{2}}, 0, \frac{1}{\sqrt{2}}) \ , \ \alpha_3 = (\frac{1}{\sqrt{2}}, 0, - \frac{1}{\sqrt{2}})

都是标准正交基

定义5 设 AAnn 阶矩阵, 若 ATA=EA^T A = E , 则称 AA 为一个正交矩阵

定理2 AA 是正交矩阵当且仅当 AA 的列向量是 RnR^n 的一组标准正交基

A=(α1,α2,,αn),按分块矩阵乘法有ATA=(α1,α2,,αn)T(α1,α2,,αn)=(α1Tα2TαnT)(α1,α2,,αn)=(α1Tα1α1Tα2α1Tαnα2Tα1α2Tα2α2TαnαnTα1αnTα2αnTαn) ATA=E当且仅当αiTαj=(αi,αj)={1,i=j0,ijA的列向量α1,α2,,αnRn的一个标准正交基\begin{aligned} & 设 A = (\alpha_1, \alpha_2, \cdots , \alpha_n) , 按分块矩阵乘法有 \\ & A^T A = (\alpha_1, \alpha_2, \cdots , \alpha_n)^T (\alpha_1, \alpha_2, \cdots , \alpha_n) \\ & = \begin{pmatrix} \alpha_1^T \\ \alpha_2^T \\ \vdots \\ \alpha_n^T \end{pmatrix} (\alpha_1, \alpha_2, \cdots , \alpha_n) = \begin{pmatrix} \alpha_1^T \alpha_1 & \alpha_1^T \alpha_2 & \cdots & \alpha_1^T \alpha_n \\ \alpha_2^T \alpha_1 & \alpha_2^T \alpha_2 & \cdots & \alpha_2^T \alpha_n \\ \vdots & \vdots & & \vdots \\ \alpha_n^T \alpha_1 & \alpha_n^T \alpha_2 & \cdots & \alpha_n^T \alpha_n \end{pmatrix} \\ & \ \\ & 则 A^T A = E 当且仅当 \\ & \alpha_i^T \alpha_j = (\alpha_i, \alpha_j) = \begin{cases} 1, i = j \\ 0, i \ne j \end{cases} \\ & 即 A 的列向量 \alpha_1, \alpha_2, \cdots , \alpha_n 是 R^n 的一个标准正交基 \end{aligned}

ATA=EA^T A = EAT=A1A^T = A^{-1} , 所有也有 AAT=EAA^T = E

类似的可证明 AA 是正交矩阵当且仅当 AA 的行向量是 RnR^n 的一组标准正交基

因此 , α1,α2,,αn\alpha_1, \alpha_2, \cdots , \alpha_nRnR^n 的标准正交基的充要条件是以 α1,α2,,αn\alpha_1, \alpha_2, \cdots , \alpha_n 为列向量构成的矩阵是一个正交矩阵

定理3 设 α1,α2,,αm\alpha_1, \alpha_2, \cdots , \alpha_m 是欧式空间 VV 的一组基, 则存在 VV 的一组标准正交基 β1,β2,,βm\beta_1, \beta_2, \cdots , \beta_m , 使 βk\beta_k 可由 α1,α2,,αk\alpha_1, \alpha_2, \cdots , \alpha_k 线性表示

证明

第一步: 正交化

γ1=α1,γ10再取γ2=α2=(α1,γ1)(γ1,γ1)γ1γ2可由α1,α2线性表示,α1,α2线性无关,γ20且有 (γ2,γ2)=(α2,γ1)(α2,γ1)(γ1,γ1)(γ1,γ1)=0即 γ1γ2 对于1<k<m,可在V中取到正交的非零向量γ1,γ2,,γk1,γi可由α1,α2,,αk线性表示α1,α2,,αk线性无关,γk0γ1,γ2,,γk1两两正交,(γk,γi)=(αk,αi)(αk,γi)(γi,γi)(γi,γi)=0 , i=1,2,,k1γ1,γ2,,γk仍两两正交由数学归纳法可知,V中存在一组正交基γ1,γ2,,γm,使γk可由α1,α2,,αk线性表示(k=1,2,,m)\begin{aligned} & 取 \gamma_1 = \alpha_1, 则 \gamma_1 \ne \mathbf{0} \\ & 再取 \gamma_2 = \alpha_2 = \frac{(\alpha_1, \gamma_1)}{(\gamma_1, \gamma_1)} \gamma_1 \\ & 则 \gamma_2 可由 \alpha_1, \alpha_2 线性表示, 又\alpha_1, \alpha_2线性无关, 则 \gamma_2 \ne \mathbf{0} \\ & 且有 \ (\gamma_2, \gamma_2) = (\alpha_2, \gamma_1) - \frac{(\alpha_2, \gamma_1)}{(\gamma_1, \gamma_1)} (\gamma_1, \gamma_1) = 0 \\ & 即 \ \gamma_1 \bot \gamma_2 \\ & \ \\ & 对于 1 < k < m, 可在V中取到正交的非零向量 \gamma_1, \gamma_2, \cdots, \gamma_{k - 1}, 且 \gamma_i 可由 \alpha_1, \alpha_2, \cdots, \alpha_k 线性表示 \\ & 又 \alpha_1, \alpha_2, \cdots, \alpha_k 线性无关, 则 \gamma_k \ne \mathbf{0} \\ & 又 \gamma_1, \gamma_2, \cdots, \gamma_{k - 1} 两两正交, 且 \\ & (\gamma_k, \gamma_i) = (\alpha_k, \alpha_i) - \frac{(\alpha_k, \gamma_i)}{(\gamma_i, \gamma_i)} (\gamma_i, \gamma_i) = 0 \ , \ i = 1, 2, \cdots , k - 1 \\ & 即 \gamma_1, \gamma_2, \cdots, \gamma_k 仍两两正交 \\ & \\ & 由数学归纳法可知, V中存在一组正交基 \gamma_1, \gamma_2, \cdots, \gamma_m, 使 \gamma_k 可由 \alpha_1, \alpha_2, \cdots, \alpha_k 线性表示 (k = 1, 2, \cdots , m) \end{aligned}

第二步: 单位化

γ1,γ2,,γm单位化,βk=1γkγk , k=1,2,,mβ1,β2,,βm为满足要求的标准正交基\begin{aligned} & 把 \gamma_1, \gamma_2, \cdots, \gamma_m 单位化, 令 \\ & \beta_k = \frac{1}{\parallel \gamma_k \parallel} \gamma_k \ , \ k = 1, 2, \cdots , m \\ & 则 \beta_1, \beta_2, \cdots , \beta_m 为满足要求的标准正交基 \end{aligned}

上述定理提供了通过 VV 的一组线性无关向量组构造 VV 的单位正交向量组的方法, 称为 施密特正交化过程

例 设 V=L(α1,α2,α3V = L(\alpha_1, \alpha_2, \alpha_3 , 其中

α1,(1,1,0,0) , α2=(1,0,1,0) , α3=(1,0,0,1)\alpha_1, (1, 1, 0, 0) \ , \ \alpha_2 = (1, 0, 1, 0) \ , \ \alpha_3 = (-1, 0, 0, 1)

试用施密特正交化过程求 VV 的一组标准正交基

令 A=(α1α2α3)=(11001101001)r(A)=3,α1,α2,α3线性无关,α1,α2,α3构成V的一组基 正交化:γ1=α1=(1,1,0,0)γ2=α2(α2,γ1)(γ1,γ1)γ1=(12,12,1,0)=12(1,1,2,0)γ3=α3(α3,γ1)(γ1,γ1)γ1(α3,γ2)(γ2,γ2)=(13,13,13,1)=13(1,1,1,3) 单位化:βk=γkγkβ1=(12,12,0,0)β2=(16,16,26,0)β3=(112,112,112,312)\begin{aligned} & 令 \ A = \begin{pmatrix} \alpha_1 \\ \alpha_2 \\ \alpha_3 \end{pmatrix} = \begin{pmatrix} 1 & 1 & 0 & 0 \\ 1 & - & 1 & 0 \\ -1 & 0 & 0 & 1 \end{pmatrix} \\ & r(A) = 3, \alpha_1, \alpha_2, \alpha_3 线性无关, 即 \alpha_1, \alpha_2, \alpha_3 构成 V 的一组基 \\ & \ \\ & 正交化: \\ & \gamma_1 = \alpha_1 = (1, 1, 0, 0) \\ & \gamma_2 = \alpha_2 - \frac{(\alpha_2, \gamma_1)}{(\gamma_1, \gamma_1)} \gamma_1 = (\frac{1}{2}, - \frac{1}{2}, 1, 0) = \frac{1}{2} (1, -1, 2, 0) \\ & \gamma_3 = \alpha_3 - \frac{(\alpha_3, \gamma_1)}{(\gamma_1, \gamma_1)} \gamma_1 - \frac{(\alpha_3, \gamma_2)}{(\gamma_2, \gamma_2)} = (-\frac{1}{3}, \frac{1}{3}, \frac{1}{3}, 1) = \frac{1}{3} (-1, 1, 1, 3) \\ & \ \\ & 单位化: \\ & \beta_k = \frac{\gamma_k}{\parallel \gamma_k \parallel} \\ & \beta_1 = (\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}}, 0, 0) \\ & \beta_2 = (\frac{1}{\sqrt{6}}, - \frac{1}{\sqrt{6}}, \frac{2}{\sqrt{6}}, 0) \\ & \beta_3 = (- \frac{1}{\sqrt{12}}, \frac{1}{\sqrt{12}}, \frac{1}{\sqrt{12}}, \frac{3}{\sqrt{12}}) \end{aligned}

定理4 由标准正交基到标准正交基的过渡矩阵是正交矩阵, 反之, 由标准正交基经过渡矩阵得到的基也是标准正交基

α1,α2,,αm\alpha_1, \alpha_2, \cdots, \alpha_mβ1,β2,,βm\beta_1, \beta_2, \cdots , \beta_mmm 维欧式空间 VV 的两组基, 其中 α1,α2,,αm\alpha_1, \alpha_2, \cdots, \alpha_m 是标准正交基, 且从 α1,α2,,αm\alpha_1, \alpha_2, \cdots, \alpha_mβ1,β2,,βm\beta_1, \beta_2, \cdots , \beta_m 的过渡矩阵 A=(aij)A = (a_{ij}) , 即

(β1,β2,,βm)=(α1,α2,,αm)(a11a12a1ma21a22a2mam1am2amm)(\beta_1, \beta_2, \cdots , \beta_m) = (\alpha_1, \alpha_2, \cdots, \alpha_m) \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1m} \\ a_{21} & a_{22} & \cdots & a_{2m} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mm} \end{pmatrix}

β1,β2,,βm\beta_1, \beta_2, \cdots , \beta_m 为标准正交基当且仅当

(βi,βj)=a1ia1j+a2ia2j++amiamj={1 , i=j0 , ij(\beta_i, \beta_j) = a_{1i}a_{1j} + a_{2i}a_{2j} + \cdots + a_{mi}a_{mj} = \begin{cases} & 1 \ , \ i = j \\ & 0 \ , \ i \ne j \end{cases}

上式等价于

ATA=EA^TA = E

AA 为正交矩阵

4 线性方程组

4.1 解线性方程组的消元法

4.1.1 线性方程组解的存在性

nn 个未知元, mm 个方程的线性方程组为

{a11x1+a12x2++a1nxn=b1a21x1+a21x2++a2nxn=b2am1x1+am2x2++amnxn=bm\begin{cases} a_{11} x_1 + a_{12} x_2 + \cdots + a_{1n} x_n = b_1 \\ a_{21} x_1 + a_{21} x_2 + \cdots + a_{2n} x_n = b_2 \\ \cdots \cdots \cdots \cdots \\ a_{m1} x_1 + a_{m2} x_2 + \cdots + a_{mn} x_n = b_m \end{cases}

A=(a11a12a1na21a22a2nam1am2amn) , X=(x1x2xn) , b=(b1b2bn)A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix} \ , \ X = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} \ , \ b = \begin{pmatrix} b_1 \\ b_2 \\ \vdots \\ b_n \end{pmatrix}

则方程组可写作

AX=bAX = b

又记

A=(a11a12a1nb1a21a22a2nb2am1am2amnbm)\overline{A} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ \vdots & \vdots & & \vdots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} & b_m \end{pmatrix}

AAA\overline{A} 分别称为方程组的系数矩阵和增广矩阵

将系数矩阵 AA 按列分块, 即

A=(α1,α2,,αn)A = (\alpha_1, \alpha_2, \cdots, \alpha_n)

其中 αj=(a1j,a2j,,amj)T (j=1,2,,n)\alpha_j = (a_{1j}, a_{2j}, \cdots , a_{mj})^T \ (j = 1, 2, \cdots , n) 为系数矩阵 AA 的第 jj 列, 则方程组又可写作

x1α1+x2α2++xnαn=bx_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_n \alpha_n = b

当向量 b0b \ne \mathbf{0} 时, 称 AX=bAX = b 为非齐次线性方程组; 而称 AX=0AX = \mathbf{0} 为齐次线性方程组, 它也称线性方程组 AX==bAX == b 的导出组

定义1 若线性方程组有解, 则称改方程组是相容的, 否则称为不相容的

线性方程组是否相容与它的系数矩阵 AA 和增广矩阵 A\overline{A} 的秩有关,

线性方程组 AX=bAX = b 相容性等价于 bb 能否用 AA 的列向量 α1,α2,,αn\alpha_1, \alpha_2, \cdots , \alpha_n 线性表示

bb 能由向量组 α1,α2,,αn\alpha_1, \alpha_2, \cdots , \alpha_n 线性表示, 则向量组 α1,α2,,αn,b\alpha_1, \alpha_2, \cdots , \alpha_n, b 与向量组 α1,α2,,αn\alpha_1, \alpha_2, \cdots , \alpha_n 有相同的秩. 又向量组的秩等同于以其为列向量的矩阵的秩, 则 α1,α2,,αn,b\alpha_1, \alpha_2, \cdots , \alpha_n, bα1,α2,,αn\alpha_1, \alpha_2, \cdots , \alpha_n 有相同分秩等价于 AAA\overline{A} 秩相等

定理1 线性方程组有解或相容充要条件是它的系数矩阵 AA 和增广矩阵 A\overline{A} 秩相等, 即 r(A)=r(A)r(A) = r(\overline{A})

线性方程组解存在且唯一的充要条件是 bb 能由系数矩阵 AA 的列向量组 α1,α2,,αn\alpha_1, \alpha_2, \cdots , \alpha_n 线性表示且表示方法唯一. 则 α1,α2,,αn\alpha_1, \alpha_2, \cdots , \alpha_n 线性无关, 即向量组 α1,α2,,αn\alpha_1, \alpha_2, \cdots , \alpha_n 的秩等于 nn

定理2 线性方程组存在唯一解的充要条件是它的系数矩阵 AA 与其增广矩阵 A\overline{A} 的秩都等于 nn , 即 r(A)=r(A)=nr(A) = r(\overline{A}) = n

4.1.2 消元法

定理3 设线性方程组 AX=bAX = b 的增广矩阵 A=(A,b)\overline{A} = (A, b) 经初等行变换后得到矩阵为 B=(B,d)\overline{B} = (B, d) , 则矩阵 B\overline{B} 所对应的线性方程组 BX=dBX = d 与愿方程组 AX=bAX = b 同解, 即它们有相同的解集

例 解线性方程组

{x1+x2+x3=1x1+2x15x3=22x1+3x24x3=3\begin{cases} x_1 + x_2 + x_3 = 1 \\ x_1 + 2x_1 - 5x_3 = 2 \\ 2x_1 + 3x_2 - 4x_3 = 3 \end{cases}

对方程组增广矩阵进行初等行变换

A=(111112522343)r3+(2)×r1r2+(1)×r1(111101610161)r3+(1)×r1r1+(1)×r2(107001610000)\overline{A} = \begin{pmatrix} 1 & 1 & 1 & 1 \\ 1 & 2 & -5 & 2 \\ 2 & 3 & -4 & 3 \end{pmatrix} \xrightarrow[r_3 + (-2) \times r_1]{r_2 + (-1) \times r_1} \begin{pmatrix} 1 & 1 & 1 & 1 \\ 0 & 1 & 6 & 1 \\ 0 & 1 & -6 & 1 \end{pmatrix} \xrightarrow[r_3 + (-1) \times r_1]{r_1 + (-1) \times r_2} \begin{pmatrix} 1 & 0 & 7 & 0 \\ 0 & 1 & -6 & 1 \\ 0 & 0 & 0 & 0 \end{pmatrix}

变换后对应阶梯线性方程组

{x1       +7x3=0       x26x3=1\begin{cases} x_1 \ \ \ \ \ \ \ + 7x_3 = 0 \\ \ \ \ \ \ \ \ x_2 - 6x_3 = 1 \end{cases}

它与原方程同解, 取 x3=kx_3 = k , 则 x1=7k,x2=1+6kx_1 = -7k, x_2 = 1 + 6k , 则原方程解为

{x1=7kx2=1+6kx3=k\begin{cases} x_1 = -7k \\ x_2 = 1 + 6k \\ x_3 = k \end{cases}

求解

{x1x2+5x3x4=0x1+x22x3+3x3=03x1x2+8x+3+X4=0x1+3x29x3+7x4=0\begin{cases} x_1 - x_2 + 5x_3 - x_4 = 0 \\ x_1 + x_2 - 2x_3 + 3x_3 = 0 \\ 3x_1 - x_2 + 8x+3 + X_4 = 0 \\ x_1 + 3x_2 - 9x_3 + 7x_4 = 0 \end{cases}

解 (变换系数矩阵)

A=(1151112331811397)(103210172200000000){x1+32x3+x4=0x272x3+2x4=0x3=k1,x4=k2{x1=32k1k2x2=72k12k2x3=k1x4=k2A = \begin{pmatrix} 1 & -1 & 5 & -1 \\ 1 & 1 & -2 & 3 \\ 3 & -1 & 8 & 1 \\ 1 & 3 & -9 & 7 \end{pmatrix} \xrightarrow[\cdots]{\cdots} \begin{pmatrix} 1 & 0 & \frac{3}{2} & 1 \\ 0 & 1 & - \frac{7}{2} & 2 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix} \\ \begin{cases} x_1 + \frac{3}{2} x_3 + x_4 = 0 \\ x_2 - \frac{7}{2} x_3 + 2x_4 = 0 \end{cases} \\ x_3 = k_1, x_4 = k_2 \Rightarrow \begin{cases} x_1 = - \frac{3}{2} k_1 - k_2 \\ x_2 = \frac{7}{2} k_1 - 2k_2 \\ x_3 = k_1 \\ x_4 = k_2 \end{cases}

上述方法本质为对线性方程组逐步消元, 称为高斯消元法

求解

{x1+x2+2x3+3x4=1x2+x34x4=1x1+2x2+3x34x4=42x1+3x2x3x4=6\begin{cases} x_1 + x_2 + 2x_3 + 3x_4 = 1 \\ x_2 + x_3 - 4x_4 = 1 \\ x_1 + 2x_2 + 3x_3 - 4x_4 = 4 \\ 2x_1 + 3x_2 - x_3 - x_4 = -6 \end{cases}

A=(11231011411231423116)(11231011410021300001)\overline{A} = \begin{pmatrix} 1 & 1 & 2 & 3 & 1 \\ 0 & 1 & 1 & -4 & 1 \\ 1 & 2 & 3 & -1 & 4 \\ 2 & 3 & -1 & -1 & -6 \end{pmatrix} \xrightarrow[\cdots]{\cdots} \begin{pmatrix} 1 & 1 & 2 & 3 & 1\\ 0 & 1 & 1 & -4 & 1 \\ 0 & 0 & 2 & 1 & 3 \\ 0 & 0 & 0 & 0 & 1 \end{pmatrix}

因为 r(A)=3,r(A)=4r(A)r(A) = 3, r(\overline{A}) = 4 \ne r(A) , 则原方程组无解

实际上上述矩阵最后一行对应方程为 0x1+0x2+0x3+0x4=10x_1 + 0x_2 + 0x_3 + 0x_4 = 1 , 故无解

4.2 齐次线性方程组解的结构

4.2.1 齐次线性方程组有非零解的条件

nn 元齐次方程组

AX=0AX = \mathbf{0}

其中 AAm×nm \times n 矩阵, 由于零向量总可以由任意向量组表示, 故齐次线性方程组总是相容的, 显然 X=0X = \mathbf{0} 为一个解(称为零解或平凡解)

将其写成向量形式

x1α1+x2α2++xnαn=0x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_n \alpha_n = \mathbf{0}

则下面四个命题等价

定理1 设 AAm×nm \times n 矩阵, 则为齐次线性方程组 AX=0AX = \mathbf{0} 有非零解地方充要条件是 r(A)<nr(A) < n

等价命题 nnnn 元齐次线性方程组 AX=0AX = \mathbf{0} 只有零解充要条件是 r(A)=nr(A) = n

推论1 设 AAm×nm \times n 矩阵, 则

判断 λ\lambda 为何值时, 下列齐次线性方程组有非零解, 只有零解

{x1+λx2+x3=0x1x2+x3=0λx1+x2+2x3=0\begin{cases} x_1 + \lambda x_2 + x_3 = 0 \\ x_1 - x_2 + x_3 = 0 \\ \lambda x_1 + x_2 + 2x_3 = 0 \end{cases}

解1

设系数矩阵为 AA

A=(1λ1111λ12)(1110λ+10002λ)A = \begin{pmatrix} 1 & \lambda & 1 \\ 1 & -1 & 1 \\ \lambda & 1 & 2 \end{pmatrix} \xrightarrow[\cdots]{\cdots} \begin{pmatrix} 1 & -1 & 1 \\ 0 & \lambda + 1 & 0 \\ 0 & 0 & 2 - \lambda \end{pmatrix}

则当 λ=2\lambda = 2λ=1\lambda = -1 时, A=0\left | A \right | = 0 , 方程组有非零解

λ2\lambda \ne 2λ1\lambda \ne -1 时, A0\left | A \right | \ne 0 , 方程组只有零解

4.2.2 齐次线性方程组解的结构

SSAX=0AX = \mathbf{0} 的解集, 则 SS 构成一个向量空间, 称之为齐次线性方程组的解空间, 该解空间的一组基, 称为该方程组的一个基础解系

齐次线性方程组的全部解都能由基础解系线性组合表示, 基础解系的线性组合也一定是解, 则只需求齐次线性方程组的一个基础解系 ξ1,ξ2,,ξt\xi_1, \xi_2, \cdots , \xi_t , 便可知道所有解

k1ξ1+k2ξ2++ktξt , k1,k2,,ktRk_1 \xi_1 + k_2 \xi_2 + \cdots + k_t \xi_t \ , \ k_1, k_2, \cdots , k_t \in R

定理2 设 nn 元齐次方程组 AX=0AX = \mathbf{0} 的系数矩阵 AA 的秩 r(A)=r<nr(A) = r < n , 则齐次线性方程组 AX=0AX = \mathbf{0} 的解空间是 nrn - r 维的 , 即 AX=0AX = \mathbf{0} 的基础解系中含有 nrn - r 个解向量

r(A)=r<n,则矩阵A至少存在一个r阶子式不为零,而所有的r+1阶子式均为零,不妨设左上角的r阶子式不为零,则初等行变换A(c11c12c1rc1,r+1c1n0c22c2rc2,r+1c2n00crrcr,r+1crn0000000000) 这里cii0 (iir),AX=0同解方程组如下{c11x1+c12x2++c1rxr+c1,r+1xr+1++c1nxn=0c22++c2rxr+c2,r+1xr+1++c2nxn=0crrxr+cr,r+1xr+1++crnxn=0 xr+1,xr+2,,xn移至方程组右边并逐步回代的方程组一般解{x1=d11xr+1+d12xr+2++d1,nrxnx2=d21xr+1+d22xr+2++d2,nrxnxr=dr1xr+1+dr2xr+2++dr,nrxn其中xr+1,xr+2,,xn为任意实数,称之为自由未知量 若取xr+1,xr+2,,xnnr组值:(xr+1xr+2xr+3xn)=(1000) , (0100) ,  , (0001)则可得齐次线性方程组AX=0nr个解向量ξ1=(d11,,dr1,1,0,,0)Tξ2=(d12,,dr2,0,1,,0)Tξnr=(d1,nr,,dr,nr,0,0,,1)T易得ξ1,ξ2,,ξnr线性无关\begin{aligned} & r(A) = r < n, 则矩阵A至少存在一个r阶子式不为零, 而所有的r + 1阶子式均为零, 不妨设左上角的r阶子式不为零, 则初等行变换A有 \\ & \begin{pmatrix} c_{11} & c_{12} & \cdots & c_{1r} & c_{1, r + 1} & \cdots & c_{1n} \\ 0 & c_{22} & \cdots & c_{2r} & c_{2, r + 1} & \cdots & c_{2n} \\ \vdots & \vdots & & \vdots & \vdots & & \vdots \\ 0 & 0 & \cdots & c_{rr} & c_{r, r + 1} & \cdots & c_{rn} \\ 0 & 0 & \cdots & 0 & 0 & \cdots & 0 \\ \vdots & \vdots & & \vdots & \vdots & & \vdots \\ 0 & 0 & \cdots & 0 & 0 & \cdots & 0 \end{pmatrix} \\ & \ \\ & 这里 c_{ii} \ne 0 \ (i \le i \le r), 则 AX = \mathbf{0} 同解方程组如下 \\ & \begin{cases} c_{11} x_1 + c_{12} x_2 + \cdots + c_{1r} x_r + c_{1, r + 1} x_{r + 1} + \cdots + c_{1n} x_n = 0 \\ c_{22} + \cdots + c_{2r} x_r + c_{2, r + 1} x_{r + 1} + \cdots + c_{2n} x_n = 0 \\ \cdots \cdots \cdots \cdots \\ c_{rr} x_r + c_{r, r + 1} x_{r + 1} + \cdots + c_{rn} x_n = 0 \end{cases} \\ & \ \\ & 将 x_{r + 1}, x_{r + 2}, \cdots , x_n 移至方程组右边并逐步回代的方程组一般解 \\ & \begin{cases} x_1 = d_{11} x_{r + 1} + d_{12} x_{r + 2} + \cdots + d_{1, n - r} x_n \\ x_2 = d_{21} x_{r + 1} + d_{22} x_{r + 2} + \cdots + d_{2, n - r} x_n \\ \cdots \cdots \cdots \cdots \\ x_r = d_{r1} x_{r + 1} + d_{r2} x_{r + 2} + \cdots + d_{r, n - r} x_n \end{cases} \\ & 其中 x_{r + 1}, x_{r + 2}, \cdots , x_n 为任意实数, 称之为自由未知量 \\ & \ \\ & 若取 x_{r + 1}, x_{r + 2}, \cdots , x_n 的 n - r 组值 : \\ & \begin{pmatrix} x_{r + 1} \\ x_{r + 2} \\ x_{r + 3} \\ \vdots \\ x_n \end{pmatrix} = \begin{pmatrix} 1 \\ 0 \\ 0 \\ \vdots \\ 0 \end{pmatrix} \ , \ \begin{pmatrix} 0 \\ 1 \\ 0 \\ \vdots \\ 0 \end{pmatrix} \ , \ \cdots \ , \ \begin{pmatrix} 0 \\ 0 \\ 0 \\ \vdots \\ 1 \end{pmatrix} \\ & 则可得齐次线性方程组 AX = \mathbf{0} 的 n - r 个解向量 \\ & \begin{matrix} \xi_1 = (d_{11}, \cdots , d_{r1}, 1, 0, \cdots , 0)^T \\ \xi_2 = (d_{12}, \cdots , d_{r2}, 0, 1, \cdots , 0)^T \\ \cdots \\ \xi_{n - r} = (d_{1, n - r}, \cdots , d_{r, n - r}, 0, 0, \cdots , 1)^T \end{matrix} \\ & 易得 \xi_1, \xi_2, \cdots , \xi_{n - r} 线性无关 \end{aligned}

下面证明齐次线性方程组 AX=0AX = \mathbf{0} 的每个解都可由 ξ1,ξ2,,ξnr\xi_1, \xi_2 , \cdots , \xi_{n - r} 线性表示

上式中,任取xr+1,xr+2,,xn的一组值k1,k2,,knr,的齐次线性方程组AX=0的解为{x1=k1d11+k2d12++knrd1,nrx2=k1d21+k2d22++knrd2,nrxr=k1dr1+k2dr2++knrdr,nrxr+1=k1xr+2=k2xn=knr 上式写成向量形式为X=(x1,x2,,xn)T=k1ξ1+k2ξ2++knrξnr所有ξ1,ξ2,,ξnr是齐次线性方程组AX=0的一组基,从而它的解空间是nr维的,而上式为齐次线性方程组通解\begin{aligned} & 上式中, 任取 x_{r + 1}, x_{r + 2}, \cdots , x_n 的一组值 k_1, k_2, \cdots , k_{n - r} , 的齐次线性方程组 AX = \mathbf{0} 的解为 \\ & \begin{cases} x_1 = k_1 d_{11} + k_2 d_{12} + \cdots + k_{n - r} d_{1, n - r} \\ x_2 = k_1 d_{21} + k_2 d_{22} + \cdots + k_{n - r} d_{2, n - r} \\ \cdots \cdots \cdots \cdots \\ x_r = k_1 d_{r1} + k_2 d_{r2} + \cdots + k_{n - r} d_{r, n - r} \\ x_{r + 1} = k_1 \\ x_{r + 2} = k_2 \\ \cdots \cdots \cdots \cdots \\ x_n = k_{n - r} \end{cases} \\ & \ \\ & 上式写成向量形式为 \\ & X = (x_1, x_2, \cdots , x_n)^T = k_1 \xi_1 + k_2 \xi_2 + \cdots + k_{n - r} \xi_{n - r} \\ & 所有 \xi_1, \xi_2, \cdots , \xi_{n - r} 是齐次线性方程组 AX = \mathbf{0} 的一组基, 从而它的解空间是 n - r 维的, 而上式为齐次线性方程组通解 \end{aligned}

求下列齐次线性方程组的一个基础解系并写出通解

{x1+2x2+2x3+x4=02x1+x22x32x4=0x1x24x33x4=0\begin{cases} x_1 + 2x_2 + 2x_3 + x_4 = 0 \\ 2x_1 + x_2 - 2x_3 - 2x_4 = 0 \\ x_1 - x_2 - 4x_3 - 3x_4 = 0 \end{cases}

A=(122121221143)(10253012430000)A = \begin{pmatrix} 1 & 2 & 2 & 1 \\ 2 & 1 & -2 & -2 \\ 1 & -1 & -4 & -3 \end{pmatrix} \xrightarrow[\cdots]{\cdots} \begin{pmatrix} 1 & 0 & -2 & - \frac{5}{3} \\ 0 & 1 & 2 & \frac{4}{3} \\ 0 & 0 & 0 & 0 \end{pmatrix}

则原方程组同解方程组为

{x12x353x4=0x2+2x3+43x4=0\begin{cases} x_1 - 2x_3 - \frac{5}{3} x_4 = 0 \\ x_2 + 2x_3 + \frac{4}{3} x_4 = 0 \end{cases}

上式中分别取 x3=1,x4=0x_3 = 1, x_4 = 0x3=0,x4=1x_3 = 0, x_4 = 1 , 得到基础解系 ξ1,ξ2\xi_1, \xi_2

ξ1=(2,2,1,0)T , ξ2=(53,43,0,1)T\xi_1 = (2, -2, 1, 0)^T \ , \ \xi_2 = (\frac{5}{3}, - \frac{4}{3}, 0, 1)^T

则原方程组通解为

X=(x1,x2,x3,x4)T=k1ξ1+k2ξ2X = (x_1, x_2, x_3, x_4)^T = k_1 \xi_1 + k_2 \xi_2

{x1=2k1+53k2x2=2k143k2x3=k1x4=k2 k1,k2R\begin{cases} x_1 = 2k_1 + \frac{5}{3} k_2 \\ x_2 = -2k_1 - \frac{4}{3} k_2 \\ x_3 = k_1 \\ x_4 = k_2 \end{cases} \\ \ \\ k_1, k_2 \in R

求齐次方程组 AX=0AX = \mathbf{0} 的通解, 其系数矩阵为

A=(112132122632457)A = \begin{pmatrix} 1 & 1 & -2 & 1 & 3 \\ 2 & -1 & 2 & 2 & 6 \\ 3 & 2 & -4 & -5 & -7 \end{pmatrix}

A(1121303600012816)=BA \xrightarrow[\cdots]{\cdots} \begin{pmatrix} 1 & 1 & -2 & 1 & 3 \\ 0 & -3 & 6 & 0 & 0 \\ 0 & -1 & 2 & -8 & -16 \end{pmatrix} = B

r(B)=3r(B) = 3 , 继续进行初等列变换, 将其第 1,21, 244 列构成的矩阵化为单位矩阵

B(100010120000012)B \xrightarrow[\cdots]{\cdots} \begin{pmatrix} 1 & 0 & 0 & 0 & 1 \\ 0 & 1 & -2 & 0 & 0 \\ 0 & 0 & 0 & 1 & 2 \end{pmatrix}

则齐次线性原方程组同解线性方程组为

{x1+x5=0x22x3=0x4+2x5=0\begin{cases} x_1 + x_5 = 0 \\ x_2 - 2x_3 = 0 \\ x_4 + 2x_5 = 0 \end{cases}

x3,x5x_3, x_5 诶自由未知量, 分别取 x3=1,x5=0x_3 = 1, x_5 = 0x3=0,x5=1x_3 = 0, x_5 = 1 , 的基础解系 ξ1,ξ2\xi_1, \xi_2 , 其中

ξ1=(0,2,1,0,0)T , ξ2=(1,0,0,2,1)T\xi_1 = (0, 2, 1, 0, 0)^T \ , \ \xi_2 = (-1, 0, 0, -2, 1)^T

而原方程组通解为

X=k1ξ1+k2ξ2X = k_1 \xi_1 + k_2 \xi_2

{x1=k2x2=2k1x3=k1x4=2k2x5=k2\begin{cases} x_1 = -k_2 \\ x_2 = 2k_1 \\ x_3 = k_1 \\ x_4 = -2k_2 \\ x_5 = k_2 \end{cases}

求解

{x1+x2+x3+4x43x5=0x1x2+3x32x4x5=02x1+x2+3x3+5x45x5=03x1+x2+5x3+6x47x5=0\begin{cases} x_1 + x_2 + x_3 + 4x_4 - 3x_5 = 0 \\ x_1 - x_2 + 3x_3 - 2x_4 - x_5 = 0 \\ 2x_1 + x_2 + 3x_3 + 5x_4 - 5x_5 = 0 \\ 3x_1 + x_2 + 5x_3 + 6x_4 - 7x_5 = 0 \end{cases}

方程个数 m=4m = 4 , 自变量个数 n=5n = 5 , m<nm < n , 则方程有无穷多组解

A(10212011310000000000) {x1=2x3x4+2x5x2=x33x4+x5 , 其中x3,x4,x5为自由自变量 分别令(x3x4x5)取值(100) , (010) , (001) ξ1=(2,1,1,0,0)T , ξ2=(1,3,0,1,0)T , ξ3=(2,1,0,0,1)T X=k1ξ1+k2ξ2+k3ξ3A \xrightarrow[\cdots]{\cdots} \begin{pmatrix} 1 & 0 & 2 & 1 & -2 \\ 0 & 1 & -1 & 3 & -1 \\ 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 \end{pmatrix} \\ \ \\ \begin{cases} x_1 = -2x_3 - x_4 + 2x_5 \\ x_2 = x_3 - 3x_4 + x_5 \end{cases} \ , \ 其中 x_3, x_4, x_5 为自由自变量 \\ \ \\ 分别令 \begin{pmatrix} x_3 \\ x_4 \\ x_5 \end{pmatrix} 取值 \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix} \ , \ \begin{pmatrix} 0 \\ 1 \\ 0 \end{pmatrix} \ , \ \begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix} \\ \ \\ \xi_1 = (-2, 1, 1, 0, 0)^T \ , \ \xi_2 = (-1, -3, 0, 1, 0)^T \ , \ \xi_3 = (2, 1, 0, 0, 1)^T \\ \ \\ X = k_1 \xi_1 + k_2 \xi_2 + k_3 \xi_3

A=(aij)m×nA = (a_{ij})_{m \times n} , B=(sjk)n×lB = (s_{jk})_{n \times l} , AB=OAB = O , 证明 r(A)+r(B)nr(A) + r(B) \le n

证明

B=(β1,β2,,βl)B = (\beta_1, \beta_2, \cdots , \beta_l) , 则从 AB=OAB = OAB=(Aβ1,Aβ2,,Aβl)AB = (A \beta_1, A \beta_2, \cdots , A \beta_l) 可知

Aβk=0 , (k=1,2,,l)A \beta_k = \mathbf{0} \ , \ (k = 1, 2, \cdots , l)

BBll 个列向量都是齐次方程 AX=OAX = O 的解, 由于 AX=OAX = O 的基础解系含 nr(A)n - r(A) 的向量 ξ1,ξ2,,ξnr(A)\xi_1, \xi_2, \cdots , \xi_{n - r(A)} , 即方程解空间 VV 的维数为 nr(A)n - r(A) , 则 β1,β2,,βlV\beta_1, \beta_2, \cdots , \beta_l \in V 时, 次组向量的秩不会大于解空间 VV 的维数, 即 r(B)nr(A)r(B) \le n - r(A) , 则 r(A)+r(B)nr(A) + r(B) \le n

4.3 非齐次线性方程组解的结构

非齐次线性方程组 AX=bAX = b , 其中 AAm×nm \times n 矩阵, b0b \ne 0mm 维列向量, 则 AX=bAX = b 有解的充要条件是系数矩阵 AA 和增广矩阵 A\overline{A} 的秩相等, 且这两个矩阵的秩都等于未知数个数 nnAX=bAX = b 有唯一解

由上一节知, AX=0AX = \mathbf{0} 的解关于线性运算封闭, 对于非齐次线性方程组, 这个性质不再保持. 设 X1,X2X_1, X_2 是非齐次线性方程组 AX=bAX = b 的解, 因为:

A(X!+X2)=AX1+AX2=b+b=2bBA(X_! + X_2) = AX_1 + AX_2 = b + b = 2b \ne B

X1,X2X_1, X_2 不再是 AX=bAX = b 的解

定理1 设 η1,η2\eta_1, \eta_2 是非齐次线性方程组 AX=bAX = b 的两个解, ξ\xi 是其导出组 AX=0AX = \mathbf{0} 的解, 则下面四个命题等价

A(η1η2)=Aη1Aη2=bb=0A(η1+ξ)=Aη1+Aξ=b+0=bA(\eta_1 - \eta_2) = A \eta_1 - A \eta_2 = b - b = \mathbf{0} \\ A(\eta_1 + \xi) = A \eta_1 + A \xi = b + \mathbf{0} = b

定理2 若 η0\eta_0 是非齐次线性方程组 AX=bAX = b 的一个特解, 则非齐次线性方程组 AX=bAX = b 的任一解 η\eta 都可表为

η=η0+ξ\eta = \eta_0 + \xi

的形式, 其中 ξ\xi 是导出组 AX=0AX = \mathbf{0} 的解

η=η0+(ηη0)\eta = \eta_0 + (\eta - \eta_0)

由定理1, ξ=ηη0\xi = \eta - \eta_0 是导出组的一个解, 且 η=η0+ξ\eta = \eta_0 + \xi

据定理2, 求出 AX=bAX = b 的全部解, 只需找到一个特解以及它的导出组的全部解, 导出组解可由基础解系表示

因此, 只需求 AX=bAX = b 的特解和导出组 AX=0AX = \mathbf{0} 的基础解系表示它的全部解.

η0\eta_0 是非齐次线性方程组的一个特解, ξ1,ξ2,,ξnr\xi_1, \xi_2, \cdots , \xi_{n - r} 是其导出组的一个基础解系, 则非齐次线性方程组 AX=bAX = b 的任一解 η\eta 都可表为

η=η0+k1η1+k2η2++knrηnr\eta = \eta_0 + k_1 \eta_1 + k_2 \eta_2 + \cdots + k_{n - r} \eta_{n - r}

其中 k1,k2,,knrk_1, k_2, \cdots , k_{n - r} 为任意实数, r=r(A)<nr = r(A) < n

下列方程是否有解, 若有解, 求解

{2x+3y+z=1x+y+2z=24x+7y+7z=1x+3y+8z=4\begin{cases} & 2x + 3y + z = 1 \\ & x + y + 2z = 2 \\ & 4x + 7y + 7z = -1 \\ & x + 3y + 8z = -4 \end{cases}

先写出线性方程组的增广矩阵, 并初等变换

A=(2311112247711384)(1075015300000000)\overline{A} = \begin{pmatrix} 2 & 3 & 1 & 1 \\ 1 & 1 & -2 & 2 \\ 4 & 7 & 7 & -1 \\ 1 & 3 & 8 & -4 \end{pmatrix} \xrightarrow[\cdots]{\cdots} \begin{pmatrix} 1 & 0 & -7 & 5 \\ 0 & 1 & 5 & 3 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix}

r(A)=r(A)=2<3r(\overline{A}) = r(A) = 2 < 3 , 故原方程有无穷组解

{x17x3=5x2+5x3=3\begin{cases} & x_1 - 7x_3 = 5 \\ & x_2 + 5x_3 = -3 \end{cases}

得到通解表达式

{x1=5+7kx2=35kx3=k\begin{cases} & x_1 = 5 + 7k \\ & x_2 = -3 - 5k \\ & x_3 = k \end{cases}

写成向量形式

(x1x2x3)=(530)+k(751)\begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} = \begin{pmatrix} 5 \\ -3 \\ 0 \end{pmatrix} + k \begin{pmatrix} 7 \\ -5 \\ 1 \end{pmatrix}

其中 η0=(5,3,0)T\eta_0 = (5, -3, 0)^T 为原线性方程组的一个特解, 而 η0=(7,5,1)T\eta_0 = (7, -5, 1)^T 为导出组的一个基础解系

设线性方程组 AX=bAX = b 的增广矩阵为

(13121431254123111441613921)\begin{pmatrix} 1 & 3 & -1 & 2 & -1 & | & -4 \\ -3 & 1 & 2 & -5 & -4 & | & -1 \\ 2 & -3 & -1 & -1 & 1 & | & 4 \\ -4 & 16 & 1 & 3 & -9 & | & -21 \end{pmatrix}

求此线性方程组通解

A(1002722201044100141333000000)\overline{A} \xrightarrow[\cdots]{\cdots} \begin{pmatrix} 1 & 0 & 0 & -27 & -22 & 2 \\ 0 & 1 & 0 & -4 & -4 & -1 \\ 0 & 0 & 1 & -41 & -33 & 3 \\ 0 & 0 & 0 & 0 & 0 & 0 \end{pmatrix}

显然 r(A)=r(A)=3<5r(\overline{A}) = r(A) = 3 < 5 , 故线性方程组有无穷多组解

{x127x422x5=2x24x44x5=1x341x433x5=3\begin{cases} & x_1 - 27x_4 - 22x_5 = 2 \\ & x_2 - 4x_4 - 4x_5 = -1 \\ & x_3 - 41x_4 - 33x_5 = 3 \end{cases}

x4=x5=0x_4 = x_5 = 0 , 的原线性方程组的一个特解 η0=(2,1,3,0,0)T\eta_0 = (2, -1, 3, 0, 0)^T , 令右端向量为零, 分别取 (x4,x5)=(1,0),(0,1)(x_4, x_5) = (1, 0), (0, 1) , 可得导出组的一个基础解系

ξ1=(27,4,41,1,0)T , ξ2=(22,4,33,0,1)T\xi_1 = (27, 4, 41, 1, 0)^T \ , \ \xi_2 = (22, 4, 33, 0, 1)^T

故原方程的通解为 X=η0+k1ξ1+k2ξ2X = \eta_0 + k_1 \xi_1 + k_2 \xi_2

设四元非齐次线性方程组系数矩阵秩为 33 , 已知 η1,η2,η3\eta_1, \eta_2, \eta_3 是它的三个解向量, 且 η1=(2,3,4,5)T,η2+η3=(1,2,3,4)T\eta_1 = (2, 3, 4, 5)^T , \eta_2 + \eta_3 = (1, 2, 3, 4)^T , 求该线性方程组的通解

设四元非齐次线性方程组为 AX=bAX = b , 则 Aη1=b,Aη2=b,Aη3=bA \eta_1 = b, A \eta_2 = b, A \eta_3 = b , 又

A12(η2+η3)=12Aη2+12Aη3=12b+12b=bA \cdot \frac{1}{2} (\eta_2 + \eta_3) = \frac{1}{2} A \eta_2 + \frac{1}{2} A \eta_3 = \frac{1}{2} b + \frac{1}{2} b = b

12(η2+η3)\frac{1}{2} (\eta_2 + \eta_3) 也是线性方程组 AX=bAX = b 的解, 因此 η112(η2+η3)\eta_1 - \frac{1}{2} (\eta_2 + \eta_3) 是它导出组 AX=0AX = \mathbf{0} 的解

因为 r(A)=3r(A) = 3 , 故 AX=0AX = \mathbf{0} 的基础解系中只含有一个向量, 又

η112(η2+η3)=(32,2,52,3)T0\eta_1 - \frac{1}{2} (\eta_2 + \eta_3) = (\frac{3}{2}, 2, \frac{5}{2}, 3)^T \ne \mathbf{0}

η112(η2+η3)\eta_1 - \frac{1}{2} (\eta_2 + \eta_3)AX=0AX = \mathbf{0} 的基础解系, 故 AX=bAX = b 的通解为

X=η1+k(η1=12(η1+η2))=(2,3,4,5)T+k(32,2,52,3)TX = \eta_1 + k (\eta_1 = \frac{1}{2} (\eta_1 + \eta_2)) = (2, 3, 4, 5)^T + k(\frac{3}{2}, 2, \frac{5}{2}, 3)^T

4.4 矩阵的特征值与特征向量

4.4.1 特征值与特征向量

定义1 设 AAnn 阶方阵, 若存在一个数 λ\lambdann 维非零向量 α\alpha , 使

Aα=λαA \alpha = \lambda \alpha

成立, 则称数 λ\lambda 为方阵 AA 的特征值, 非零向量 α\alpha 称为 AA 对应于特征值 λ\lambda 的特征向量

α,β\alpha, \beta 是矩阵 AA 的属于特征值 λ\lambda 的特征向量, 则 kαk \alphak1α+k2βk_1 \alpha + k_2 \beta 也为 AA 的属于特征值 λ\lambda 的特征向量

nn 阶矩阵 AA 的特征值为 λ\lambda , 非零向量 α\alphaAA 的属于特征值 λ\lambda 的特征向量, 则

(λEA)α=0(\lambda E - A) \alpha = \mathbf{0}

因此, 特征向量 α\alpha 是齐次线性方程组

(λEA)X=0(\lambda E - A) X = \mathbf{0}

的非零解. 又方程组有非零解充要条件是其系数矩阵为降秩矩阵, 即系数矩阵的行列式

λEA=0\left | \lambda E - A \right | = 0

因此, λ\lambda 是方阵 AA 的特征值的充要条件是 λEA=0\left | \lambda E - A \right | = 0

定义2 设 AAnn 阶方阵, 称 f(λ)=λEAf(\lambda) = \left | \lambda E - A \right |AA 的特征多项式, 方程 λEA=0\left | \lambda E - A \right | = 0 称为 AA 的特征方程

由此可知, 矩阵 AA 的特征值就是其特征方程的根. 复数范围内, nn 阶矩阵 AAnn 个特征值

矩阵 AA 的属于特征值 λ\lambda 的特征向量就是齐次线性方程组 (λEA)=0(\lambda E - A) = \mathbf{0} 的非零解

注意: 由于 λEA=(1)nλEA\left | \lambda E - A \right | = (-1)^n \left | \lambda E - A \right | , 故又是也称 λEA\left | \lambda E - A \right |AA 的特征方程

相应的, 矩阵 AA 的属于特征值 λ\lambda 的特征向量是齐次线性方程组 (λEA)X=0(\lambda E - A) X = \mathbf{0} 的非零解

求解一个矩阵 AA 的特征值与特征方程的步骤为

  1. 求出 AA 的特征方程 λEA=0\left | \lambda E - A \right | = 0 的全部根, 即得 AA 的全部特征值 λ1,λ2,,λn\lambda_1, \lambda_2, \cdots, \lambda_n
  2. 将每个特征值 λi\lambda_i 代入齐次线性方程组 (λiEA)X=0(\lambda_i E - A) X = \mathbf{0} , 求出基础解系, 就是 AA 对应于特征值 λi\lambda_i 的特征向量, 基础解系的线性组合(零向量除外)就是 AA 对应于 λi\lambda_i 的全部特征向量

例 求矩阵

A=(110430102)A = \begin{pmatrix} -1 & 1 & 0 \\ -4 & 3 & 0 \\ 1 & 0 & 2 \end{pmatrix}

的特征值和相应的特征向量

AA 的特征方程为

λEA=λ+1104λ3010λ2=(λ2)(λ1)2=0\left | \lambda E - A \right | = \begin{vmatrix} \lambda + 1 & -1 & 0 \\ 4 & \lambda - 3 & 0 \\ -1 & 0 & \lambda - 2 \end{vmatrix} = (\lambda - 2)(\lambda - 1)^2 = 0

AA 的特征值分别为 λ1=2,λ2=λ3=1\lambda_1 = 2, \lambda_2 = \lambda_3 = 1

λ=2\lambda = 2

λEA=2EA=(310410100)(100010000)\lambda E - A = 2E - A = \begin{pmatrix} 3 & -1 & 0 \\ 4 & -1 & 0 \\ -1 & 0 & 0 \end{pmatrix} \xrightarrow[\cdots]{\cdots} \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{pmatrix}

因此, 齐次线性方程组 (2EA)X=0(2E - A)X = \mathbf{0} 的一个基础解系为 ξ1=(0,0,1)T\xi_1 = (0, 0, 1)^T , 从而矩阵 AA 的属于特征值 λ=2\lambda = 2 的一个特征向量为 ξ1=(0,0,1)T\xi_1 = (0, 0, 1)^T

λ=1\lambda = 1

EA=(210420101)(101012000)E - A = \begin{pmatrix} 2 & -1 & 0 \\ 4 & -2 & 0 \\ -1 & 0 & -1 \end{pmatrix} \xrightarrow[\cdots]{\cdots} \begin{pmatrix} 1 & 0 & 1 \\ 0 & 1 & 2 \\ 0 & 0 & 0 \end{pmatrix}

因此, 齐次线性方程组 (EA)X=0(E - A)X = \mathbf{0} 的一个基础解系为 ξ2=(1,2,1)T\xi_2 = (-1, -2, 1)^T , 从而矩阵 AA 的属于特征值 λ=1\lambda = 1 的一个特征向量为 ξ2=(1,2,1)T\xi_2 = (-1, -2, 1)^T

综上, k1ξ1,k2ξ2k_1 \xi_1, k_2 \xi_2 分别为 AA 的属于特征值 2211 的特征向量

例 求矩阵

A=(1111111111111111)A = \begin{pmatrix} 1 & 1 & 1 & 1 \\ 1 & 1 & 1 & 1 \\ 1 & 1 & 1 & 1 \\ 1 & 1 & 1 & 1 \end{pmatrix}

的特征值和特征向量

AA 的特征多项式

f(λ)=λEA=λ11111λ11111λ11111λ1f(\lambda) = \left | \lambda E - A \right | = \begin{vmatrix} \lambda - 1 & -1 & -1 & -1 \\ -1 & \lambda - 1 & -1 & -1 \\ -1 & -1 & \lambda - 1 & -1 \\ -1 & -1 & -1 & \lambda - 1 \end{vmatrix}

把行列式二三四列加到一列, 得

f(λ)=λ4111λ4λ111λ41λ11λ411λ1=(λ4)11111λ11111λ11111λ1=(λ4)11110λ0000λ0000λ=λ3(λ4)\begin{aligned} & f(\lambda) = \begin{vmatrix} \lambda - 4 & -1 & -1 & -1 \\ \lambda - 4 & \lambda - 1 & -1 & -1 \\ \lambda - 4 & -1 & \lambda - 1 & -1 \\ \lambda - 4 & -1 & -1 & \lambda - 1 \end{vmatrix} \\ & = (\lambda - 4) \begin{vmatrix} 1 & -1 & -1 & -1 \\ 1 & \lambda - 1 & -1 & -1 \\ 1 & -1 & \lambda - 1 & -1 \\ 1 & -1 & -1 & \lambda - 1 \end{vmatrix} \\ & =(\lambda - 4) \begin{vmatrix} 1 & -1 & -1 & -1 \\ 0 & \lambda & 0 & 0 \\ 0 & 0 & \lambda & 0 \\ 0 & 0 & 0 & \lambda \end{vmatrix} \\ & =\lambda^3 (\lambda - 4) \end{aligned}

AA 的特征值为 λ1=λ2=λ3=0,λ4=4\lambda_1 = \lambda_2 = \lambda_3 = 0, \lambda_4 = 4

λ=0\lambda = 0 时, (λEA)X=AX=0(\lambda E - A) X = -AX = \mathbf{0} 的基础解系为方程

x1+x2+x3+x4=0x_1 + x_2 + x_3 + x_4 = 0

的基础解系, 即 ξ1=(1,1,0,0)T,ξ2=(1,0,1,0)T,ξ3=(1,0,0,1)T\xi_1 = (-1, -1, 0, 0)^T, \xi_2 = (-1, 0, 1, 0)^T, \xi_3 = (-1, 0, 0, 1)^T

AA 的输入 λ=0\lambda = 0 的特征向量为全体 k1ξ1+k2ξ2+k3ξ3k_1 \xi_1 + k_2 \xi_2 + k_3 \xi_3

λ=4\lambda = 4

4EA=(3111131111311113)(1001010100110000)4E - A = \begin{pmatrix} 3 & -1 & -1 & -1 \\ -1 & 3 & -1 & -1 \\ -1 & -1 & 3 & -1 \\ -1 & -1 & -1 & 3 \end{pmatrix} \xrightarrow[]{} \begin{pmatrix} 1 & 0 & 0 & -1 \\ 0 & 1 & 0 & -1 \\ 0 & 0 & 1 & -1 \\ 0 & 0 & 0 & 0 \end{pmatrix}

因此, 齐次线性方程组 (4EA)X=0(4E - A)X = \mathbf{0} 的一个基础解系为 ξ4=(1,1,1,1)T\xi_4 = (1, 1, 1, 1)^T , 而 k4ξ4k_4 \xi_4AA 的属于 λ=4\lambda = 4 的全部特征向量

4.4.2 特征值与特征向量的性质

性质1 nn 阶矩阵 AA 与它的转置矩阵 ATA^T 有相同的特征值

λEAT=(λEA)T=λEA\left | \lambda E - A^T \right | = \left | (\lambda E - A)^T \right | = \left | \lambda E - A \right |

ATA^TAA 有相同的特征多项式

性质2 设 A=(aij)A = (a_{ij})nn 阶矩阵, 则

f(λ)=λEA=λa11a12a1na21λa22a2nan1an2λannλn(a11+a22++ann)λn1++(1)nA\begin{aligned} & f(\lambda) = \left | \lambda E - A \right | = \\ & \begin{vmatrix} \lambda - a_{11} & -a_{12} & \cdots & -a_{1n} \\ -a_{21} & \lambda - a_{22} & \cdots & -a_{2n} \\ \vdots & \vdots & & \vdots \\ -a_{n1} & -a_{n2} & \cdots & \lambda - a_{nn} \end{vmatrix} \\ & \lambda^n - (a_{11} + a_{22} + \cdots + a_{nn}) \lambda^{n - 1} + \cdots + (-1)^n \left | A \right | \end{aligned}

λ1,λ2,,λn\lambda_1, \lambda_2, \cdots, \lambda_nAAnn 个特征值, 则由 nn 次代数方程组的跟据系数关系知

其中 AA 的主对角线元素之和 a11+a22++anna_{11} + a_{22} + \cdots + a_{nn} 称为矩阵 AA 的迹, 记作 tr(A)tr(A)

由性质2可知, 若 AA 可逆, 则 AA 的特征值都不等于零, 而 AA 是奇异矩阵时, AA 至少有一个零特征值

性质3 设 λ\lambda 是矩阵 AA 的特征值, α\alphaAA 的属于特征值 λ\lambda 的特征向量, 则

而且, α\alpha 仍是 kA,Am,A1kA, A^m, A^{-1} 分别属于特征值 kλ,λm,λ1k \lambda, \lambda^m, \lambda^{-1} 的特征向量

证明 3

Aα=λαA \alpha = \lambda \alpha , 由 λ0\lambda \ne 0

λ=A1λα , A1α=1λα\lambda = A^{-1} \lambda \alpha \ , \ A^{-1} \alpha = \frac{1}{\lambda} \alpha

1λ\frac{1}{\lambda}A1A^{-1} 的特征值, 同时 α\alphaA1A^{-1} 的输入 1λ\frac{1}{\lambda} 的特征向量

例 设三阶矩阵 AA 的特征值为 1,1,21, -1, 2 , AA^*AA 的伴随矩阵, 求 A+3A2E\left | A^* + 3A - 2E \right |

因为 AA 的特征值全不为零, 则 AA 可逆. 由 AA=AEA^* A = \left | A \right | E 以及 A=λ1λ2λ3=2\left | A \right | = \lambda_1 \lambda_2 \lambda_3 = -2 知, A=2A1A^* = -2 A^{-1} . 所以, 令

B=A+3A2E=2A1+3A2EB = A^* + 3A - 2E = -2A^{-1} + 3A - 2E

BB 有特征值 1,3,3-1, -3, 3 (一般地, 当 AA 有特征值 λ\lambda 时, aA+bEaA + bE 有特征值 aλ+ba \lambda + b), 从而

A+3A2E=B=(1)(3)3=9\left | A^* + 3A - 2E \right | = \left | B \right | = (-1) \cdot (-3) \cdot 3 = 9

性质4 nn 阶矩阵 AA 的互不相同的特征值 λ1,λ2,,λn\lambda_1, \lambda_2, \cdots , \lambda_n 对应的特征向量 α1,α2,,αn\alpha_1, \alpha_2, \cdots , \alpha_n 线性无关

证 数学归纳法

已知 Aαi=λiαi (i=1,2,,m)A \alpha_i = \lambda_i \alpha_i \ (i = 1, 2, \cdots , m)

m=1m = 1 时, α10\alpha_1 \ne \mathbf{0} , 结论成立

假设 m1m - 1 时结论成立

设有常数 k1.k2.,kmk_1. k_2. \cdots , k_m , 使

k1α1+k2α2++km1αm1+kmαm=0k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_{m - 1} \alpha_{m - 1} + k_m \alpha_m = \mathbf{0}

用矩阵 AA 左乘上式

k1Aα1+k2Aα2++km1Aαm1+kmAαm=0k_1 A \alpha_1 + k_2 A \alpha_2 + \cdots + k_{m - 1} A \alpha_{m - 1} + k_m A \alpha_m = \mathbf{0}

代入 Aαi=λiαi (i=1,2,,m)A \alpha_i = \lambda_i \alpha_i \ (i = 1, 2, \cdots , m)

k1λ1α1+k2λ2+α2++km1λm1αm1+kmλmαmk_1 \lambda_1 \alpha_1 + k_2 \lambda_2 + \alpha_2 + \cdots + k_{m - 1} \lambda_{m - 1} \alpha_{m - 1} + k_m \lambda_m \alpha_m

上式减去 λm\lambda_m 倍一式, 消去 αm\alpha_m , 得

k1(λ1λm)α1+k2(λ2λm)α2++km1(λm1λm)αm1=0k_1 (\lambda_1 - \lambda_m) \alpha_1 + k_2 (\lambda_2 - \lambda_m) \alpha_2 + \cdots + k_{m - 1} (\lambda_{m - 1} - \lambda_m) \alpha_{m - 1} = \mathbf{0}

假设 m1m - 1 时成立, 即 α1,α2,,αm1\alpha_1, \alpha_2, \cdots , \alpha_{m - 1} 线性无关, 则

ki(λiλm)=0 (i=1,2,,m1)k_i (\lambda_i - \lambda_m) = 0 \ (i = 1, 2, \cdots , m - 1)

因为 λ1,λ2,,λm\lambda_1, \lambda_2, \cdots , \lambda_m 互不相同, 则

ki=0 (i=1,2,,m1)k_i = 0 \ (i = 1, 2, \cdots , m - 1)

代入一式得 kmαm=0k_m \alpha_m = \mathbf{0} , 而 αm0\alpha_m \ne \mathbf{0} , 则 km=0k_m = 0 , 同理

k1=k2==km=0k_1 = k_2 = \cdots = k_m = 0

α1,α2,,αm\alpha_1, \alpha_2, \cdots , \alpha_m 线性无关, 证毕

4.5 矩阵的相似对角化

4.5.1 相似矩阵的概念和性质

定义1 设 A,BA, B 都是 nn 阶矩阵, 若存在可逆矩阵 PP , 使

P1AP=BP^{-1}AP = B

则称 BBAA 的相似矩阵, 并称矩阵 AABB 相似, 记作 ABA \sim B

矩阵的相似关系是一种等价关系, 满足

证明第三个

AB,BCA \sim B, B \sim C , 则分别存在可逆矩阵 P,QP, Q , 使

P1AP=B , Q1BQ=CP^{-1}AP = B \ , \ Q^{-1}BQ = C

C=Q1(P1AP)Q=(Q1P1)A(PQ)=(PQ)1A(PQ)C = Q^{-1}(P^{-1}AP)Q = (Q^{-1}P^{-1})A(PQ) = (PQ)^{-1}A(PQ)

ACA \sim C

例 设矩阵 A=(3151) , B=(4002)A = \begin{pmatrix} 3 & 1 \\ 5 & -1 \end{pmatrix} \ , \ B = \begin{pmatrix} 4 & 0 \\ 0 & -2 \end{pmatrix} , 试严重存在可逆矩阵 P=(1115)P = \begin{pmatrix} 1 & 1 \\ 1 & -5 \end{pmatrix} , 使 ABA \sim B

易证 PP 可逆, 且 P1=(56161616)P^{-1} = \begin{pmatrix} \frac{5}{6} & \frac{1}{6} \\ \frac{1}{6} & -\frac{1}{6} \end{pmatrix} , 由

P1AP=15(5111)(3151)(1115)=(4002)=BP^{-1}AP = \frac{1}{5} \begin{pmatrix} 5 & 1 \\ 1 & -1 \end{pmatrix} \begin{pmatrix} 3 & 1 \\ 5 & -1 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 1 & -5 \end{pmatrix} = \begin{pmatrix} 4 & 0 \\ 0 & -2 \end{pmatrix} = B

ABA \sim B

性质1 若 ABA \sim B , 则 r(A)=r(B)r(A) = r(B) , 即相似矩阵有相同的秩

ABA \sim B , 则 AB(等价)A \approx B (等价) , 故 r(A)=r(B)r(A) = r(B)

性质2 相似矩阵行列式相等

P1AP=P1AP=P1PA=P1PA=EA=A\left | P^{-1}AP \right | = \left | P^{-1} \right | \left | A \right | \left | P \right | = \left | P^{-1} \right | \left | P \right | \left | A \right | \\ = \left | P^{-1}P \right | \left | A \right | = \left | E \right | \left | A \right | = \left | A \right |

性质3 相似矩阵具有相同和可逆性, 当他们可逆时, 他们的逆矩阵也相似

A,BA, B 相似且都可逆, 则存在非奇异矩阵 PP , 使

P1AP=BP^{-1}AP = B

于是

B1=P1A1PB^{-1} = P^{-1}A^{-1}P

A1,B1A^{-1}, B^{-1} 相似

性质4 若 ABA \sim B , 则 A.BA. B 存在相同的特征多项式, 从而欧相同的特征值

λEB=λEP1AP=P1(λEA)P=P1λEAP=λEA\left | \lambda E - B \right | = \left | \lambda E - P^{-1}AP \right | = \left | P^{-1}(\lambda E - A)P \right | = \left | P^{-1} \right | \left | \lambda E - A \right | \left | P \right | = \left | \lambda E - A \right |

A,BA, B 有相同的特征多项式, 均为 f(λ)=(λ4)(λ+2)f(\lambda) = (\lambda - 4)(\lambda + 2) , 故 A,BA, B 有相同的特征值 λ1=4,λ2=2\lambda_1 = 4, \lambda_2 = -2

4.5.2 矩阵与对角矩阵形似的条件

规定对角矩阵

Λ=(λ1λ2λn)\Lambda = \begin{pmatrix} \lambda_1 \\ & \lambda_2 \\ & & \ddots \\ & & & \lambda_n \end{pmatrix}

可简记为 Λ=diag(λ1,λ2,,λn)\Lambda = diag(\lambda_1, \lambda_2, \cdots , \lambda_n)

定理1 nn 阶矩阵 AA 与对角矩阵 Λ=diag(λ1,λ2,,λn)\Lambda = diag(\lambda_1, \lambda_2, \cdots , \lambda_n) 相似的充要条件为矩阵 AAnn 个线性无关的特征向量

必要性 若 AAΛ\Lambda 相似, 则存在可逆矩阵 PP 使得

P1AP=ΛP^{-1}AP = \Lambda

P=(p1,p2,,pn)P = (p_1, p_2, \cdots , p_n) , 其中 pi (i=1,2,,n)p_i \ (i = 1, 2, \cdots , n)PP 的列向量, 则由 AP=PΛAP = P\Lambda

A(p1,p2,,pn)=(p1,p2,,pn)(λ1λ2λn)A(p_1, p_2, \cdots , p_n) = (p_1, p_2, \cdots , p_n)\begin{pmatrix} \lambda_1 \\ & \lambda_2 \\ & & \ddots \\ & & & \lambda_n \end{pmatrix}

Api=λipi (i=1,2,,n)Ap_i = \lambda_i p_i \ (i = 1, 2, \cdots , n)

因为 PP 可逆, 则 P0\left | P \right | \ne 0 , 从而 pi (i=1,2,,n)p_i \ (i = 1, 2, \cdots , n) 都是非零向量. 因此 p1,p2,,pnp_1, p_2, \cdots , p_n 都是 AA 的特征向量, 且它们线性无关

充分性 设 p1,p2,,pnp_1, p_2, \cdots , p_nAAnn 个线性无关的特征向量, 它们所对应的特征值为 λ1,λ2,,λn\lambda_1, \lambda_2, \cdots , \lambda_n , 则有

Api=λipi/(i=1,2,,n)Ap_i = \lambda_i p_i / (i = 1, 2, \cdots , n)

P=(p1,p2,,pn)P = (p_1, p-2, \cdots , p_n) , 易知 PP 可逆, 且

AP=A(p1,p2,,pn)=(Ap1,Ap2,,Apn) =(λ1p1,λ2p2,,λnpn) =(p1,p2,,pn)(λ1λ2λn)AP = A(p_1, p_2, \cdots , p_n) = (Ap_1, Ap_2, \cdots , Ap_n) \\ \ \\ = (\lambda_1 p_1, \lambda_2 p_2 , \cdots , \lambda_n p_n) \\ \ \\ = (p_1, p_2, \cdots , p_n) \begin{pmatrix} \lambda_1 \\ & \lambda_2 \\ & & \ddots \\ & & & \lambda_n \end{pmatrix}

推论1 若 nn 阶矩阵 AA bb 个互异的特征值 λ1,λ2,,λn\lambda_1, \lambda_2, \cdots , \lambda_n , 则 AA 与对角矩阵 Λ=diag(λ1,λ2,,λn)\Lambda = diag(\lambda_1, \lambda_2, \cdots , \lambda_n) 相似

对于 nn 阶方阵 AA , 若存在可逆矩阵 PP , 使 P1AP=ΛP_{-1}AP = \Lambda 为对角矩阵, 则称方阵 AA 可对角化

给定 nn 阶方阵 AA , 其特征方程式 f(λ)=(λλ1)n1(λλs)nsf(\lambda) = (\lambda - \lambda_1)^{n_1} \cdots (\lambda - \lambda_s)^{n_s} , 其中 n1+n2++ns=nn_1 + n_2 + \cdots + n_s = n , 则有

定理2 nn 阶矩阵 AA 可对角化的充要条件是对应于 AA 的每个特征值的线性无关的特征向量的个数恰好等于该特征值的重数, 即设 λi\lambda_i 为矩阵 AAnin_i 重特征值, 则 AAΛ\Lambda 相似, 当且仅当

r(λiEA)=nni (i=1,2,,s)r(\lambda_i E - A) = n - n_i \ (i = 1, 2, \cdots , s)

例如, 矩阵 (111000000)\begin{pmatrix} 1 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix} 的特征值为 1,0,01, 0, 0 , 对于 λ2=0,n2=3,n=3\lambda_2 = 0, n_2 = 3, n = 3 , 有

r(λ2EA)=1=nn2r(\lambda_2 E - A) = 1 = n - n_2

aa 能对角化

又如, 矩阵 (110001000)\begin{pmatrix} 1 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{pmatrix} 的特征值也为 1,0,01, 0, 0 , 对 λ2=0,n2=2,n=3\lambda_2 = 0, n_2 = 2, n = 3 , 有

r(λ2EA)=2nn2r(\lambda_2 E - A) = 2 \ne n - n_2

BB 不能对角化

4.5.3 矩阵对角化的步骤

定理1证明过程即为矩阵对角化的步骤, 当方阵 AA 可对角化时

(λiEA)X=0(\lambda_i E - A)X = \mathbf{0}

的基础解系由 nin_i 个向量 ξ11,ξ12,,ξ1ni\xi_{11}, \xi_{12}, \cdots , \xi_{1n_i} 构成, 即 ξ11,ξ12,,ξ1ni\xi_{11}, \xi_{12}, \cdots , \xi_{1n_i}λi\lambda_i 对应的特征向量

P1AP=ΛP^{-1}AP = \Lambda

例 设 A=(00111a100)A = \begin{pmatrix} 0 & 0 & 1 \\ 1 & 1 & a \\ 1 & 0 & 0 \end{pmatrix} , aa 为何值时, 矩阵 AA 能对角化

λEA=(λ011λ1a10λ)=(λ1)2(λ+1)\left | \lambda E - A \right | = \begin{pmatrix} \lambda & 0 & -1 \\ -1 & \lambda - 1 & -a \\ -1 & 0 & \lambda \end{pmatrix} = (\lambda - 1)^2 (\lambda + 1)

λ1=1,λ2=λ3=1\lambda_1 = -1, \lambda_2 = \lambda_3 = 1 , 要使矩阵 AA 能对角化, 由定理2: 对应单根 λ1=1\lambda_1 = -1 , 可求得线性无关的特征向量恰有 11 个; 对应重根 λ2=λ3=1\lambda_2 = \lambda_3 = 1 , 应有 22 个线性无关的特征向量, 即方程

EAX=0\left | E - A \right | X = 0

有两个线性无关的解, 即系数矩阵 EAE - A 的秩

r(EA)=1r(E - A) = 1

EA=(10110a101)(10100a+1000)E - A = \begin{pmatrix} 1 & 0 & -1 \\ -1 & 0 & -a \\ -1 & 0 & 1 \end{pmatrix} \xrightarrow[]{} \begin{pmatrix} 1 & 0 & -1 \\ 0 & 0 & a + 1 \\ 0 & 0 & 0 \end{pmatrix}

要使 r=1r = 1 , 则 a+1=0a + 1 = 0 , 即 a=1a = -1

因此, a=1a = -1 时, 矩阵 AA 能对角化

例 给定矩阵

A=(122224242)A = \begin{pmatrix} 1 & -2 & 2 \\ -2 & -2 & 4 \\ 2 & 4 & -2 \end{pmatrix}

判断 AA 能否化为对角矩阵; 求可逆矩阵 PP 和对角矩阵 Λ\Lambda , 使 P1AP=ΛP^{-1}AP = \Lambda ; 求 An (n2)A^n \ (n \ge 2)

λEA=(λ1222λ+2424λ+2)=(λ2)2(λ+7)=0\left | \lambda E - A \right | = \begin{pmatrix} \lambda - 1 & 2 & -2 \\ 2 & \lambda + 2 & 4 \\ -2 & -4 & \lambda + 2 \end{pmatrix} = (\lambda - 2)^2(\lambda + 7) = 0

得特征值 λ1=λ2=2,λ3=7\lambda_1 = \lambda_2 = 2, \lambda_3 = -7 , 对应 λ1,λ2\lambda_1, \lambda_2 为二重特征值, 可验证 r(λ1EA)=1r(\lambda_1 E - A) = 1 , 故得齐次线性方程组

(λ1EA)X=0(\lambda_1 E - A)X = \mathbf{0}

的基础解系有两个线性无关的解, 又 λ3=7\lambda_3 = -7 时, 可知 r(λ3EA)=2r(\lambda_3 E - A) = 2 , 则

(λ3EA)X=0(\lambda_3 E - A)X = \mathbf{0}

的基础解系只有一个向量, 故矩阵 AA 有三个线性无关的特征向量, 从而 AA 可以对角化

从上式中分别求出基础解系

p1=(110),p2=(201)p3=(122)p_1 = \begin{pmatrix} -1 \\ 1 \\ 0 \end{pmatrix} , p_2 = \begin{pmatrix} 2 \\ 0 \\ 1 \end{pmatrix} \\ p_3 = \begin{pmatrix} 1 \\ 2 \\ -2 \end{pmatrix}

P=(p1,p2,p3)=(221102012) , Λ=(227)P = (p_1, p_2, p_3) = \begin{pmatrix} -2 & 2 & 1 \\ 1 & 0 & 2 \\ 0 & 1 & -2 \end{pmatrix} \ , \ \Lambda = \begin{pmatrix} 2 \\ & 2 \\ & & -7 \end{pmatrix} , 则有

P1AP=ΛP^{-1}AP = \Lambda

此时 P1=19(254245122)P^{-1} = \frac{1}{9} \begin{pmatrix} -2 & 5 & 4 \\ 2 & 4 & 5 \\ 1 & 2 & -2 \end{pmatrix}

P1AP=ΛP^{-1}AP = \LambdaA=PΛP1A = P\Lambda P^{-1} , 从而

A2=AA=(PΛP1)(PΛP1)=PΛ2P1An=AAA=PΛnP1=(221102012)(227)n[19(254245122)]=19(221102012)(2n2n(7)n)(254245122)=19(2n+12n+1(7)n2n02(7)n02n(2)(7)n)(254245122)=19(2n+3+(7)n2n+1+2(7)n2n+12(7)n2n+1+2(7)n52n+4(7)n2n+24(7)n2n+12(7)n2n+24(7)n52n+4(7)n)A^2 = A \cdot A = (P\Lambda P^{-1})(P\Lambda P^{-1}) = P \Lambda^2 P^{-1} \\ A^n = A \cdot A \cdot \cdots \cdot A = P \Lambda^n P^{-1} \\ = \begin{pmatrix} -2 & 2 & 1 \\ 1 & 0 & 2 \\ 0 & 1 & -2 \end{pmatrix} \begin{pmatrix} 2 \\ & 2 \\ & & -7\end{pmatrix}^n [\frac{1}{9} \begin{pmatrix} -2 & 5 & 4 \\ 2 & 4 & 5 \\ 1 & 2 & -2 \end{pmatrix}] \\ = \frac{1}{9} \begin{pmatrix} -2 & 2 & 1 \\ 1 & 0 & 2 \\ 0 & 1 & -2 \end{pmatrix} \begin{pmatrix} 2^n \\ & 2^n \\ & & (-7)^n \end{pmatrix} \begin{pmatrix} -2 & 5 & 4 \\ 2 & 4 & 5 \\ 1 & 2 & -2 \end{pmatrix} \\ = \frac{1}{9} \begin{pmatrix} -2^{n + 1} & 2^{n + 1} & (-7)^n \\ 2^n & 0 & 2(-7)^n \\ 0 & 2^n & (-2)(-7)^n \end{pmatrix} \begin{pmatrix} -2 & 5 & 4 \\ 2 & 4 & 5 \\ 1 & 2 & -2 \end{pmatrix} \\ = \frac{1}{9} \begin{pmatrix} 2^{n + 3} + (-7)^n & -2^{n + 1} + 2(-7)^n & 2^{n + 1} - 2(-7)^n \\ -2^{n + 1} + 2(-7)^n & 5 \cdot 2^n + 4(-7)^n & 2^{n + 2} - 4(-7)^n \\ 2^{n + 1} - 2(-7)^n & 2^{n + 2} - 4(-7)^n & 5 \cdot 2^n + 4(-7)^n \end{pmatrix}

5 二次型

5.1 二次型及其标准形

5.1.1 二次型的矩阵表示

定义1 关于 nn 个变量 x1,x2,,xnx_1, x_2, \cdots , x_n 的二次其次式

f(x1,x2,.xn)=a11x12+2a12x1x2++2a1nx1xn+a22x22+2a23x2x3++2a2nx2xn++annxn2f(x_1, x_2, \cdots . x_n) = a_{11} x_1^2 + 2a_{12} x_1 x_2 + \cdots + 2a_{1n} x_1 x_n + a_{22} x_2^2 + \\ 2a_{23} x_2 x_3 + \cdots + 2a_{2n} x_2 x_n + \cdots + a_{nn} x_n^2

称为一个 nn 元二次型(简称为二次型). 当二次型系数 aij (i,j=1,2,,n)a_{ij} \ (i, j = 1, 2, \cdots , n) 为实数(复数)时, 称此二次型为实(复)二次型

aij=aji (i<j>)a_{ij} = a_{ji} \ (i < j>) , 将上式变形

f(x1,x2,.xn)=a11x12+2a12x1x2++2a1nx1xn+a22x22+2a23x2x3++2a2nx2xn++annxn2=j=1na1jx1xj+j=1na2jx2xj++j=1nanjxnxj=i=1nj=1naijxixj(i,j=1naijxixj)f(x_1, x_2, \cdots . x_n) = a_{11} x_1^2 + 2a_{12} x_1 x_2 + \cdots + 2a_{1n} x_1 x_n + a_{22} x_2^2 + \\ 2a_{23} x_2 x_3 + \cdots + 2a_{2n} x_2 x_n + \cdots + a_{nn} x_n^2 \\ = \sum_{j = 1}^n a_{1j} x_1 x_j + \sum_{j = 1}^n a_{2j} x_2 x_j + \cdots + \sum_{j = 1}^n a_{nj} x_n x_j \\ = \sum_{i = 1}^n \sum_{j = 1}^n a_{ij} x_i x_j (或 \sum_{i, j = 1}^n a_{ij} x_i x_j)

A=(a11a12a1na21a22a2nan1an2ann),X=(x1x2xn)A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{pmatrix} , X = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}

则上述二次型可用矩阵乘法表示为

f(x1,x2,,xn)=i=1nj=1naijxixj=XTBXf(x_1, x_2, \cdots , x_n) = \sum_{i = 1}^n \sum_{j = 1}^n a_{ij} x_i x_j = X^TBX

其中矩阵 AA 称为二次型的矩阵, 它的秩也称为二次型的秩, 若 r(A)=nr(A) = n , 则称二次型是满秩的

显然二次型的的矩阵 AA 为对称矩阵 (aij=ajia_{ij} = a_{ji}) , 它的元素 aija_{ij} 恰为二次型 f(x1,x2,,xn)f(x_1, x_2, \cdots , x_n)xixjx_i x_j 系数的一半; 而 aiia_{ii}xi2x_i^2 项的系数, 从而还可知

f(x1,x2,,xn)=XTAX=XTBXf(x_1, x_2, \cdots , x_n) = X^TAX = X^TBX

其中 AT=A,BT=BA^T = A, B^T = B , 则 A=BA = B, 从而二次型 f(x1,x2,,xn)f(x_1, x_2, \cdots , x_n) 与它的矩阵是一一对应的

例 求二次型 f(x1,x2,x3)=x124x1x2+2x1x32x22+6x32f(x_1, x_2, x_3) = x_1^2 - 4x_1x_2 + 2x_1x_3 - 2x_2^2 + 6x_3^2 的秩

f(x1,x2,x3)=x122x1x2+x1x32x2x12x22+0x2x3+x3x1+0x3x2+6x32f(x_1, x_2, x_3) = x_1^2 - 2x_1x_2 + x_1x_3 - 2x_2x_1 - 2x_2^2 + 0x_2x_3 + x_3x_1 + 0x_3x_2 + 6x_3^2

A=(121220106)(1210250017)A = \begin{pmatrix} 1 & -2 & 1 \\ -2 & -2 & 0 \\ 1 & 0 & 6 \end{pmatrix} \rightarrow \begin{pmatrix} 1 & -2 & 1 \\ 0 & 2 & 5 \\ 0 & 0 & 17 \end{pmatrix}

r(A)=3r(A) = 3 , 则二次型的秩为 33

定义2 只含平方项的二次型 f(x1,x2,,xn)=i=1nλixi2f(x_1, x_2, \cdots , x_n) = \sum_{i = 1}^n \lambda_i x_i^2 称为标准型

标准型的矩阵为对角矩阵

5.1.2 二次型的变换与矩阵的合同

nn 元二次型 f(x1,x2,,xn)=XTAXf(x_1, x_2, \cdots , x_n) = X^TAX , CC 是满秩的 nn 阶方阵, 做线性变换

X=CYX = CY

其中 Y=(y1,y2,,yn)TY = (y_1, y_2, \cdots , y_n)^T , 则原二次型将变为关于新变量 y1,y2,,yny_1, y_2, \cdots , y_n 的二次型, 且二次型的矩阵为

B=CTACB = C^TAC

X=CYX = CY 代入二次型 XTAXX^TAX , 即有

f=XTAX=(YTCT)A(CY)=CTACf = X^TAX = (Y^TC^T)A(CY) = C^TAC

B=CTACB = C^TAC 为对称矩阵, 故 f=YT(CTAC)Yf = Y^T(C^TAC)Y 是一个关于变量 y1,y2,,yny_1, y_2, \cdots , y_n 的二次型

定义3 对于连个矩阵 AABB , 若存在满秩矩阵 PP , 使 PTAP=BP^TAP = B , 则称矩阵 AABB 合同, 记作 ABA \simeq B

可验证矩阵之间的合同关系具有以下性质

由性质3可知, 对二次型做满秩线性变换后, 所得新的二次型的矩阵与原二次型的矩阵有合同关系, 变换前后的矩阵关系如下所示

XTAX经满秩线性变换X=PYYTBY                                           A                                                      BX^TAX \xrightarrow[]{经满秩线性变换 X = PY} Y^TBY \\ \updownarrow \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \updownarrow \\ A \xrightarrow[]{\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ } B

由于矩阵 AA 左乘或右乘一个满秩矩阵, 其秩不变, 因此二次型在满秩线性变换中其秩不变

5.1.3 二次型的标准型

如果满秩线性变换 X=CYX = CY 将二次型 XTAXX^TAX 化成了标准二次型 i=1nλiyi2\sum_{i = 1}^n \lambda_i y_i^2 , 则称 i=1nλiyi2\sum_{i = 1}^n \lambda_i y_i^2 为二次型 XTAXX^TAX 的一个标准型

5.2 正交变换法化二次型为标准型

如果二次型满秩线性变换 X=CYX = CY 中, 矩阵 CC 为正交矩阵, 则称这个变换为正交变换

5.2.1 实对称矩阵的对角化

定理1 实对称矩阵的特征值都是实数

证 设 λ\lambda 为实对称矩阵 AA 的特征特质, XX 为对应的特征向量, 则

AX=λX , X0AX = \lambda X \ , \ X \ne \mathbf{0}

X\overline{X} 表示将向量 XX 所有分量换乘共轭复数后得到的向量, 称之为 XX 的共轭向量, 上式两边同时取共轭, 则

AX=λX , X0A \overline{X} = \overline{\lambda} \overline{X} \ , \ X \ne \mathbf{0}

上式两边同时去转置, 又矩阵 AA 的对称性可得

XTA=λXT\overline{X}^TA = \overline{\lambda} \overline{X}^T

因此

XTAX=λXTX\overline{X}^TAX = \overline{\lambda} \overline{X}^TX

又由第一个式子得

XTAX=XT(λX)=λXTX\overline{X}^TAX = \overline{X}^T (\lambda X) = \lambda \overline{X}^TX

所以

(λλ)XTX=0(\lambda - \overline{\lambda}) \overline{X}^TX = 0

因为 X0X \ne \mathbf{0} , 故 λ=λ\lambda = \overline{\lambda} , 即 λ\lambda 为实数

定理2 实对称矩阵的不同的特征值对应的特征向量必正交

证 设 λ1,λ2\lambda_1, \lambda_2 是实对称矩阵 AA 的两个不同的特征值, X1,X2X_1, X_2 为对应的特征向量, 则

AX1=λ1X1 , AX2=λ2X2AX_1 = \lambda_1 X_1 \ , \ AX_2 = \lambda_2 X_2

AT=AA^T = A , 则

λ2X1TX2=X1TAX2=(AX1)TX2=(λ1X1)TX2=λ1X1TX2\lambda_2 X_1^T X_2 = X_1^T A X_2 = (AX_1)^T X_2 = (\lambda_1 X_1)^T X_2 = \lambda_1 X_1^T X_2

从而 (lambda1λ2)X1TX2=0(|lambda_1 - \lambda_2)X_1^T X_2 = 0 , 又 λ1λ2\lambda_1 \ne \lambda_2 , 故 X1TX2=0X_1^T X_2 = 0 , 即 X1,X2X_1 , X_2 正交

定理3 若实数 λ\lambda 为实对称方阵 AA 的特征方程的 kk 重根, 则矩阵 AA 对应于 λ\lambda 的线性无关的实特征向量的最大个数恰为 kk

定理4 设 AAnn 阶实对称矩阵, 则一定存在正交矩阵 QQ , 使 QTAQQ^TAQ 为对角矩阵, 且此对角矩阵的对角元恰为矩阵 AAnn 个特征值(重数计算在内)

证 设实对称矩阵 AA 的特征值为 λ1λ2λn\lambda_1 \le \lambda_2 \le \cdots \le \lambda_n (重数计算在内), 则由定理3, 对于 AA 的某个 kk 重特征值 λ=λi+1=λi+2==λi+k\lambda = \lambda_{i + 1} = \lambda_{i + 2} = \cdots = \lambda_{i + k} , 恰有 kk 个线性无关的实特征向量, 将它们正交化, 所得的 kk 正交向量仍是对应于特征值 kk 的特征向量. 又由定理2, 矩阵 AA 不同的特征值对应的特征向量必正交. 则对应于矩阵 AAnn 个特征值 λ1,λ2,,λn\lambda_1, \lambda_2, \cdots , \lambda_n , 可得到 nn 个两两相交的特征向量. 将其单位化得 nn 个两两相交的单位化特征向量 η1.η2,,ηn\eta_1. \eta_2, \cdots , \eta_n , 且

Aηi=λiηi , i=1,2,,nA \eta_i = \lambda_i \eta_i \ , \ i = 1, 2, \cdots , n

ηi\eta_i 作为列向量构造矩阵 Q=(η1,η2,,ηn)Q = (\eta_1, \eta_2, \cdots , \eta_n) , 则 QQ 正交, 即有 QT=Q1Q^T = Q^{-1}

A=diag(λ1,λ2,,λn)=(λ1λ2λn)A = diag(\lambda_1, \lambda_2, \cdots , \lambda_n) = \begin{pmatrix} \lambda_1 \\ & \lambda_2 \\ & & \ddots \\ & & & \lambda_n \end{pmatrix}

AQ=(Aη1,Aη2,,Aηn)=(λ1η1,λ2η2,,λnηn)=(η1,η2,,ηn)(λ1λ2λn)=QAAQ = (A \eta_1, A \eta_2, \cdots , A \eta_n) = (\lambda_1 \eta_1, \lambda_2 \eta_2, \cdots , \lambda_n \eta_n) \\ = (\eta_1, \eta_2, \cdots , \eta_n) \begin{pmatrix} \lambda_1 \\ & \lambda_2 \\ & & \ddots \\ & & & \lambda_n \end{pmatrix} \\ = QA

从而得 Q1AQ=ΛQ^{-1}AQ = \Lambda 为对角矩阵, 且 Λ\Lambda 的对角元恰为矩阵 AAnn 个特征值

定理5 任意一个实二次型 f=XTAX=i=1nj=1naijxixj (aij=aij,i,j=1,2,,n)f = X^TAX = \sum_{i = 1}^n \sum_{j = 1}^n a_{ij} x_i x_j \ (a_{ij} = a_{ij}, i, j = 1, 2, \cdots , n) 都可经过正交变换化为标准型, 即存在正交变换 X=QYX = QY , 使得

f=i=1nλiyi2=λ1y12+λ2y22++λnyn2f = \sum_{i = 1}^n \lambda_i y_i^2 = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \cdots + \lambda_n y_n^2

其中 λ1,λ2,,λn\lambda_1, \lambda_2, \cdots , \lambda_n 为二次型的矩阵 AA 的特征值, Y=(y1,y2,,yn)T,X=(x1,x2,,xn)TY = (y_1, y_2, \cdots , y_n)^T , X = (x_1, x_2, \cdots , x_n)^T

5.2.2 正交变换法化二次型为标准型

利用正交变换法化二次型为标准型的步骤如下

  1. 写出 nn 元二次型所对应的 nn 阶矩阵 AA , 并求出 AA 的全部特征值 λ1,λ2,,λn\lambda_1, \lambda_2, \cdots , \lambda_n (重数计算在内)
  2. 找出对应于各特征值的特征向量, 当 λi\lambda_ikik_i 重特征值时, 必须找出属于 λi\lambda_ikik_i 个线性无关的特征向量 (即找出 (AλiE)X=0(A - \lambda_i E)X = \mathbf{0} 的一个基础解系), 并用施密特正交法将其正交化
  3. 将上述 nn 个特征向量单位化后记作 η1,η2,,ηn\eta_1, \eta_2, \cdots , \eta_n , 并记矩阵 Q=(η1,η2,,ηn)Q = (\eta_1, \eta_2, \cdots , \eta_n) , 则 X=QYX = QY 为所求的正交变换, 且 ff 的标准型为

f=λ1y12+λ2y22++λnyn2f = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \cdots + \lambda_n y_n^2

例 利用正交变换法化二次型 f=x12++4x224x1x2+4x1x38x1x3f = x_1^2 ++ 4x_2^2 - 4x_1x_2 + 4x_1x_3 - 8x_1x_3 为标准型

二次型矩阵 A=(122244244)A = \begin{pmatrix} 1 & -2 & 2 \\ -2 & 4 & -4 \\ 2 & -4 & 4 \end{pmatrix} , 矩阵 AA 的特征多项式为

AλE=(1λ2224λ4244λ)=λ2(λ9)\left | A - \lambda E \right | = \begin{pmatrix} 1- \lambda & -2 & 2 \\ -2 & 4 - \lambda & -4 \\ 2 & -4 & 4 - \lambda \end{pmatrix} = - \lambda^2 (\lambda - 9)

因此, 矩阵 AA 的特征值为 λ1=9,λ2=λ3=0\lambda_1 = 9, \lambda_2 = \lambda_3 = 0

对于 λ1=9\lambda_1 = 9 , 由于

Aλ1E=(822254245)(201011000)A - \lambda_1 E = \begin{pmatrix} -8 & -2 & 2 \\ -2 & -5 & -4 \\ 2 & -4 & -5 \end{pmatrix} \xRightarrow[\cdots]{\cdots} \begin{pmatrix} 2 & 0 & -1 \\ 0 & 1 & 1 \\ 0 & 0 & 0 \end{pmatrix}

则齐次线性方程组 (Aλ1E)X=0(A - \lambda_1 E)X = \mathbf{0} 的基础解系为 ξ1=(1,2,2)T\xi_1 = (1, -2, 2)^T , 从而获得 AA 的属于特征值 λ1=9\lambda_1 = 9 的特征向量 ξ1=(1,2,2)T\xi_1 = (1, -2, 2)^T

对于 λ2=λ3=0\lambda_2 = \lambda_3 = 0 , 由于

Aλ2E=(122244244)(122000000)A - \lambda_2 E = \begin{pmatrix} 1 & -2 & 2 \\ -2 & 4 & -4 \\ 2 & -4 & 4 \end{pmatrix} \xRightarrow[]{} \begin{pmatrix} 1 & -2 & 2 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix}

通过求齐次线性方程组 (Aλ2E)X=0(A - \lambda_2 E)X = \mathbf{0} 的基础解系并将其正交化, 可得 AA 的属于特征值 λ2=λ3=0\lambda_2 = \lambda_3 = 0 的两个相互正交的特征向量 ξ1=(0,1,1)T,ξ1=(4,1,1)T\xi_1 = (0, 1, 1)^T , \xi_1 = (4, 1, -1)^T

将上述三个两两正交的特征向量 ξ1,ξ2,ξ3\xi_1, \xi_2, \xi_3 正交化, 得

η1=(13,23,23)T,η2=(0,12,12)T,η3=(432,132,132)T\eta_1 = (\frac{1}{3}, - \frac{2}{3}, \frac{2}{3})^T , \eta_2 = (0, \frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}})^T , \eta_3 = (\frac{4}{3 \sqrt{2}}, \frac{1}{3 \sqrt{2}}, - \frac{1}{3 \sqrt{2}})^T

则在正交变换

(x1x2x3)=(13043223121322312132)(y1y2y3)\begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} = \begin{pmatrix} \frac{1}{3} & 0 & \frac{4}{3 \sqrt{2}} \\ - \frac{2}{3} & \frac{1}{\sqrt{2}} & \frac{1}{3 \sqrt{2}} \\ \frac{2}{3} & \frac{1}{\sqrt{2}} & - \frac{1}{3 \sqrt{2}} \end{pmatrix} \begin{pmatrix} y_1 \\ y_2 \\ y_3 \end{pmatrix}

下, 二次型的标准型为 f=9y12f = 9y_1^2

5.2.3 正交变换法化二次型为标准型在几何方面的应用

下面讨论如何识别三元二次方程表示的曲面形状, 设 X=(x,y,z)TX = (x, y, z)^T , 则二元二次型 XTAXX^TAX 可视为几何空间向量 α\alpha 的函数, 其中 α\alpha 在标准基 ε1,ε2,ε3\varepsilon_1, \varepsilon_2, \varepsilon_3 写的坐标便是 XX . 做满秩线性变换 X=CYX = CY , 所得新的二次型 YTCTACYY^TC^TACY 就是关于 α\alpha 在另一组基 η1,η2,η3\eta_1, \eta_2, \eta_3 下的坐标 (x,y,z)(x', y', z') 的二次齐次式, 其中 Y=(x,y,z)T,(η1,η2,η3)=(ε1,ε2,ε3)CY = (x', y', z')^T, (\eta_1, \eta_2, \eta_3) = (\varepsilon_1, \varepsilon_2, \varepsilon_3)C

对于方程

XTAX=1X^TAX = 1

如果将 X=(x,y,z)TX = (x, y, z)^T 视为动点 MM 在空间直角坐标系下的坐标, 则满足上述方程的点点全体构成空间曲面 SS , 当 AA 不是对角矩阵时, 上述方程不是标准饭程序, 因此不易识别曲面 SS 的具体形状. 为此, 采用正交变换 X=QYX = QY 化二次型 XTAXX^TAX 为标准型 YTAYY^T \Alpha Y , 从而曲面 SS 在新的直角坐标系下的方程为

YTAY=1Y^T \Alpha Y = 1

由正交变换的特定, 知上述两方程是同一空间曲面在不同的空间直角坐标系下的方程, 即上述两方程对应的形状相同

例 设二次型 f(x1,x2,x3)=5x12+5x22+3x322x1x2+6x1x36x2x3f(x_1, x_2, x_3) = 5x_1^2 + 5x_2^2 + 3x_3^2 - 2x_1x_2 + 6x_1x_3 - 6x_2x_3 , 指出方程 f(x1,x2,x3)=1f(x_1, x_2, x_3) = 1 表示何种二次曲面

解 二次型 ff 的矩阵为

A==(513153333)A == \begin{pmatrix} 5 & -1 & 3 \\ -1 & 5 & -3 \\ 3 & -3 & 3 \end{pmatrix}

因为

A=λE=(5λ1315λ3333λ)=λ(λ4)(λ9)\left | A = \lambda E \right | = \begin{pmatrix} 5 - \lambda & -1 & 3 \\ -1 & 5 - \lambda & -3 \\ 3 & -3 & 3 - \lambda \end{pmatrix} = - \lambda (\lambda - 4)(\lambda - 9)

所以 AA 的特征值为 λ1=0,λ2=4,λ3=9\lambda_1 = 0, \lambda_2 = 4, \lambda_3 = 9 , 因此, 可利用正交变换将此二次型化为标准型 f=4y22+9y32f = 4y_2^2 + 9y_3^2 , 而 4y23+9y32=14y_2^3 + 9y_3^2 = 1R3R^3 中表示椭圆柱面, 所以 f(x1,x2,x3)=1f(x_1, x_2, x_3) = 1 表示的是椭圆柱面