线性代数学习笔记完整版
1 行列式
1.1 方程组与行列式
1.1.1 二元线性方程组和二阶行列式
1.1.2 三元线性方程组和三阶行列式
1.2 n n n 阶行列式
1.2.1 排序与逆序数
1.2.2 n n n 阶行列式
∣ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ∣ = ∑ ( j 1 j 2 ⋯ j n ) ( − 1 ) τ ( j 1 j 2 ⋯ j n ) a 1 j 1 a 2 j 2 ⋯ a n j n \begin{vmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{vmatrix}
= \sum_{(j_1j_2 \cdots j_n)} (-1)^{\tau (j_1j_2 \cdots j_n)}
a_{1j_1}a_{2j_2} \cdots a_{nj_n}
a 11 a 21 ⋮ a n 1 a 12 a 22 ⋮ a n 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a nn = ( j 1 j 2 ⋯ j n ) ∑ ( − 1 ) τ ( j 1 j 2 ⋯ j n ) a 1 j 1 a 2 j 2 ⋯ a n j n
每次计算, 每组每行取一个, 且每行不重复
例如:
∣ a 11 a 12 a 13 a 14 a 21 a 22 a 23 a 24 a 31 a 32 a 33 a 34 a 41 a 42 a 43 a 44 ∣ \begin{vmatrix}
a_{11} & \color{#00aaff}{a_{12}} & a_{13} & a_{14} \\
a_{21} & a_{22} & a_{23} & \color{#00aaff}{a_{24}} \\
\color{#00aaff}{a_{31}} & a_{32} & a_{33} & a{34} \\
a_{41} & a_{42} & \color{#00aaff}{a_{43}} & a_{44}
\end{vmatrix}
a 11 a 21 a 31 a 41 a 12 a 22 a 32 a 42 a 13 a 23 a 33 a 43 a 14 a 24 a 34 a 44
则某一项为
a 12 a 24 a 31 a 43 \color{#00aaff}{a_{12}a_{24}a_{31}a_{43}}
a 12 a 24 a 31 a 43
判断符号为(按行 1234 1234 1234 ) τ ( 2413 ) = 3 \tau (2413) = 3 τ ( 2413 ) = 3
或(按列 1234 1234 1234 ) τ ( 3142 ) = 3 \tau (3142) = 3 τ ( 3142 ) = 3
1.3 行列式的性质和计算
1.3.1 行列式的性质
性质1 n n n 阶行列式行列互换, 值不变, 记作 D = D T D = D^T D = D T
性质2 互换两行, 行列式变号, 记作 r i ↔ r j r_i \leftrightarrow r_j r i ↔ r j
性质3 某行同乘 k k k , 行列式乘 k k k
性质4 行列式某行各元素为两数之和, 行列式等于两行列式之和
∣ a 11 a 12 ⋯ a 1 n ⋮ ⋮ ⋮ a i 1 + a i 1 ′ a i 2 + a i 2 ′ ⋯ a i n + a i n ′ ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ∣ = ∣ a 11 a 12 ⋯ a 1 n ⋮ ⋮ ⋮ a i 1 a i 2 ⋯ a i n ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ∣ + ∣ a 11 a 12 ⋯ a 1 n ⋮ ⋮ ⋮ a i 1 ′ a i 2 ′ ⋯ a i n ′ ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ∣ \begin{vmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
\vdots & \vdots & & \vdots \\
a_{i1} + a'_{i1} & a_{i2} + a'_{i2} & \cdots & a_{in} + a'_{in} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{vmatrix}
=
\begin{vmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
\vdots & \vdots & & \vdots \\
a_{i1} & a_{i2} & \cdots & a_{in} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{vmatrix}
+
\begin{vmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
\vdots & \vdots & & \vdots \\
a'_{i1} & a'_{i2} & \cdots & a'_{in} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{vmatrix}
a 11 ⋮ a i 1 + a i 1 ′ ⋮ a n 1 a 12 ⋮ a i 2 + a i 2 ′ ⋮ a n 2 ⋯ ⋯ ⋯ a 1 n ⋮ a in + a in ′ ⋮ a nn = a 11 ⋮ a i 1 ⋮ a n 1 a 12 ⋮ a i 2 ⋮ a n 2 ⋯ ⋯ ⋯ a 1 n ⋮ a in ⋮ a nn + a 11 ⋮ a i 1 ′ ⋮ a n 1 a 12 ⋮ a i 2 ′ ⋮ a n 2 ⋯ ⋯ ⋯ a 1 n ⋮ a in ′ ⋮ a nn
性质5 某行乘 k k k 加到另一行, 值不变, 记作 r i + k r j r_i + kr_j r i + k r j
对于列, 则将 r r r 换为 c c c
推论1 某两行对应相等, 行列式为零
推论2 某两行成比例, 行列式为零
推论3 某行全为零, 行列式为零
1.3.2 行列式的计算
化为上三角
保证主对角线没有零
r n − k r 1 r_n - kr_1 r n − k r 1 , 使 r n r_n r n 首项为零 ( n > 1 ) (n > 1) ( n > 1 )
r n − k r 2 r_n - kr_2 r n − k r 2 , 使 r n r_n r n 第二项为零 ( n > 2 ) (n > 2) ( n > 2 )
⋯ \cdots ⋯
成为上三角后, 计算主对角线元素乘积
1.4 行列式按行展开
1.4.1 拉普拉斯展开定理
定义1 行列式中划去 a i j a_{ij} a ij 所在行列, 剩下元素构成的行列式称 a i j a_{ij} a ij 的余子式, 记作 M i j M_{ij} M ij ; 余子式加上代数符号 ( − 1 ) i + j (-1)^{i + j} ( − 1 ) i + j 称为代数余子式, 记作 A i j A_{ij} A ij , 即 A i j = ( − 1 ) i + j M i j A_{ij} = (-1)^{i + j} M_{ij} A ij = ( − 1 ) i + j M ij
定理1 (拉普拉斯展开定理)行列式等于其任一行各元素与其代数余子式乘积之和
即
D = ∑ k = 1 n a i k A i k , i = 1 , 2 , ⋯ , n D = \sum_{k = 1}^{n} a_{ik}A_{ik}, i = 1, 2, \cdots ,n
D = k = 1 ∑ n a ik A ik , i = 1 , 2 , ⋯ , n
定理2 行列式任一行各元素与另一行对应元素代数余子式乘积之和为零
即
∑ k = 1 n a i k A j k = 0 i ≠ j , i = 1 , 2 , ⋯ , n \sum_{k = 1}^{n} a_{ik}A_{jk} = 0 \\
i \ne j, i = 1, 2, \cdots , n
k = 1 ∑ n a ik A jk = 0 i = j , i = 1 , 2 , ⋯ , n
1.4.2 拉普拉斯展开定理应用
范德蒙德行列式
D n = ∣ 1 1 ⋯ 1 x 1 x 2 ⋯ x n x 1 2 x 2 2 ⋯ x n 2 ⋮ ⋮ ⋮ x 1 n − 1 x 2 n − 1 ⋯ x n n − 1 ∣ = ∏ 1 ≤ j < i ≤ n ( x i − x j ) D_n =
\begin{vmatrix}
1 & 1 & \cdots & 1 \\
x_1 & x_2 & \cdots & x_n \\
x_1^2 & x_2^2 & \cdots & x_n^2 \\
\vdots & \vdots & & \vdots \\
x_1^{n - 1} & x_2^{n - 1} & \cdots & x_n^{n - 1}
\end{vmatrix}
= \prod_{1 \le j < i \le n}
(x_i - x_j)
D n = 1 x 1 x 1 2 ⋮ x 1 n − 1 1 x 2 x 2 2 ⋮ x 2 n − 1 ⋯ ⋯ ⋯ ⋯ 1 x n x n 2 ⋮ x n n − 1 = 1 ≤ j < i ≤ n ∏ ( x i − x j )
1.5 克拉默法则
定理1 (克拉默法则)
n n n 个方程的 n n n 元方程组
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋯ ⋯ ⋯ ⋯ a n 1 x 1 + a n 2 x 2 + ⋯ + a n n x n = b n \begin{cases}
a_{11}x_1 + a_{12}x_2 + \cdots +a_{1n}x_n = b_1 \\
a_{21}x_1 + a_{22}x_2 + \cdots +a_{2n}x_n = b_2 \\
\cdots \cdots \cdots \cdots \\
a_{n1}x_1 + a_{n2}x_2 + \cdots +a_{nn}x_n = b_n
\end{cases}
⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋯⋯⋯⋯ a n 1 x 1 + a n 2 x 2 + ⋯ + a nn x n = b n
若其系数行列式
D = ∣ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ∣ ≠ 0 D =
\begin{vmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{vmatrix}
\ne 0
D = a 11 a 21 ⋮ a n 1 a 12 a 22 ⋮ a n 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a nn = 0
则线性方程组有唯一解
记作
x 1 = D 1 D , x 2 = D 2 D , ⋯ , x n = D n D x_1 = \frac{D_1}{D} , x_2 = \frac{D_2}{D} , \cdots , x_n = \frac{D_n}{D}
x 1 = D D 1 , x 2 = D D 2 , ⋯ , x n = D D n
其中 D j ( j = 1 , 2 , ⋯ , n ) D_j(j = 1, 2, \cdots , n) D j ( j = 1 , 2 , ⋯ , n ) 为用常数项 b 1 , b 2 , ⋯ , b n b_1, b_2, \cdots , b_n b 1 , b 2 , ⋯ , b n 代替 D D D 中 j j j 列对应元素所得行列式
即
D j = ∣ a 11 ⋯ a 1 , j − 1 b 1 a 1 , j + 1 ⋯ a 1 n ⋮ ⋮ ⋮ ⋮ ⋮ a n 1 ⋯ a n , j − 1 b n a n , j + 1 ⋯ a n n ∣ D_j =
\begin{vmatrix}
a_{11} & \cdots & a_{1, j - 1} & b_1 & a_{1, j + 1} & \cdots & a_{1n} \\
\vdots & & \vdots & \vdots & \vdots & & \vdots \\
a_{n1} & \cdots & a_{n, j - 1} & b_n & a_{n, j + 1} & \cdots & a_{nn}
\end{vmatrix}
D j = a 11 ⋮ a n 1 ⋯ ⋯ a 1 , j − 1 ⋮ a n , j − 1 b 1 ⋮ b n a 1 , j + 1 ⋮ a n , j + 1 ⋯ ⋯ a 1 n ⋮ a nn
2 矩阵
2.1 矩阵及其运算
2.1.1 矩阵的概念
定义1 m × n m \times n m × n 个数 a i j ( i = 1 , 2 , ⋯ , m ; j = 1 , 2 , ⋯ , n ) a_{ij} (i = 1, 2, \cdots , m; j = 1, 2, \cdots , n) a ij ( i = 1 , 2 , ⋯ , m ; j = 1 , 2 , ⋯ , n ) 有序排为 m m m 行 n n n 列的数表称 m m m 行 n n n 列的矩阵, 简称 m × n m \times n m × n 矩阵, 记作 ( a i j ) m × n (a_{ij})_{m \times n} ( a ij ) m × n
( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a m 1 a m 2 ⋯ a m n ) \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a mn
矩阵可以和线性方程组形成一一对应关系
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋯ ⋯ ⋯ ⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m \begin{cases}
a_{11}x_1 + a_{12}x_2 + \cdots +a_{1n}x_n = b_1 \\
a_{21}x_1 + a_{22}x_2 + \cdots +a_{2n}x_n = b_2 \\
\cdots \cdots \cdots \cdots \\
a_{m1}x_1 + a_{m2}x_2 + \cdots +a_{mn}x_n = b_m
\end{cases}
⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋯⋯⋯⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a mn x n = b m
( a 11 a 12 ⋯ a 1 n b 1 a 21 a 22 ⋯ a 2 n b 2 ⋮ ⋮ ⋮ ⋮ a m 1 a m 2 ⋯ a m n b m ) \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\
a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\
\vdots & \vdots & & \vdots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn} & b_m
\end{pmatrix}
a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a mn b 1 b 2 ⋮ b m
2.1.2 矩阵的运算
矩阵的加法与减法
定义2 两个同型矩阵的和, 为各个元素和构成的矩阵
A + B = B + A A + B = B + A A + B = B + A
( A + B ) + C = A + ( B + C ) (A + B)+ C = A + (B + C) ( A + B ) + C = A + ( B + C )
A + O = A A + O = A A + O = A
A − B = A + ( − B ) A - B = A + (-B) A − B = A + ( − B )
A , B , C A, B, C A , B , C 为 m × n m \times n m × n 矩阵, O O O 为同型零矩阵
当 A = ( a i j ) m × n , − A = ( − a i j ) m × n A = (a_{ij})_{m \times n} , -A = (-a_{ij})_{m \times n} A = ( a ij ) m × n , − A = ( − a ij ) m × n , 称为负矩阵
矩阵的数乘
定义3 矩阵 ( λ a i j ) m × n (\lambda a_{ij})_{m \times n} ( λ a ij ) m × n 为数 λ \lambda λ 与矩阵 A A A 的乘积, 简称数乘, 记作 λ A \lambda A λ A , 为各元素与数乘积构成新矩阵
( λ μ ) A = λ ( μ A ) = μ ( λ A ) (\lambda \mu)A = \lambda (\mu A) = \mu (\lambda A) ( λ μ ) A = λ ( μ A ) = μ ( λ A )
λ ( A + B ) = λ A + λ B \lambda (A + B) = \lambda A + \lambda B λ ( A + B ) = λ A + λ B
( λ + μ ) A = λ A + μ A (\lambda + \mu)A = \lambda A + \mu A ( λ + μ ) A = λ A + μ A
矩阵的乘法
定义4 矩阵 A = ( a i k ) m × s , B = ( b k j ) s × n A = (a_{ik})_{m \times s}, B = (b_{kj})_{s \times n} A = ( a ik ) m × s , B = ( b kj ) s × n , 则 C = ( c i j ) m × n C = (c_{ij})_{m \times n} C = ( c ij ) m × n 为 A , B A, B A , B 乘积, 记作 C = A B C = AB C = A B
矩阵 A B AB A B 第 i i i 行第 j j j 列元素为 A A A 的第 i i i 行与 B B B 的第 j j j 列各个元素乘积之和
一横乘一竖, 对应相乘后相加
A = ( 1 0 3 2 1 0 ) , B = ( 4 1 − 1 1 2 0 ) A B = ( 1 ∗ 4 + 0 ∗ ( − 1 ) + 3 ∗ 2 1 ∗ 1 + 0 ∗ 1 + 3 ∗ 0 2 ∗ 4 + 1 ∗ ( − 1 ) + 0 ∗ 2 2 ∗ 1 + 1 ∗ 1 + 0 ∗ 0 ) = ( 10 1 7 3 ) A =
\begin{pmatrix}
1 & 0 & 3 \\
2 & 1 & 0
\end{pmatrix}
, B =
\begin{pmatrix}
4 & 1 \\
-1 & 1 \\
2 & 0
\end{pmatrix} \\
\\ \
\\ AB =
\begin{pmatrix}
1*4+0*(-1)+3*2 & 1*1+0*1+3*0 \\
2*4+1*(-1)+0*2 & 2*1+1*1+0*0
\end{pmatrix}
=
\begin{pmatrix}
10 & 1 \\
7 & 3
\end{pmatrix}
A = ( 1 2 0 1 3 0 ) , B = 4 − 1 2 1 1 0 A B = ( 1 ∗ 4 + 0 ∗ ( − 1 ) + 3 ∗ 2 2 ∗ 4 + 1 ∗ ( − 1 ) + 0 ∗ 2 1 ∗ 1 + 0 ∗ 1 + 3 ∗ 0 2 ∗ 1 + 1 ∗ 1 + 0 ∗ 0 ) = ( 10 7 1 3 )
一般地, A B ≠ B A AB \ne BA A B = B A , 即矩阵乘法不满足交换律
一般地, A C = A D AC = AD A C = A D 时, 不一定有 C = D C = D C = D , 即矩阵乘法不满足消去律
( A B ) C = A ( B C ) (AB)C = A(BC) ( A B ) C = A ( BC )
A ( B + C ) = A B + A C A(B + C) = AB + AC A ( B + C ) = A B + A C
( λ A ) B = A ( λ D ) = λ ( A B ) (\lambda A)B = A(\lambda D) = \lambda(AB) ( λ A ) B = A ( λ D ) = λ ( A B )
定义5 若 A B = B A AB = BA A B = B A , 则称 A A A 与 B B B 可交换, 简称 A B AB A B 可换
矩阵的转置
定义6 将 m × n m \times n m × n 矩阵 A = ( a i j ) m × n A = (a_{ij})_{m \times n} A = ( a ij ) m × n 行列互换后, 得到的 n × m n \times m n × m 矩阵称为 A A A 的转置, 记作 A T A^T A T
( A T ) T = A (A^T)^T = A ( A T ) T = A
( A ± B ) T = A T ± B T (A \pm B)^T = A^T \pm B^T ( A ± B ) T = A T ± B T
( λ A ) T = λ A T (\lambda A)^T = \lambda A^T ( λ A ) T = λ A T
( A B ) T = B T A T (AB)^T = B^T A^T ( A B ) T = B T A T
2.1.3 方阵
行列数相同的矩阵成为方阵, 行(列)数成为阶数 n n n , n n n 阶方阵记作 A n A_n A n
A A A 为 n n n 阶方阵, 可定义乘方运算
A m = A ⋅ A ⋅ ⋯ ⋅ A A^m = A \cdot A \cdot \cdots \cdot A
A m = A ⋅ A ⋅ ⋯ ⋅ A
显然
A m ⋅ A l = A m + l , ( A m ) l = A m l A^m \cdot A^l = A^{m + l}, (A^m)^l = A^{ml}
A m ⋅ A l = A m + l , ( A m ) l = A m l
一般地, ( A B ) m ≠ A m B m (AB)^m \ne A^mB^m ( A B ) m = A m B m
方阵 A A A 构成的行列式记作 ∣ A ∣ \left | A \right | ∣ A ∣ 或 d e t ( A ) det(A) d e t ( A ) . 若 ∣ A ∣ ≠ 0 \left | A \right | \ne 0 ∣ A ∣ = 0 , 则称 A A A 为非奇异矩阵
∣ λ A ∣ = λ n ∣ A ∣ \left | \lambda A \right | = \lambda^n \left | A \right | ∣ λ A ∣ = λ n ∣ A ∣
∣ A B ∣ = ∣ A ∣ ∣ B ∣ \left | AB \right | = \left | A \right | \left | B \right | ∣ A B ∣ = ∣ A ∣ ∣ B ∣
∣ A m ∣ = ∣ A ∣ m \left | A^m \right | = \left | A \right |^m ∣ A m ∣ = ∣ A ∣ m
方阵 A A A 主对角线元素成为对角元, 对角元全为 1 1 1 其余元素全为 0 0 0 的 n n n 阶方阵称 n n n 阶单位矩阵, 记作 E n E_n E n 或 I n I_n I n , 即
E n = ( 1 0 1 ⋱ 0 1 ) n × n E_n =
\begin{pmatrix}
1 & & & 0 \\
& 1 & & \\
& & \ddots & \\
0 & & & 1
\end{pmatrix}
_{n \times n}
E n = 1 0 1 ⋱ 0 1 n × n
对于任意矩阵 A m × n A_{m \times n} A m × n , 有
A m × n E n = A m × n , E n A m × n = A m × n A_{m \times n}E_n = A_{m \times n} , E_nA_{m \times n} = A_{m \times n}
A m × n E n = A m × n , E n A m × n = A m × n
几个重要方阵
2.1.3.1 对角矩阵
( a 11 0 a 22 ⋱ 0 a n n ) \begin{pmatrix}
a_{11} & & & 0 \\
& a_{22} & & \\
& & \ddots & \\
0 & & & a_{nn}
\end{pmatrix}
a 11 0 a 22 ⋱ 0 a nn
简记为 d i a g ( a 11 , a 22 , ⋯ , a n n ) diag(a_{11}, a_{22}, \cdots , a_{nn}) d ia g ( a 11 , a 22 , ⋯ , a nn )
若对角线都相等, 成为数量矩阵
两对角矩阵和或积仍为对角矩阵, 对角元为对应对角元和或积
2.1.3.2 三角形矩阵
分为上三角和下三角
2.1.3.3 对称矩阵与反称矩阵
A T = A A^T = A A T = A 的矩阵为对称矩阵, A T = − A A^T = -A A T = − A 的矩阵为反称矩阵
对称矩阵沿主对角线对称, 反称矩阵沿主对角线成相反数
A + A T A + A^T A + A T 为对称矩阵, A − A T A - A^T A − A T 为反称矩阵
任意矩阵可表示为一个对称矩阵和一个反称矩阵和
A = 1 2 ( A + A T ) + 1 2 ( A − A T ) A = \frac{1}{2} (A + A^T) + \frac{1}{2} (A - A^T)
A = 2 1 ( A + A T ) + 2 1 ( A − A T )
2.2 矩阵的初等变换与秩
2.2.1 矩阵的初等变换
定义1 对矩阵执行下面三种变形, 称为矩阵的初等行变换
互换 i , j i, j i , j 两行, 记作 r i ↔ r j r_i \leftrightarrow r_j r i ↔ r j
将第 i i i 行乘上 λ \lambda λ , 记作 r i × λ r_i \times \lambda r i × λ
将第 j j j 行乘上 λ \lambda λ 后加到第 i i i 行上, 记作 r i + λ × r j r_i + \lambda \times r_j r i + λ × r j , 或 r i + λ r j r_i + \lambda r_j r i + λ r j
若对列执行, 称为矩阵的初等列变换
初等行变换和初等列变换统称矩阵的初等变换, A A A 初等变换为 B B B , 记作 A → B A \rightarrow B A → B
对 A A A 进行如下初等行变换, 得到 B B B , 称为行阶梯形矩阵
A = ( 1 − 1 1 1 0 0 1 2 1 1 − 1 2 1 0 2 1 0 3 2 − 1 ) → r 4 − r 1 r 3 + r 1 ( 1 − 1 1 1 0 0 1 2 1 1 0 1 2 1 2 0 1 2 1 − 1 ) → r 3 − r 2 r 4 + r 2 ( 1 − 1 1 1 0 0 1 2 1 1 0 0 0 0 1 0 0 0 0 − 2 ) → r 4 + 2 r 3 ( 1 − 1 1 1 0 0 1 2 1 1 0 0 0 0 1 0 0 0 0 0 ) = B A =
\begin{pmatrix}
1 & -1 & 1 & 1 & 0 \\
0 & 1 & 2 & 1 & 1 \\
-1 & 2 & 1 & 0 & 2 \\
1 & 0 & 3 & 2 & -1
\end{pmatrix}
\xrightarrow[r_4 - r_1]{r_3 + r_1}
\begin{pmatrix}
1 & -1 & 1 & 1 & 0 \\
0 & 1 & 2 & 1 & 1 \\
0 & 1 & 2 & 1 & 2 \\
0 & 1 & 2 & 1 & -1
\end{pmatrix}
\xrightarrow[r_3 - r_2]{r_4 + r_2}
\begin{pmatrix}
1 & -1 & 1 & 1 & 0 \\
0 & 1 & 2 & 1 & 1 \\
0 & 0 & 0 & 0 & 1 \\
0 & 0 & 0 & 0 & -2
\end{pmatrix}
\xrightarrow{r_4 + 2r_3}
\begin{pmatrix}
1 & -1 & 1 & 1 & 0 \\
0 & 1 & 2 & 1 & 1 \\
0 & 0 & 0 & 0 & 1 \\
0 & 0 & 0 & 0 & 0
\end{pmatrix}
= B
A = 1 0 − 1 1 − 1 1 2 0 1 2 1 3 1 1 0 2 0 1 2 − 1 r 3 + r 1 r 4 − r 1 1 0 0 0 − 1 1 1 1 1 2 2 2 1 1 1 1 0 1 2 − 1 r 4 + r 2 r 3 − r 2 1 0 0 0 − 1 1 0 0 1 2 0 0 1 1 0 0 0 1 1 − 2 r 4 + 2 r 3 1 0 0 0 − 1 1 0 0 1 2 0 0 1 1 0 0 0 1 1 0 = B
行阶梯形矩阵
( ⋆ ⋆ ⋯ ⋆ ⋯ ⋆ 0 ⋆ ⋯ ⋆ ⋯ ⋆ ⋮ ⋮ ⋮ ⋮ 0 0 ⋯ ⋆ ⋯ ⋆ ⋮ ⋮ ⋮ ⋮ 0 0 ⋯ 0 ⋯ 0 ) \begin{pmatrix}
\star & \star & \cdots & \star & \cdots & \star \\
\color{#00aaff}{0} & \star & \cdots & \star & \cdots & \star \\
\vdots & \color{#00aaff}{\vdots} & & \vdots & & \vdots \\
0 & \color{#00aaff}{0} & \color{#00aaff}{\cdots} & \star & \cdots & \star \\
\vdots & \vdots & & \color{#00aaff}{\vdots} & & \vdots \\
0 & 0 & \cdots & \color{#00aaff}{0} & \color{#00aaff}{\cdots} & \color{#00aaff}{0}
\end{pmatrix}
⋆ 0 ⋮ 0 ⋮ 0 ⋆ ⋆ ⋮ 0 ⋮ 0 ⋯ ⋯ ⋯ ⋯ ⋆ ⋆ ⋮ ⋆ ⋮ 0 ⋯ ⋯ ⋯ ⋯ ⋆ ⋆ ⋮ ⋆ ⋮ 0
对 B B B 再进行初等行变换得到 C C C
B → r 1 + r 2 r 2 − r 3 ( 1 0 3 2 0 0 1 2 1 0 0 0 0 0 1 0 0 0 0 0 ) = C B \xrightarrow[r_1 + r_2]{r_2 - r_3}
\begin{pmatrix}
1 & 0 & 3 & 2 & 0 \\
0 & 1 & 2 & 1 & 0 \\
0 & 0 & 0 & 0 & 1 \\
0 & 0 & 0 & 0 & 0
\end{pmatrix}
= C
B r 2 − r 3 r 1 + r 2 1 0 0 0 0 1 0 0 3 2 0 0 2 1 0 0 0 0 1 0 = C
行最简形矩阵
每一个非零行的非零首元都是 1 1 1 , 且非零首元所在列的其余元都为 0 0 0
( 1 0 3 2 0 0 1 2 1 0 0 0 0 0 1 0 0 0 0 0 ) \begin{pmatrix}
1 & \color{#00aaff}{0} & 3 & 2 & \color{#00aaff}{0} \\
0 & 1 & 2 & 1 & \color{#00aaff}{0} \\
0 & 0 & 0 & 0 & 1 \\
0 & 0 & 0 & 0 & 0
\end{pmatrix}
1 0 0 0 0 1 0 0 3 2 0 0 2 1 0 0 0 0 1 0
对 C C C 进行初等列变换
C → c 4 − 2 c 1 c 3 − 3 c 1 → c 4 − c 2 c 3 − 2 c 1 ( 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 ) → c 3 ↔ c 5 ( 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 ) = D C \xrightarrow[c_4 - 2c_1]{c_3 - 3c_1} \xrightarrow[c_4 - c_2]{c_3 - 2c_1}
\begin{pmatrix}
1 & 0 & 0 & 0 & 0 \\
0 & 1 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 1 \\
0 & 0 & 0 & 0 & 0
\end{pmatrix}
\xrightarrow{c_3 \leftrightarrow c_5}
\begin{pmatrix}
1 & 0 & 0 & 0 & 0 \\
0 & 1 & 0 & 0 & 0 \\
0 & 0 & 1 & 0 & 0 \\
0 & 0 & 0 & 0 & 0
\end{pmatrix}
= D
C c 3 − 3 c 1 c 4 − 2 c 1 c 3 − 2 c 1 c 4 − c 2 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 c 3 ↔ c 5 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 = D
D D D 称为 A A A 的标准型
标准型
左上角为一个单位矩阵, 其余元素均为 0 0 0
D = ( 1 0 ⋯ 0 0 ⋯ 0 0 1 ⋯ 0 0 ⋯ 0 ⋮ ⋮ ⋮ ⋮ ⋮ 0 0 ⋯ 1 0 ⋯ 0 0 0 ⋯ 0 1 ⋯ 0 ⋮ ⋮ ⋮ ⋮ ⋮ 0 0 ⋯ 0 0 ⋯ 0 ) D =
\begin{pmatrix}
\color{#00aaff}{1} & \color{#00aaff}{0} & \color{#00aaff}{\cdots} & \color{#00aaff}{0} & 0 & \cdots & 0 \\
\color{#00aaff}{0} & \color{#00aaff}{1} & \color{#00aaff}{\cdots} & \color{#00aaff}{0} & 0 & \cdots & 0 \\
\color{#00aaff}{\vdots} & \color{#00aaff}{\vdots} & & \color{#00aaff}{\vdots} & \vdots & & \vdots \\
\color{#00aaff}{0} & \color{#00aaff}{0} & \color{#00aaff}{\cdots} & \color{#00aaff}{1} & 0 & \cdots & 0 \\
0 & 0 & \cdots & 0 & 1 & \cdots & 0 \\
\vdots & \vdots & & \vdots & \vdots & & \vdots \\
0 & 0 & \cdots & 0 & 0 & \cdots & 0
\end{pmatrix}
D = 1 0 ⋮ 0 0 ⋮ 0 0 1 ⋮ 0 0 ⋮ 0 ⋯ ⋯ ⋯ ⋯ ⋯ 0 0 ⋮ 1 0 ⋮ 0 0 0 ⋮ 0 1 ⋮ 0 ⋯ ⋯ ⋯ ⋯ ⋯ 0 0 ⋮ 0 0 ⋮ 0
任何一个矩阵 A A A 经过有限次初等变换, 都可化为标准型 D D D
2.2.2 初等矩阵
定义2 由单位矩阵 E E E 经过一次初等变换得到的矩阵称为初等矩阵
互换 E E E 的第 i , j i, j i , j 行
将 E E E 的第 i i i 行乘上 λ \lambda λ
将 E E E 的第 i i i 行乘上 λ \lambda λ 后, 加到第 j j j 行
记作
P ( i , j ) = ( 1 ⋱ 1 0 ⋯ 1 ⋱ ⋮ 1 ⋮ ⋱ 1 ⋯ 0 1 ⋱ 1 ) P ( i ( λ ) ) = ( 1 ⋱ 1 λ 1 ⋱ 1 ) P ( i . j ( λ ) ) = ( 1 ⋱ 1 ⋯ λ ⋱ ⋮ 1 ⋱ 1 ) P(i, j) =
\begin{pmatrix}
1 \\
& \ddots \\
& & 1 \\
& & & 0 & & \cdots & & 1 \\
& & & & \ddots \\
& & & \vdots & & 1 & & \vdots \\
& & & & & & \ddots \\
& & & 1 & & \cdots & & 0 \\
& & & & & & & & 1 \\
& & & & & & & & & \ddots \\
& & & & & & & & & & 1
\end{pmatrix}
\\ \
\\ P(i(\lambda)) =
\begin{pmatrix}
1 \\
& \ddots \\
& & 1 \\
& & & \lambda \\
& & & & 1 \\
& & & & & \ddots \\
& & & & & & 1
\end{pmatrix}
\\ \
\\ P(i. j(\lambda)) =
\begin{pmatrix}
1 \\
& \ddots \\
& & 1 & \cdots & \lambda \\
& & & \ddots & \vdots \\
& & & & 1 \\
& & & & & \ddots \\
& & & & & & 1
\end{pmatrix}
P ( i , j ) = 1 ⋱ 1 0 ⋮ 1 ⋱ ⋯ 1 ⋯ ⋱ 1 ⋮ 0 1 ⋱ 1 P ( i ( λ )) = 1 ⋱ 1 λ 1 ⋱ 1 P ( i . j ( λ )) = 1 ⋱ 1 ⋯ ⋱ λ ⋮ 1 ⋱ 1
初等矩阵所对应行列式均不为零
定理1 对于m × n m \times n m × n 矩阵 A A A , 对 A A A 进行一次初等行变换, 相当于在 A A A 左边乘一个 m × n m \times n m × n 的初等矩阵; 对 A A A 进行一次初等列变换, 相当于在 A A A 右边乘一个 n × n n \times n n × n 的初等矩阵
例如
A = ( a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ) → r 1 ↔ r 2 ( a 21 a 22 a 23 a 11 a 12 a 13 a 31 a 32 a 33 ) = A 1 A =
\begin{pmatrix}
a_{11} & a_{12} & a_{13} \\
a_{21} & a_{22} & a_{23} \\
a_{31} & a_{32} & a_{33}
\end{pmatrix}
\xrightarrow{r_1 \leftrightarrow r_2}
\begin{pmatrix}
a_{21} & a_{22} & a_{23} \\
a_{11} & a_{12} & a_{13} \\
a_{31} & a_{32} & a_{33}
\end{pmatrix}
= A_1
A = a 11 a 21 a 31 a 12 a 22 a 32 a 13 a 23 a 33 r 1 ↔ r 2 a 21 a 11 a 31 a 22 a 12 a 32 a 23 a 13 a 33 = A 1
相当于
P ( 1 , 2 ) A = ( 0 1 0 1 0 0 0 0 1 ) ( a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ) = ( a 21 a 22 a 23 a 11 a 12 a 13 a 31 a 32 a 33 ) = A 1 P(1, 2)A =
\begin{pmatrix}
0 & 1 & 0 \\
1 & 0 & 0 \\
0 & 0 & 1
\end{pmatrix}
\begin{pmatrix}
a_{11} & a_{12} & a_{13} \\
a_{21} & a_{22} & a_{23} \\
a_{31} & a_{32} & a_{33}
\end{pmatrix}
=
\begin{pmatrix}
a_{21} & a_{22} & a_{23} \\
a_{11} & a_{12} & a_{13} \\
a_{31} & a_{32} & a_{33}
\end{pmatrix}
= A_1
P ( 1 , 2 ) A = 0 1 0 1 0 0 0 0 1 a 11 a 21 a 31 a 12 a 22 a 32 a 13 a 23 a 33 = a 21 a 11 a 31 a 22 a 12 a 32 a 23 a 13 a 33 = A 1
若 B B B 由 A A A 有限次初等变换得到, 则有
B = P t P t − 1 ⋯ P 1 A Q 1 Q 2 ⋯ Q l B = P_tP_{t-1} \cdots P_1AQ_1Q_2 \cdots Q_l
B = P t P t − 1 ⋯ P 1 A Q 1 Q 2 ⋯ Q l
2.2.3 矩阵的等价
定义3 若 A A A 经有限次初等变换得到 B B B , 则称 A , B A, B A , B 等价, 记作 A ≈ B A \approx B A ≈ B 或 A ≅ B A \cong B A ≅ B
矩阵等价关系基本性质
自反性 A ≈ A A \approx A A ≈ A
对称性 若 A ≈ B A \approx B A ≈ B , 则 B ≈ A B \approx A B ≈ A
传递性 若 A ≈ B , B ≈ C A \approx B, B \approx C A ≈ B , B ≈ C , 则 A ≈ C A \approx C A ≈ C
定理2 A , B A, B A , B 等价的充要条件为 A , B A, B A , B 有相同的标准形
2.2.4 矩阵的秩
定义4 设 A A A 为 m × n m \times n m × n 矩阵, 在 A A A 中任取 k k k 行 k k k 列, 由这 k k k 行 k k k 列交叉处的 k 2 k^2 k 2 个元素构成的 k k k 阶行列式称为矩阵 A A A 的一个 k k k 阶子式
定义5 A A A 中不为零的子式最高阶数称为矩阵 A A A 的秩, 记作 r ( A ) r(A) r ( A )
零矩阵的秩为零
非奇异方阵 A A A 的秩等于它的阶数 ( ∵ ∣ A ∣ ≠ 0 ) (\because \left | A \right | \ne 0) ( ∵ ∣ A ∣ = 0 ) , 故非奇异方阵又称满秩方阵, 奇异方阵又称降秩方阵
定理3 若 A A A 中有一个 k k k 阶子式不为零, 而所有 k + 1 k + 1 k + 1 阶子式全为零, 则 r ( A ) = k r(A) = k r ( A ) = k
r ( A ) = 0 r(A) = 0 r ( A ) = 0 充要条件为 A = O A = O A = O
0 ≤ r ( A m × n ) ≤ m i n { m , n } 0 \le r(A_{m \times n}) \le min \left \{ m, n \right \} 0 ≤ r ( A m × n ) ≤ min { m , n }
若 A A A 中有一个 k k k 阶子式不为零, 则 r ( A ) ≥ k r(A) \ge k r ( A ) ≥ k
r ( A T ) = r ( A ) , r ( k A ) = r ( A ) r(A^T) = r(A), r(kA) = r(A) r ( A T ) = r ( A ) , r ( k A ) = r ( A )
若 r ( A ) = r r(A) = r r ( A ) = r , 则 A A A 中任何阶数高于 r r r 的子式全为零
定理4 对矩阵进行初等变换后, 矩阵的秩不便, 即若 A ≈ B A \approx B A ≈ B , 则 r ( A ) = r ( B ) r(A) = r(B) r ( A ) = r ( B )
例, 求下列矩阵的秩
A = ( 1 − 2 − 1 0 2 − 2 4 2 6 − 6 2 − 1 0 2 3 3 3 3 3 4 ) → r 3 − 2 r 1 r 2 + 2 r 1 → r 2 ↔ r 3 r 4 − 3 r 1 → r 3 − 3 r 2 r 3 ↔ r 4 → r 4 + 2 r 3 ( 1 − 2 − 1 0 2 0 3 2 2 − 1 0 0 0 − 3 1 0 0 0 0 0 ) = B A =
\begin{pmatrix}
1 & -2 & -1 & 0 & 2 \\
-2 & 4 & 2 & 6 & -6 \\
2 & -1 & 0 & 2 & 3 \\
3 & 3 & 3 & 3 & 4
\end{pmatrix}
\xrightarrow[r_3 - 2r_1]{r_2 + 2r_1}
\xrightarrow[r_2 \leftrightarrow r_3]{r_4 - 3r_1}
\xrightarrow[r_3 - 3r_2]{r_3 \leftrightarrow r_4}
\xrightarrow{r_4 + 2r_3}
\begin{pmatrix}
1 & -2 & -1 & 0 & 2 \\
0 & 3 & 2 & 2 & -1 \\
0 & 0 & 0 & -3 & 1 \\
0 & 0 & 0 & 0 & 0
\end{pmatrix}
= B
A = 1 − 2 2 3 − 2 4 − 1 3 − 1 2 0 3 0 6 2 3 2 − 6 3 4 r 2 + 2 r 1 r 3 − 2 r 1 r 4 − 3 r 1 r 2 ↔ r 3 r 3 ↔ r 4 r 3 − 3 r 2 r 4 + 2 r 3 1 0 0 0 − 2 3 0 0 − 1 2 0 0 0 2 − 3 0 2 − 1 1 0 = B
又
∣ 1 − 2 0 0 3 2 0 0 − 3 ∣ = − 9 \begin{vmatrix}
1 & -2 & 0 \\
0 & 3 & 2 \\
0 & 0 & -3
\end{vmatrix}
= -9
1 0 0 − 2 3 0 0 2 − 3 = − 9
易得 r ( B ) = 3 r(B) = 3 r ( B ) = 3 , 则 r ( A ) = 3 r(A) = 3 r ( A ) = 3
定理5 等价矩阵具有相同的秩
推论1 矩阵 A A A 经过有限次初等行变换 P 1 , P 2 , ⋯ , P s P_1, P_2, \cdots , P_s P 1 , P 2 , ⋯ , P s 变为矩阵 B B B , 则
r ( B ) = r ( P s P s − 1 ⋯ P 1 A ) = r ( A ) r(B) = r(P_sP_{s - 1} \cdots P_1A) = r(A)
r ( B ) = r ( P s P s − 1 ⋯ P 1 A ) = r ( A )
推论2 矩阵 A A A 经过有限次初等列变换 Q 1 , Q 2 , ⋯ , Q t Q_1, Q_2, \cdots , Q_t Q 1 , Q 2 , ⋯ , Q t 变为矩阵 B B B , 则
r ( B ) = r ( A Q 1 Q 2 ⋯ Q t ) = r ( A ) r(B) = r(AQ_1Q_2 \cdots Q_t) = r(A)
r ( B ) = r ( A Q 1 Q 2 ⋯ Q t ) = r ( A )
推论3 矩阵 A A A 经过有限次初等行变换 P 1 , P 2 , ⋯ , P s P_1, P_2, \cdots , P_s P 1 , P 2 , ⋯ , P s 及有限次初等列变换 Q 1 , Q 2 , ⋯ , Q t Q_1, Q_2, \cdots , Q_t Q 1 , Q 2 , ⋯ , Q t 变为矩阵 B B B , 则
r ( B ) = r ( P s P s − 1 ⋯ P 1 A Q 1 Q 2 ⋯ Q t ) = r ( A ) r(B) = r(P_sP_{s - 1} \cdots P_1AQ_1Q_2 \cdots Q_t) = r(A)
r ( B ) = r ( P s P s − 1 ⋯ P 1 A Q 1 Q 2 ⋯ Q t ) = r ( A )
2.3 逆矩阵
2.3.1 逆矩阵的定义及性质
定义1 设 A A A 为 n n n 阶方阵, E E E 为 n n n 阶单位矩阵, 若存在 n n n 阶方阵 B B B , 使
A B = B A = E AB = BA = E
A B = B A = E
则称矩阵 A A A 可逆, 称 B B B 为 A A A 的逆矩阵
定理1 若矩阵可逆, 则逆矩阵唯一
( A − 1 ) − 1 = A (A^{-1})^{-1} = A ( A − 1 ) − 1 = A
( λ A ) − 1 = 1 λ A − 1 (\lambda A)^{-1} = \frac{1}{\lambda} A^{-1} ( λ A ) − 1 = λ 1 A − 1
( A T ) − 1 = ( A − 1 ) T (A^T)^{-1} = (A^{-1})^T ( A T ) − 1 = ( A − 1 ) T
( A B ) − 1 = B − 1 A − 1 (AB)^{-1} = B^{-1}A^{-1} ( A B ) − 1 = B − 1 A − 1
∣ A − 1 ∣ = 1 ∣ A ∣ = ∣ A ∣ − 1 \left | A^{-1} \right | = \frac{1}{\left | A \right |} = \left | A \right | ^{-1} A − 1 = ∣ A ∣ 1 = ∣ A ∣ − 1
推论
( A 1 A 2 ⋯ A m ) − 1 = A m − 1 ⋯ A 2 − 1 A 1 − 1 (A_1A_2 \cdots A_m)^{-1} = A_m^{-1} \cdots A_2^{-1}A_1^{-1} ( A 1 A 2 ⋯ A m ) − 1 = A m − 1 ⋯ A 2 − 1 A 1 − 1
( A m ) − 1 = ( A − 1 ) m (A^m)^{-1} = (A^{-1})^m ( A m ) − 1 = ( A − 1 ) m
若矩阵可逆, 则其逆矩阵也是对称矩阵
A = A T ⇒ A − 1 = ( A T ) − 1 = ( A − 1 ) T A = A^T \Rightarrow
A^{-1} = (A^T)^{-1} = (A^{-1})^T
A = A T ⇒ A − 1 = ( A T ) − 1 = ( A − 1 ) T
2.3.2 矩阵可逆的条件
定义2 设 n n n 阶方阵
A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ) A =
\begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{pmatrix}
A = a 11 a 21 ⋮ a n 1 a 12 a 22 ⋮ a n 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a nn
A i j A_{ij} A ij 为行列式 ∣ A ∣ \left | A \right | ∣ A ∣ 中元素 a i j a_{ij} a ij 的代数余子式, 则矩阵
A ⋆ = ( A 11 A 12 ⋯ A 1 n A 21 A 22 ⋯ A 2 n ⋮ ⋮ ⋮ A n 1 A n 2 ⋯ A n n ) A^{\star} =
\begin{pmatrix}
A_{11} & A_{12} & \cdots & A_{1n} \\
A_{21} & A_{22} & \cdots & A_{2n} \\
\vdots & \vdots & & \vdots \\
A_{n1} & A_{n2} & \cdots & A_{nn}
\end{pmatrix}
A ⋆ = A 11 A 21 ⋮ A n 1 A 12 A 22 ⋮ A n 2 ⋯ ⋯ ⋯ A 1 n A 2 n ⋮ A nn
称为 A A A 的伴随矩阵, 即当 A = ( a i j ) A = (a_{ij}) A = ( a ij ) 时, A ⋆ = ( a i j ) T A^{\star} = (a_{ij})^T A ⋆ = ( a ij ) T
方阵 A = ( a i j ) n × n A = (a_{ij})_{n \times n} A = ( a ij ) n × n 可逆的充要条件是 ∣ A ∣ ≠ 0 \left | A \right | \ne 0 ∣ A ∣ = 0
方阵 A = ( a i j ) n × n A = (a_{ij})_{n \times n} A = ( a ij ) n × n 可逆, 有 A − 1 = 1 ∣ A ∣ A ⋆ A^{-1} = \frac{1}{\left | A \right |} A^{\star} A − 1 = ∣ A ∣ 1 A ⋆
2.3.3 用初等变换求逆矩阵
定理4 初等变换有如下性质
P ( i , j ) − 1 = P ( i , j ) , ∣ P ( i , j ) ∣ = − 1 P(i, j)^{-1} = P(i, j), \left | P(i, j) \right | = -1 P ( i , j ) − 1 = P ( i , j ) , ∣ P ( i , j ) ∣ = − 1
P ( i ( λ ) ) − 1 = P ( i ( λ − 1 ) ) , ∣ P ( i ( λ ) ) ∣ = λ P(i(\lambda))^{-1} = P(i(\lambda ^{-1})), \left | P(i(\lambda)) \right | = \lambda P ( i ( λ ) ) − 1 = P ( i ( λ − 1 )) , ∣ P ( i ( λ )) ∣ = λ
P ( i , j ( λ ) ) − 1 = P ( i , j ( − λ ) ) , ∣ P ( i , j ( λ ) ) ∣ = 1 P(i, j(\lambda))^{-1} = P(i, j(- \lambda)), \left | P(i, j(\lambda)) \right | = 1 P ( i , j ( λ ) ) − 1 = P ( i , j ( − λ )) , ∣ P ( i , j ( λ )) ∣ = 1
初等矩阵的逆矩阵也为初等矩阵
定理5 若 n n n 阶方阵 A A A 可逆, 则存在有限个初等矩阵 P 1 , P 2 , ⋯ , P m P_1, P_2, \cdots , P_m P 1 , P 2 , ⋯ , P m , 使
A = P 1 P 2 ⋯ P m A = P_1P_2 \cdots P_m
A = P 1 P 2 ⋯ P m
求逆矩阵
( A ∣ E ) → 初等行变换 ( E ∣ A − 1 ) (A | E) \xrightarrow{初等行变换} (E | A^{-1})
( A ∣ E ) 初等行变换 ( E ∣ A − 1 )
或
( A E ) → 初等列变换 ( E A − 1 ) (\frac{A}{E}) \xrightarrow{初等列变换} (\frac{E}{A^{-1}})
( E A ) 初等列变换 ( A − 1 E )
例如
A = ( 2 2 3 1 − 1 0 − 1 2 1 ) ( A ∣ E ) = ( 2 2 3 ∣ 1 0 0 1 − 1 0 ∣ 0 1 0 − 1 2 1 ∣ 0 0 1 ) → ( 1 0 0 ∣ 1 − 4 − 3 0 1 0 ∣ 1 − 5 − 3 0 0 1 ∣ − 1 6 4 ) A − 1 = ( 1 − 4 − 3 1 − 5 − 3 − 1 6 4 ) \begin{aligned}
& A =
\begin{pmatrix}
2 & 2 & 3 \\
1 & -1 & 0 \\
-1 & 2 & 1
\end{pmatrix}
\\
& \\
& (A | E) =
\begin{pmatrix}
2 & 2 & 3 & | & 1 & 0 & 0 \\
1 & -1 & 0 & | & 0 & 1 & 0 \\
-1 & 2 & 1 & | & 0 & 0 & 1
\end{pmatrix}
\rightarrow
\begin{pmatrix}
1 & 0 & 0 & | & 1 & -4 & -3 \\
0 & 1 & 0 & | & 1 & -5 & -3 \\
0 & 0 & 1 & | & -1 & 6 & 4
\end{pmatrix}
\\
& \\
& A^{-1} =
\begin{pmatrix}
1 & -4 & -3 \\
1 & -5 & -3 \\
-1 & 6 & 4
\end{pmatrix}
\end{aligned}
A = 2 1 − 1 2 − 1 2 3 0 1 ( A ∣ E ) = 2 1 − 1 2 − 1 2 3 0 1 ∣ ∣ ∣ 1 0 0 0 1 0 0 0 1 → 1 0 0 0 1 0 0 0 1 ∣ ∣ ∣ 1 1 − 1 − 4 − 5 6 − 3 − 3 4 A − 1 = 1 1 − 1 − 4 − 5 6 − 3 − 3 4
2.3.4 逆矩阵的简单应用
2.3.4.1 解方程组
设 n n n 个方程 n n n 个未知量构成的线性方程组矩阵表示为 A X = b AX = b A X = b , 若 A A A 可逆, 则方程组解为 X = A − 1 b X = A^{-1}b X = A − 1 b
例如
{ 2 x 1 + 2 x 2 + 3 x 3 = 1 x 1 − x 2 = − 1 − x 1 + 2 x 2 + x 3 = 3 \begin{cases}
2x_1 + 2x_2 + 3x_3 = 1 \\
x_1 - x_2 = -1 \\
-x_1 + 2x_2 + x_3 = 3
\end{cases}
⎩ ⎨ ⎧ 2 x 1 + 2 x 2 + 3 x 3 = 1 x 1 − x 2 = − 1 − x 1 + 2 x 2 + x 3 = 3
化为 A X = b AX = b A X = b
A = ( 2 2 3 1 − 1 0 − 1 2 1 ) , X = ( x 1 x 2 x 3 ) , b = ( 1 − 1 3 ) A − 1 = ( 1 − 4 − 3 1 − 5 − 3 − 1 6 4 ) , X = A − 1 b = ( − 4 − 3 5 ) \begin{aligned}
& A =
\begin{pmatrix}
2 & 2 & 3 \\
1 & -1 & 0 \\
-1 & 2 & 1
\end{pmatrix}
, \ X =
\begin{pmatrix}
x_1 \\
x_2 \\
x_3
\end{pmatrix}
, \ b =
\begin{pmatrix}
1 \\
-1 \\
3
\end{pmatrix}
\\
& \\
& A^{-1} =
\begin{pmatrix}
1 & -4 & -3 \\
1 & -5 & -3 \\
-1 & 6 & 4
\end{pmatrix}
, \ X = A^{-1}b =
\begin{pmatrix}
-4 \\
-3 \\
5
\end{pmatrix}
\end{aligned}
A = 2 1 − 1 2 − 1 2 3 0 1 , X = x 1 x 2 x 3 , b = 1 − 1 3 A − 1 = 1 1 − 1 − 4 − 5 6 − 3 − 3 4 , X = A − 1 b = − 4 − 3 5
即 x 1 = − 4 , x 2 = − 3 , x 3 = 5 x_1 = -4, x_2 = -3, x_3 = 5 x 1 = − 4 , x 2 = − 3 , x 3 = 5
2.3.4.2 解矩阵方程
( A A A 矩阵可逆)
若 A X = B AX = B A X = B , 则 X = A − 1 B X = A^{-1}B X = A − 1 B
若 X A = B XA = B X A = B , 则 X = B A − 1 X = BA^{-1} X = B A − 1
若 A X = A B AX = AB A X = A B , 或 X A = B A XA = BA X A = B A , 则 X = B X = B X = B
例如
A , B A, B A , B 为三阶矩阵, E E E 为三阶单位矩阵, 且 A B + E = A 2 + B AB + E = A^2 + B A B + E = A 2 + B , A = ( 1 0 1 0 2 0 − 1 0 1 ) A = \begin{pmatrix}1 & 0 & 1 \\ 0 & 2 & 0 \\ -1 & 0 & 1 \end{pmatrix} A = 1 0 − 1 0 2 0 1 0 1 , 求 B B B
A B + E = A 2 + B ⇒ A B − B = A 2 − E , ⇒ ( A − E ) B = ( A − E ) ( A + E ) A − E = ( 0 0 1 0 1 0 − 1 0 0 ) , ∣ A − E ∣ = 1 ≠ 0 , 即 A − E 可逆 B = A + E = ( 2 0 1 0 3 0 − 1 0 2 ) \begin{aligned}
& AB + E = A^2 + B \Rightarrow AB - B = A^2 - E, \
\Rightarrow (A - E)B = (A - E)(A + E) \\
& A - E =
\begin{pmatrix}
0 & 0 & 1 \\
0 & 1 & 0 \\
-1 & 0 & 0
\end{pmatrix}
, \
\left | A - E \right | = 1 \ne 0, \ 即 A - E 可逆 \\
& B = A + E =
\begin{pmatrix}
2 & 0 & 1 \\
0 & 3 & 0 \\
-1 & 0 & 2
\end{pmatrix}
\end{aligned}
A B + E = A 2 + B ⇒ A B − B = A 2 − E , ⇒ ( A − E ) B = ( A − E ) ( A + E ) A − E = 0 0 − 1 0 1 0 1 0 0 , ∣ A − E ∣ = 1 = 0 , 即 A − E 可逆 B = A + E = 2 0 − 1 0 3 0 1 0 2
2.4 分块矩阵
2.4.1 矩阵的分块
A = ( 1 2 4 1 3 0 5 7 − 1 2 0 1 ) = ( A 11 A 12 A 21 A 22 ) A =
\begin{pmatrix}
\color{#00aaff}{1} & \color{#00aaff}{2} & 4 & 1 \\
3 & 0 & \color{#00aaff}{5} & \color{#00aaff}{7} \\
-1 & 2 & \color{#00aaff}{0} & \color{#00aaff}{1}
\end{pmatrix}
=
\begin{pmatrix}
\color{#00aaff}{A_{11}} & A_{12} \\
A_{21} & \color{#00aaff}{A_{22}}
\end{pmatrix}
A = 1 3 − 1 2 0 2 4 5 0 1 7 1 = ( A 11 A 21 A 12 A 22 )
其中 A 11 = ( 1 2 ) , A 12 = ( 4 1 ) , A 21 = ( 3 0 − 1 2 ) , A 22 = ( 5 7 0 1 ) A_{11} = \begin{pmatrix} 1 & 2 \end{pmatrix}, \ A_{12} = \begin{pmatrix} 4 & 1 \end{pmatrix}, \
A_{21} = \begin{pmatrix} 3 & 0 \\ -1 & 2 \end{pmatrix} , \ A_{22} = \begin{pmatrix} 5 & 7 \\ 0 & 1 \end{pmatrix} A 11 = ( 1 2 ) , A 12 = ( 4 1 ) , A 21 = ( 3 − 1 0 2 ) , A 22 = ( 5 0 7 1 )
为分块矩阵 A A A 的子块
2.4.2 分块矩阵的计算
2.4.2.1 计算 A ± B A \pm B A ± B 时, 要将 A , B A, B A , B 用同样分块方式进行分块, 保证子块同型
2.4.2.2 计算 A B AB A B 时, 对 A A A 列的分法应与对 B B B 行分法一致, 保证子块能相乘
设 A = ( a i k ) s × n , B = ( b k j ) n × m A = (a_{ik})_{s \times n}, \ B = (b_{kj})_{n \times m} A = ( a ik ) s × n , B = ( b kj ) n × m , 分块如下
A = ( A 11 A 12 ⋯ A 1 l A 21 A 22 ⋯ A 2 l ⋮ ⋮ ⋮ A t 1 A t 2 ⋯ A t l ) B = ( B 11 B 12 ⋯ B 1 r B 21 B 22 ⋯ B 2 r ⋮ ⋮ ⋮ B l 1 B l 2 ⋯ B l r ) A =
\begin{pmatrix}
A_{11} & A_{12} & \cdots & A_{1l} \\
A_{21} & A_{22} & \cdots & A_{2l} \\
\vdots & \vdots & & \vdots \\
A_{t1} & A_{t2} & \cdots & A_{tl}
\end{pmatrix}
\\ \
\\
B =
\begin{pmatrix}
B_{11} & B_{12} & \cdots & B_{1r} \\
B_{21} & B_{22} & \cdots & B_{2r} \\
\vdots & \vdots & & \vdots \\
B_{l1} & B_{l2} & \cdots & B_{lr}
\end{pmatrix}
A = A 11 A 21 ⋮ A t 1 A 12 A 22 ⋮ A t 2 ⋯ ⋯ ⋯ A 1 l A 2 l ⋮ A tl B = B 11 B 21 ⋮ B l 1 B 12 B 22 ⋮ B l 2 ⋯ ⋯ ⋯ B 1 r B 2 r ⋮ B l r
其中每个小矩阵 A i j A_{ij} A ij 为 s i × n j s_i \times \color{#00aaff}{n_j} s i × n j 矩阵,
每个小矩阵 B i j B_{ij} B ij 为 n i × m j \textcolor{#00aaff}{n_i} \times m_j n i × m j 矩阵
则
C = A B = ( C 11 C 12 ⋯ C 1 r C 21 C 22 ⋯ C 2 r ⋮ ⋮ ⋮ C t 1 C t 2 ⋯ C t r ) C = AB =
\begin{pmatrix}
C_{11} & C_{12} & \cdots & C_{1r} \\
C_{21} & C_{22} & \cdots & C_{2r} \\
\vdots & \vdots & & \vdots \\
C_{t1} & C_{t2} & \cdots & C_{tr}
\end{pmatrix}
C = A B = C 11 C 21 ⋮ C t 1 C 12 C 22 ⋮ C t 2 ⋯ ⋯ ⋯ C 1 r C 2 r ⋮ C t r
其中
C p q = A p 1 B 1 q + A p 2 2 q + ⋯ + A p l l q = ∑ k = 1 l A p k B k q ( p = 1 , 2 , ⋯ , t ; q = 1 , 2 , ⋯ , r ) C_{pq} = A_{p1}B_{1q} + A_{p2}{2q} + \cdots + A_{pl}{lq} \\
= \sum_{k = 1}^{l} A_{pk}B_{kq} \ (p = 1, 2, \cdots , t; q = 1, 2, \cdots , r)
C pq = A p 1 B 1 q + A p 2 2 q + ⋯ + A pl lq = k = 1 ∑ l A p k B k q ( p = 1 , 2 , ⋯ , t ; q = 1 , 2 , ⋯ , r )
2.4.2.3 求 A T A^T A T 时, 将子块作为元素转置后, 再将各子块转置
( A 11 A 12 A 13 A 21 A 22 A 23 ) = ( A 11 T A 21 T A 12 T A 22 T A 13 T A 23 T ) \begin{pmatrix}
A_{11} & A_{12} & A_{13} \\
A_{21} & A_{22} & A_{23}
\end{pmatrix}
=
\begin{pmatrix}
A_{11}^T & A_{21}^T \\
A_{12}^T & A_{22}^T \\
A_{13}^T & A_{23}^T
\end{pmatrix}
( A 11 A 21 A 12 A 22 A 13 A 23 ) = A 11 T A 12 T A 13 T A 21 T A 22 T A 23 T
若方阵 A A A 分块后得到如下形式
A B = ( A 1 O ⋯ O O A 2 ⋯ O ⋮ ⋮ ⋮ O O ⋯ A m ) AB =
\begin{pmatrix}
A_1 & O & \cdots & O \\
O & A_2 & \cdots & O \\
\vdots & \vdots & & \vdots \\
O & O & \cdots & A_m
\end{pmatrix}
A B = A 1 O ⋮ O O A 2 ⋮ O ⋯ ⋯ ⋯ O O ⋮ A m
其中 A i ( i = 1 , 2 , ⋯ , m ) A_i (i = 1, 2, \cdots , m) A i ( i = 1 , 2 , ⋯ , m ) 均为方阵, 称 A A A 为准对角矩阵
例如
A = ( 1 2 0 0 0 3 4 0 0 0 0 0 − 1 3 0 0 0 2 0 0 0 0 0 0 1 ) = ( A 1 A 2 A 3 ) A =
\begin{pmatrix}
\color{#00aaff}{1} & \color{#00aaff}{2} & 0 & 0 & 0 \\
\color{#00aaff}{3} & \color{#00aaff}{4} & 0 & 0 & 0 \\
0 & 0 & \color{#00aaff}{-1} & \color{#00aaff}{3} & 0 \\
0 & 0 & \color{#00aaff}{2} & \color{#00aaff}{0} & 0 \\
0 & 0 & 0 & 0 & \color{#00aaff}{1}
\end{pmatrix}
=
\begin{pmatrix}
A_1 \\
& A_2 \\
& & A_3
\end{pmatrix}
A = 1 3 0 0 0 2 4 0 0 0 0 0 − 1 2 0 0 0 3 0 0 0 0 0 0 1 = A 1 A 2 A 3
为准对角矩阵
准对角矩阵有着类似对角矩阵性质
A k = ( A 1 k A 2 k A 3 k ) A^k =
\begin{pmatrix}
A_1^k \\
& A_2^k \\
& & A_3^k
\end{pmatrix}
A k = A 1 k A 2 k A 3 k
若方阵 A 1 , A 2 , ⋯ , A m A_1, A_2, \cdots , A_m A 1 , A 2 , ⋯ , A m 均可逆, 则有
( A 1 A 2 ⋱ A m ) \begin{pmatrix}
A_1 \\
& A_2 \\
& & \ddots \\
& & & A_m
\end{pmatrix}
A 1 A 2 ⋱ A m
有逆矩阵, 且
( A 1 A 2 ⋱ A m ) − 1 = ( A 1 − 1 A 2 − 1 ⋱ A m − 1 ) \begin{pmatrix}
A_1 \\
& A_2 \\
& & \ddots \\
& & & A_m
\end{pmatrix}^{-1}
=
\begin{pmatrix}
A_1^{-1} \\
& A_2^{-1} \\
& & \ddots \\
& & & A_m^{-1}
\end{pmatrix}
A 1 A 2 ⋱ A m − 1 = A 1 − 1 A 2 − 1 ⋱ A m − 1
例 求下面矩阵的逆矩阵
D = ( a 11 ⋯ a 1 n 0 ⋯ 0 ⋮ ⋮ ⋮ ⋮ a n 1 ⋯ a n n 0 ⋯ 0 c 11 ⋯ c 1 n b 11 ⋯ b 1 m ⋮ ⋮ ⋮ ⋮ c m 1 ⋯ c m n b m 1 ⋯ b m m ) = ( A O C B ) D =
\begin{pmatrix}
a_{11} & \cdots & a_{1n} & 0 & \cdots & 0 \\
\vdots & & \vdots & \vdots & & \vdots \\
a_{n1} & \cdots & a_{nn} & 0 & \cdots & 0 \\
c_{11} & \cdots & c_{1n} & b_{11} & \cdots & b_{1m} \\
\vdots & & \vdots & \vdots & & \vdots \\
c_{m1} & \cdots & c_{mn} & b_{m1} & \cdots & b_{mm}
\end{pmatrix}
=
\begin{pmatrix}
A & O \\
C & B
\end{pmatrix}
D = a 11 ⋮ a n 1 c 11 ⋮ c m 1 ⋯ ⋯ ⋯ ⋯ a 1 n ⋮ a nn c 1 n ⋮ c mn 0 ⋮ 0 b 11 ⋮ b m 1 ⋯ ⋯ ⋯ ⋯ 0 ⋮ 0 b 1 m ⋮ b mm = ( A C O B )
解
∣ D ∣ = ∣ A ∣ ∣ B ∣ ⇒ A , B 可逆 , 则 D 可逆 设 D − 1 = ( X 11 X 12 X 21 X 22 ) 则 ( A O C B ) ( X 11 X 12 X 21 X 22 ) = ( E n O O E m ) 乘开得 { A X 11 = E n A X 12 = O C X 11 + B X 21 = O C X 12 + B X 22 = E m 由一二个方程得 X 11 = A − 1 , X 12 = O 代入四得 X 22 = B − 1 代入三得 X 21 = − B − 1 C X 11 = − B − 1 C A − 1 则 D − 1 = ( A − 1 O − B − 1 C A − 1 B − 1 ) \begin{aligned}
& \left | D \right | = \left | A \right | \left | B \right |
\Rightarrow A, B可逆, 则D可逆 \\
& 设D^{-1} =
\begin{pmatrix}
X_{11} & X_{12} \\
X_{21} & X_{22}
\end{pmatrix} \\
& \ \\
& 则
\begin{pmatrix}
A & O \\
C & B
\end{pmatrix}
\begin{pmatrix}
X_{11} & X_{12} \\
X_{21} & X_{22}
\end{pmatrix}
=
\begin{pmatrix}
E_n & O \\
O & E_m
\end{pmatrix} \\
& 乘开得
\begin{cases}
AX_{11} = E_n \\
AX_{12} = O \\
CX_{11} + BX_{21} = O \\
CX_{12} + BX_{22} = E_m
\end{cases} \\
& 由一二个方程得 \ X_{11} = A^{-1}, X_{12} = O \\
& 代入四得 \ X_{22} = B^{-1} \\
& 代入三得 \ X_{21} = -B^{-1}CX_{11} = -B^{-1}CA^{-1} \\
& \ \\
& 则 \ D^{-1} =
\begin{pmatrix}
A^{-1} & O \\
-B^{-1}CA^{-1} & B^{-1}
\end{pmatrix}
\end{aligned}
∣ D ∣ = ∣ A ∣ ∣ B ∣ ⇒ A , B 可逆 , 则 D 可逆 设 D − 1 = ( X 11 X 21 X 12 X 22 ) 则 ( A C O B ) ( X 11 X 21 X 12 X 22 ) = ( E n O O E m ) 乘开得 ⎩ ⎨ ⎧ A X 11 = E n A X 12 = O C X 11 + B X 21 = O C X 12 + B X 22 = E m 由一二个方程得 X 11 = A − 1 , X 12 = O 代入四得 X 22 = B − 1 代入三得 X 21 = − B − 1 C X 11 = − B − 1 C A − 1 则 D − 1 = ( A − 1 − B − 1 C A − 1 O B − 1 )
2.5 矩阵理论在经济学中的应用
投入产出分析
任何国家或地区的经济可以划分成多个部门, 每个部门有双重身份
作为生产者将自己的总产出分配给各个部门作为生产资料
为进行生产需要消耗其他部门的产品和无知作为投入
现考虑三个部门之间的投入产出情况, 设 C 1 , C 2 , C 3 C_1, C_2, C_3 C 1 , C 2 , C 3 三个部门,
C 1 C_1 C 1 生产一个单位产品需消耗 0.2 0.2 0.2 个单位 C 1 C_1 C 1 部门产品, 0.4 0.4 0.4 个单位 C 2 C_2 C 2 部门产品, 0.1 0.1 0.1 个单位 C 3 C_3 C 3 部门产品,
C 2 C_2 C 2 生产一个单位产品需消耗 0.3 0.3 0.3 个单位 C 1 C_1 C 1 部门产品, 0.1 0.1 0.1 个单位 C 2 C_2 C 2 部门产品, 0.3 0.3 0.3 个单位 C 3 C_3 C 3 部门产品
C 3 C_3 C 3 生产一个单位产品需消耗 0.2 0.2 0.2 个单位 C 1 C_1 C 1 部门产品, 0.2 0.2 0.2 个单位 C 2 C_2 C 2 部门产品, 0.2 0.2 0.2 个单位 C 3 C_3 C 3 部门产品
现假设 C 1 , C 2 , C 3 C_1, C_2, C_3 C 1 , C 2 , C 3 哥哥们最终产品需求分别为 d 1 , d 2 , d 3 d_1, d_2, d_3 d 1 , d 2 , d 3 个单位, 需计算各部门总产出 x 1 , x 2 , x 3 x_1, x_2, x_3 x 1 , x 2 , x 3 , 使得供需平衡
对于 C 1 C_1 C 1 , 总产出等于最终产出加上各部门消耗 C 1 C_1 C 1 部门的产品数, 即
x 1 = d 1 + 0.2 x 1 + 0.3 x 2 + 0.2 x 3 x_1 = d_1 + 0.2 x_1 + 0.3 x_2 + 0.2 x_3
x 1 = d 1 + 0.2 x 1 + 0.3 x 2 + 0.2 x 3
同理
x 2 = d 2 + 0.4 x 1 + 0.1 x 2 + 0.2 x 3 x 3 = d 3 + 0.1 x 1 + 0.3 x 2 + 0.2 x 3 x_2 = d_2 + 0.4 x_1 + 0.1 x_2 + 0.2 x_3 \\
x_3 = d_3 + 0.1 x_1 + 0.3 x_2 + 0.2 x_3
x 2 = d 2 + 0.4 x 1 + 0.1 x 2 + 0.2 x 3 x 3 = d 3 + 0.1 x 1 + 0.3 x 2 + 0.2 x 3
则有
X = ( x 1 x 2 x 3 ) , d = ( d 1 d 2 d 3 ) , A = ( 0.2 0.3 0.2 0.4 0.1 0.2 0.1 0.3 0.2 ) X = d + A X 即 ( E − A ) X = d 计算得 , ( E − A ) 可逆 , 且 ( E − A ) − 1 = ( 1.72 0.78 0.63 0.89 1.61 0.63 0.55 0.70 1.56 ) 则线性方程组有唯一解 X = ( E − A ) − 1 d = ( 1.72 0.78 0.63 0.89 1.61 0.63 0.55 0.70 1.56 ) ( d 1 d 2 d 3 ) 即 { x 1 = 1.72 d 1 + 0.78 d 2 + 0.63 d 3 x 2 = 0.89 d 1 + 1.61 d 2 + 0.63 d 3 x 3 = 0.55 d 1 + 0.70 d 2 + 1.56 d 3 \begin{aligned}
& X = \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} \ , \
d = \begin{pmatrix} d_1 \\ d_2 \\d_3 \end{pmatrix} \ , \
A = \begin{pmatrix}
0.2 & 0.3 & 0.2 \\
0.4 & 0.1 & 0.2 \\
0.1 & 0.3 & 0.2
\end{pmatrix} \\
& \ \\
& X = d + AX \\
& 即 \ (E - A)X = d \\
& \ \\
& 计算得, (E - A)可逆, 且 \ (E - A)^{-1} = \begin{pmatrix}
1.72 & 0.78 & 0.63 \\
0.89 & 1.61 & 0.63 \\
0.55 & 0.70 & 1.56
\end{pmatrix} \\
& 则线性方程组有唯一解 \\
& \ \\
& X = (E - A)^{-1}d = \begin{pmatrix}
1.72 & 0.78 & 0.63 \\
0.89 & 1.61 & 0.63 \\
0.55 & 0.70 & 1.56
\end{pmatrix}
\begin{pmatrix} d_1 \\ d_2 \\d_3 \end{pmatrix} \\
& \ \\
& 即 \begin{cases}
x_1 = 1.72 d_1 + 0.78 d_2 + 0.63 d_3 \\
x_2 = 0.89 d_1 + 1.61 d_2 + 0.63 d_3 \\
x_3 = 0.55 d_1 + 0.70 d_2 + 1.56 d_3
\end{cases}
\end{aligned}
X = x 1 x 2 x 3 , d = d 1 d 2 d 3 , A = 0.2 0.4 0.1 0.3 0.1 0.3 0.2 0.2 0.2 X = d + A X 即 ( E − A ) X = d 计算得 , ( E − A ) 可逆 , 且 ( E − A ) − 1 = 1.72 0.89 0.55 0.78 1.61 0.70 0.63 0.63 1.56 则线性方程组有唯一解 X = ( E − A ) − 1 d = 1.72 0.89 0.55 0.78 1.61 0.70 0.63 0.63 1.56 d 1 d 2 d 3 即 ⎩ ⎨ ⎧ x 1 = 1.72 d 1 + 0.78 d 2 + 0.63 d 3 x 2 = 0.89 d 1 + 1.61 d 2 + 0.63 d 3 x 3 = 0.55 d 1 + 0.70 d 2 + 1.56 d 3
若由 n n n 个部门 C 1 , C 2 , ⋯ , C n C_1, C_2, \cdots , C_n C 1 , C 2 , ⋯ , C n ,
假设 C i C_i C i 部门生产一个单位产品需要消耗 C 1 , C 2 , ⋯ , C n C_1, C_2, \cdots , C_n C 1 , C 2 , ⋯ , C n 各部门产品数分别为
a i 1 , a i 2 , ⋯ , a i n a_{i1}, a_{i2}, \cdots , a_{in} a i 1 , a i 2 , ⋯ , a in , C i C_i C i 部门的产品需求量为 d i d_i d i ,
C i C_i C i 部门总产出为 x i ( i = 1 , 2 , ⋯ , n ) x_i \ (i = 1, 2, \cdots , n) x i ( i = 1 , 2 , ⋯ , n )
则
x i = d i + a i 1 x 1 + a i 2 x 2 + ⋯ + a i n x n , i = 1 , 2 , ⋯ , n x_i = d_i + a_{i1} x_1 + a_{i2} x_2 + \cdots + a_{in} x_n \ , \ \ i = 1, 2, \cdots , n
x i = d i + a i 1 x 1 + a i 2 x 2 + ⋯ + a in x n , i = 1 , 2 , ⋯ , n
记
X = ( x 1 x 2 ⋮ x n ) , d = ( d 1 d 2 ⋮ d n ) , A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ) X = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} \ , \
d = \begin{pmatrix} d_1 \\ d_2 \\ \vdots \\ d_n \end{pmatrix} \ , \
A = \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{pmatrix}
X = x 1 x 2 ⋮ x n , d = d 1 d 2 ⋮ d n , A = a 11 a 21 ⋮ a n 1 a 12 a 22 ⋮ a n 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a nn
则方程组用矩阵表示为
X = d + A X X = d + AX
X = d + A X
$A$ 称为直接消耗系数矩阵
变形得
( E − A ) X = d (E - A)X = d
( E − A ) X = d
称为投入产出公式, E − A E - A E − A 称为列昂惕夫矩阵
实际问题中, 列昂惕夫矩阵一般是非奇异的, 它的逆矩阵 ( E − A ) − 1 (E - A)^{-1} ( E − A ) − 1 称为列昂惕夫逆矩阵, 用 R R R 表示
投入产出公式变形为
X = R d X = Rd
X = R d
利用列昂惕夫逆矩阵, 任何已知的 可预测的的最终产品需求代入上式, 可以确定各部门相应的总产出水平
各种最终需求量变化时, 对各部门的影响也可求
例如, 给 d d d 以增量 Δ d \Delta d Δ d , 则
X + Δ X = R ( d + Δ d ) = R d + R Δ d = X + R Δ d X + \Delta X = R(d + \Delta d) = Rd + R \Delta d = X + R \Delta d
X + Δ X = R ( d + Δ d ) = R d + R Δ d = X + R Δ d
即
Δ X = R Δ d \Delta X = R \Delta d
Δ X = R Δ d
对于前例, 列昂惕夫逆矩阵
R = ( 1.72 0.78 0.63 0.89 1.61 0.63 0.55 0.70 1.56 ) R = \begin{pmatrix}
1.72 & 0.78 & 0.63 \\
0.89 & 1.61 & 0.63 \\
0.55 & 0.70 & 1.56
\end{pmatrix}
R = 1.72 0.89 0.55 0.78 1.61 0.70 0.63 0.63 1.56
设 Δ d = ( 0 , 0 , 10 ) T \Delta d = (0, 0, 10)^T Δ d = ( 0 , 0 , 10 ) T , 则
Δ X = R Δ d = ( 1.72 0.78 0.63 0.89 1.61 0.63 0.55 0.70 1.56 ) ( 0 0 10 ) = ( 6.3 6.3 15.6 ) \Delta X = R \Delta d = \begin{pmatrix}
1.72 & 0.78 & 0.63 \\
0.89 & 1.61 & 0.63 \\
0.55 & 0.70 & 1.56
\end{pmatrix}
\begin{pmatrix} 0 \\ 0 \\ 10 \end{pmatrix}
= \begin{pmatrix} 6.3 \\ 6.3 \\ 15.6 \end{pmatrix}
Δ X = R Δ d = 1.72 0.89 0.55 0.78 1.61 0.70 0.63 0.63 1.56 0 0 10 = 6.3 6.3 15.6
即
Δ x 1 = 6.3 , Δ x 2 = 6.3 , Δ x 3 = 15.6 \Delta x_1 = 6.3 \ , \ \ \Delta x_2 = 6.3 \ , \ \ \Delta x_3 = 15.6
Δ x 1 = 6.3 , Δ x 2 = 6.3 , Δ x 3 = 15.6
3 向量空间
3.1 向量
3.1.1 n n n 维向量及其线性运算
定义1 由 n n n 个数组成的有序数组 ( a 1 , a 2 , ⋯ , a n ) (a_1, a_2, \cdots , a_n) ( a 1 , a 2 , ⋯ , a n ) 称为一个 n n n 维向量, 记作
α = ( a 1 , a 2 , ⋯ , a n ) \alpha = (a_1, a_2, \cdots , a_n)
α = ( a 1 , a 2 , ⋯ , a n )
其中数 a i ( i = 1 , 2 , ⋯ , n ) a_i(i = 1, 2, \cdots , n) a i ( i = 1 , 2 , ⋯ , n ) 称为向量 α \alpha α 的第 i i i 个分量或第 i i i 个坐标
有时 n n n 维向量也可写成一列的形式, 即
α = ( a 1 a 2 ⋮ a n ) \alpha =
\begin{pmatrix}
a_1 \\ a_2 \\ \vdots \\ a_n
\end{pmatrix}
α = a 1 a 2 ⋮ a n
上述两种向量分别称为行向量和列向量, 列向量为也记作 $\alpha = (a_1, a_2, \cdots , a_n)^T$
n n n 维向量可视为 1 × n 1 \times n 1 × n 或 n × 1 n \times 1 n × 1 的矩阵, 则对于 n × m n \times m n × m 矩阵 A = ( a i j ) n × m A = (a_{ij})_{n \times m} A = ( a ij ) n × m
A = ( α 1 , α 2 , ⋯ , α m ) = ( β 1 β 2 ⋮ β n ) A = (\alpha_1, \alpha_2, \cdots , \alpha_m) =
\begin{pmatrix}
\beta_1 \\ \beta_2 \\ \vdots \\ \beta_n
\end{pmatrix}
A = ( α 1 , α 2 , ⋯ , α m ) = β 1 β 2 ⋮ β n
其中 α j = ( a 1 j , a 2 j , ⋯ , a n j ) T ( j = 1 , 2 , ⋯ , m ) \alpha_j = (a_{1j}, a_{2j}, \cdots , a_{nj})^T \ (j = 1, 2, \cdots , m) α j = ( a 1 j , a 2 j , ⋯ , a nj ) T ( j = 1 , 2 , ⋯ , m ) 为 n n n 维列向量,
β i = ( a i 1 , a i 2 , ⋯ , a i m ) ( i = 1 , 2 , ⋯ , n ) \beta_i = (a_{i1}, a_{i2}, \cdots , a_{im}) \ (i = 1, 2, \cdots , n) β i = ( a i 1 , a i 2 , ⋯ , a im ) ( i = 1 , 2 , ⋯ , n ) 为 m m m 维行向量
若两个 n n n 维向量对应分量都相等, 则向量相等
α = ( a 1 , a 2 , ⋯ , a n ) , β = ( b 1 , b 2 , ⋯ , b n ) a i = b i , i = 1 , 2 , ⋯ , n 则 α = β \begin{aligned}
& \alpha = (a_1, a_2, \cdots , a_n) \ , \ \beta = (b_1, b_2, \cdots , b_n) \\
& a_i = b_i \ , \ i = 1, 2, \cdots , n \\
& 则 \ \alpha = \beta
\end{aligned}
α = ( a 1 , a 2 , ⋯ , a n ) , β = ( b 1 , b 2 , ⋯ , b n ) a i = b i , i = 1 , 2 , ⋯ , n 则 α = β
分量均为零的向量为零向量, 记作 0 \mathbf{0} 0 , 即 0 = ( 0 , 0 , ⋯ , 0 ) \mathbf{0} = (0, 0, \cdots , 0) 0 = ( 0 , 0 , ⋯ , 0 )
向量 ( − a 1 , − a 2 , ⋯ , − a n ) (-a_1, -a_2, \cdots , -a_n) ( − a 1 , − a 2 , ⋯ , − a n ) 称为向量 ( a 1 , a 2 , ⋯ , a n ) (a_1, a_2, \cdots , a_n) ( a 1 , a 2 , ⋯ , a n ) 的负向量, 记作 − α -\alpha − α
定义2 向量加法与数乘
两个 n n n 维向量
α = ( a 1 , a 2 , ⋯ , a n ) , β = ( b 1 , b 2 , ⋯ , b n ) \alpha = (a_1, a_2, \cdots , a_n) \ , \ \beta = (b_1, b_2, \cdots , b_n)
α = ( a 1 , a 2 , ⋯ , a n ) , β = ( b 1 , b 2 , ⋯ , b n )
则有
α + β = ( a 1 + b 1 , a 2 + b 2 , ⋯ , a n + b n ) α − β = α + ( − β ) = ( a 1 − b 1 , a 2 − b 2 , ⋯ , a n − b n ) \begin{align}
& \alpha + \beta = (a_1 + b_1, a_2 + b_2, \cdots , a_n + b_n) \\
& \alpha - \beta = \alpha + (-\beta) = (a_1 - b_1, a_2 - b_2, \cdots , a_n - b_n)
\end{align}
α + β = ( a 1 + b 1 , a 2 + b 2 , ⋯ , a n + b n ) α − β = α + ( − β ) = ( a 1 − b 1 , a 2 − b 2 , ⋯ , a n − b n )
α + β = β + α \alpha + \beta = \beta + \alpha α + β = β + α 加法交换律
( α + β ) + γ = α + ( β + γ ) (\alpha + \beta) + \gamma = \alpha + (\beta + \gamma) ( α + β ) + γ = α + ( β + γ ) 加法结合律
α + 0 + α \alpha + \mathbf{0} + \alpha α + 0 + α
α + ( − α ) = 0 \alpha + (-\alpha) = \mathbf{0} α + ( − α ) = 0
1 α = α 1 \alpha = \alpha 1 α = α
k ( l α ) = ( k l ) α k(l \alpha) = (kl) \alpha k ( l α ) = ( k l ) α 数乘结合律
k ( α + β ) = k α + k β k(\alpha + \beta) = k \alpha + k \beta k ( α + β ) = k α + k β 数乘对加法的分配律
( k + l ) α = k α + l α (k + l) \alpha = k \alpha + l \alpha ( k + l ) α = k α + l α
k 0 = 0 k \mathbf{0} = \mathbf{0} k 0 = 0
0 α = 0 0 \alpha = \mathbf{0} 0 α = 0
( − 1 ) α = − α (-1) \alpha = -\alpha ( − 1 ) α = − α
3.1.2 向量组的线性组合
定义3 设 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 为 r r r 个 n n n 维向量, k 1 , k 2 , ⋯ , k r k_1, k_2, \cdots , k_r k 1 , k 2 , ⋯ , k r 为 r r r 个实数, 称
k 1 α 1 + k 2 α 2 + ⋯ + k r α r k_1\alpha_1 + k_2\alpha_2 + \cdots + k_r\alpha_r
k 1 α 1 + k 2 α 2 + ⋯ + k r α r
为向量组 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2 , \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 的一个线性组合, k 1 , k 2 , ⋯ , k r k_1, k_2, \cdots , k_r k 1 , k 2 , ⋯ , k r 称相应的组合系数
若 β \beta β 可以表示为向量组 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 的一个线性组合, 则称 β \beta β 可以由向量组 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 线性表示
向量组 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 中每个向量都可以由该向量组线性表示
α i = 0 α 1 + ⋯ + 1 α i + ⋯ + 0 α r \alpha_i = 0 \alpha_1 + \cdots + 1 \alpha_i + \cdots + 0 \alpha_r
α i = 0 α 1 + ⋯ + 1 α i + ⋯ + 0 α r
若 ε 1 = ( 1 , 0 , 0 ) , ε 2 = ( 0 , 1 , 0 ) , ε 3 = ( 0 , 1 , 1 ) \varepsilon_1 = (1, 0, 0) \ , \ \varepsilon_2 = (0, 1, 0) \ , \ \varepsilon_3 = (0, 1, 1) ε 1 = ( 1 , 0 , 0 ) , ε 2 = ( 0 , 1 , 0 ) , ε 3 = ( 0 , 1 , 1 ) , 则对于任意 α = ( a 1 , a 2 , a 3 ) ∈ R 3 \alpha = (a_1, a_2, a_3) \in R^3 α = ( a 1 , a 2 , a 3 ) ∈ R 3 , 有
α = a 1 ε 1 + a 2 ε 2 + a 3 ε 3 \alpha = a_1 \varepsilon_1 + a_2 \varepsilon_2 + a_3 \varepsilon_3
α = a 1 ε 1 + a 2 ε 2 + a 3 ε 3
即 R 3 R^3 R 3 中任意向量都可由向量组 ε 1 , ε 2 , ε 1 \varepsilon_1 , \varepsilon_2 , \varepsilon_1 ε 1 , ε 2 , ε 1 线性表示
n n n 维零向量可以由任一 n n n 维向量组线性表示
0 = 0 α 1 + 0 α 2 + ⋯ + 0 α r \mathbf{0} = 0 \alpha_1 + 0 \alpha_2 + \cdots + 0 \alpha_r
0 = 0 α 1 + 0 α 2 + ⋯ + 0 α r
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋯ ⋯ ⋯ ⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m 令 α j = ( a 1 j a 2 j ⋮ a m j ) ( j = 1 , 2 , ⋯ , n ) , β = ( b 1 b 2 ⋮ b m ) 则有 β = x 1 α 1 + x 2 α 2 + ⋯ + x n α n 则方程是否有解 , 即是否存在一组数 k 1 , k 2 , ⋯ , k n 使下列线性关系式成立 β = k 1 α 1 + k 2 α 2 + ⋯ + k n α n \begin{aligned}
& \begin{cases}
a_{11} x_1 + a_{12} x_2 + \cdots + a_{1n} x_n = b_1 \\
a_{21} x_1 + a_{22} x_2 + \cdots + a_{2n} x_n = b_2 \\
\cdots \cdots \cdots \cdots \\
a_{m1} x_1 + a_{m2} x_2 + \cdots + a_{mn} x_n = b_m
\end{cases} \\
& \ \\
& 令 \ \alpha_j = \begin{pmatrix}
a_{1j} \\ a_{2j} \\ \vdots \\ a_{mj}
\end{pmatrix}
\ (j = 1, 2, \cdots , n) \
, \ \beta = \begin{pmatrix}
b_1 \\ b_2 \\ \vdots \\ b_m
\end{pmatrix} \\
& \ \\
& 则有 \ \beta = x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_n \alpha_n \\
& 则方程是否有解, 即是否存在一组数 k_1, k_2, \cdots , k_n 使下列线性关系式成立 \\
& \beta = k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_n \alpha_n
\end{aligned}
⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋯⋯⋯⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a mn x n = b m 令 α j = a 1 j a 2 j ⋮ a mj ( j = 1 , 2 , ⋯ , n ) , β = b 1 b 2 ⋮ b m 则有 β = x 1 α 1 + x 2 α 2 + ⋯ + x n α n 则方程是否有解 , 即是否存在一组数 k 1 , k 2 , ⋯ , k n 使下列线性关系式成立 β = k 1 α 1 + k 2 α 2 + ⋯ + k n α n
β \beta β 能由向量组 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 表示且表示唯一, 等价于方程组有唯一解
β \beta β 能由向量组 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 表示且表示不唯一, 等价于方程组有无穷组解
β \beta β 不能由向量组 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 表示, 等价于方程组无解
定义4 两向量组
A : α 1 , α 2 , ⋯ , α s ; B : β 1 , β 2 , ⋯ , β t A: \ \alpha_1, \alpha_2, \cdots , \alpha_s \ ; \ B: \ \beta_1, \beta_2, \cdots , \beta_t
A : α 1 , α 2 , ⋯ , α s ; B : β 1 , β 2 , ⋯ , β t
若向量组 B B B 中每个元素都能由向量组 A A A 线性表示, 则称向量组 B B B 能由向量组 A A A 线性表示
若向量组 A A A 与向量组 B B B 能互相线性表示, 则称这两个向量组等价
若向量组 B B B 能由向量组 A A A 线性表示, 则存在系数 k i j ( i = 1 , 2 , ⋯ , s , j = 1 , 2 , ⋯ , t ) k_{ij}(i = 1, 2, \cdots , s \ , \ j = 1, 2, \cdots , t) k ij ( i = 1 , 2 , ⋯ , s , j = 1 , 2 , ⋯ , t ) , 使
{ β 1 = k 11 α 1 + k 21 α 2 + ⋯ + k s 1 α s β 2 = k 12 α 1 + k 22 α 2 + ⋯ + k s 2 α s ⋯ ⋯ ⋯ ⋯ β t = k 1 t α 1 + k 21 α 2 + ⋯ + k s t α s \begin{cases}
\beta_1 = k_{11} \alpha_1 + k_{21} \alpha_2 + \cdots + k_{s1} \alpha_s \\
\beta_2 = k_{12} \alpha_1 + k_{22} \alpha_2 + \cdots + k_{s2} \alpha_s \\
\cdots \cdots \cdots \cdots \\
\beta_t = k_{1t} \alpha_1 + k_{21} \alpha_2 + \cdots + k_{st} \alpha_s
\end{cases}
⎩ ⎨ ⎧ β 1 = k 11 α 1 + k 21 α 2 + ⋯ + k s 1 α s β 2 = k 12 α 1 + k 22 α 2 + ⋯ + k s 2 α s ⋯⋯⋯⋯ β t = k 1 t α 1 + k 21 α 2 + ⋯ + k s t α s
上式可简记为
( β 1 , β 2 , ⋯ , β t ) = ( α 1 , α 2 , ⋯ , α s ) ( k 11 k 12 ⋯ k 1 t k 21 k 22 ⋯ k 2 t ⋮ ⋮ ⋮ k s 1 k s 2 ⋯ k s t ) (\beta_1, \beta_2 , \cdots , \beta_t) = (\alpha_1, \alpha_2, \cdots , \alpha_s)
\begin{pmatrix}
k_{11} & k_{12} & \cdots & k_{1t} \\
k_{21} & k_{22} & \cdots & k_{2t} \\
\vdots & \vdots & & \vdots \\
k_{s1} & k_{s2} & \cdots & k_{st}
\end{pmatrix}
( β 1 , β 2 , ⋯ , β t ) = ( α 1 , α 2 , ⋯ , α s ) k 11 k 21 ⋮ k s 1 k 12 k 22 ⋮ k s 2 ⋯ ⋯ ⋯ k 1 t k 2 t ⋮ k s t
令 B = ( β 1 , β 2 , ⋯ , β t ) , A = ( α 1 , α 2 , ⋯ , α s ) B = (\beta_1 , \beta_2 , \cdots , \beta_t) \ , \ A = (\alpha_1, \alpha_2, \cdots , \alpha_s) B = ( β 1 , β 2 , ⋯ , β t ) , A = ( α 1 , α 2 , ⋯ , α s ) , 则上式表示 B B B 的列向量组可以由 A A A 的列向量组表示
令 K = ( k i j ) s × t K = (k_{ij})_{s \times t} K = ( k ij ) s × t , 称 K K K 为向量组 B B B 由向量组 A A A 表示的系数矩阵, 简写为
B = A K B = AK
B = A K
定理1 向量组线性表示关系的传递性
若向量组 C : γ 1 , γ 2 , ⋯ , γ m C: \ \gamma_1, \gamma_2, \cdots , \gamma_m C : γ 1 , γ 2 , ⋯ , γ m 可由向量组 B : β 1 , β 2 , ⋯ , β t B: \ \beta_1, \beta_2, \cdots , \beta_t B : β 1 , β 2 , ⋯ , β t 线性表示,
向量组 B : β 1 , β 2 , ⋯ , β t B: \ \beta_1, \beta_2, \cdots , \beta_t B : β 1 , β 2 , ⋯ , β t 可由向量组 A : α 1 , α 2 , ⋯ , α t A: \ \alpha_1, \alpha_2, \cdots , \alpha_t A : α 1 , α 2 , ⋯ , α t 线性表示,
则向量组 C C C 可由向量组 A A A 线性表示
存在矩阵 K 1 , K 2 有 C = B K 1 , B = A K 2 则 C = B K 1 = A K 2 K 1 = A ( K 2 K 1 ) 则 C 可由 A 线性表 , 系数 K = K 2 K 1 \begin{aligned}
& 存在矩阵 K_1, K_2 \\
& 有 \ C = BK_1 \ , \ B = AK_2 \\
& 则 \ C = BK_1 = AK_2K_1 = A(K_2K_1) \\
& \ \\
& 则C可由A线性表, 系数K = K_2K_1
\end{aligned}
存在矩阵 K 1 , K 2 有 C = B K 1 , B = A K 2 则 C = B K 1 = A K 2 K 1 = A ( K 2 K 1 ) 则 C 可由 A 线性表 , 系数 K = K 2 K 1
向量组之间等价关系也有传递性
例 求下列向量组 B B B 由向量组 A A A 线性表示的系数矩阵 K K K
B : β 1 = ( a 11 , a 21 , a 31 ) T , β 2 = ( a 12 , a 22 , a 32 ) T A : ε 1 = ( 1 , 0 , 0 ) T , ε 2 = ( 0 , 1 , 0 ) T , ε 3 = ( 0 , 0 , 1 ) T B: \ \beta_1 = (a_{11}, a_{21}, a_{31})^T, \beta_2 = (a_{12}, a_{22}, a_{32})^T \\
A: \ \varepsilon_1 = (1, 0, 0)^T, \varepsilon_2 = (0, 1, 0)^T, \varepsilon_3 = (0, 0, 1)^T
B : β 1 = ( a 11 , a 21 , a 31 ) T , β 2 = ( a 12 , a 22 , a 32 ) T A : ε 1 = ( 1 , 0 , 0 ) T , ε 2 = ( 0 , 1 , 0 ) T , ε 3 = ( 0 , 0 , 1 ) T
解
{ β 1 = a 11 ε 1 + a 21 ε 2 + a 31 ε 3 β 2 = a 12 ε 1 + a 22 ε 2 + a 32 ε 3 ( β 1 , β 2 ) = ( ε 1 , ε 2 , ε 3 ) ( a 11 a 12 a 21 a 22 a 31 a 32 ) 则 K = ( a 11 a 12 a 21 a 22 a 31 a 32 ) \begin{aligned}
& \begin{cases}
\beta_1 = a_{11} \varepsilon_1 + a_{21} \varepsilon_2 + a_{31} \varepsilon_3 \\
\beta_2 = a_{12} \varepsilon_1 + a_{22} \varepsilon_2 + a_{32} \varepsilon_3
\end{cases} \\
& (\beta_1 , \beta_2) = (\varepsilon_1 , \varepsilon_2 , \varepsilon_3) \begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix} \\
& \ \\
& 则 \ K = \begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22} \\
a_{31} & a_{32}
\end{pmatrix}
\end{aligned}
{ β 1 = a 11 ε 1 + a 21 ε 2 + a 31 ε 3 β 2 = a 12 ε 1 + a 22 ε 2 + a 32 ε 3 ( β 1 , β 2 ) = ( ε 1 , ε 2 , ε 3 ) a 11 a 21 a 31 a 12 a 22 a 32 则 K = a 11 a 21 a 31 a 12 a 22 a 32
3.2 向量组的线性相关性
3.2.1 线性相关与线性无关
定义1 对于向量组 α 1 , α 2 , ⋯ , α s ( s ≥ 1 ) \alpha_1 , \alpha_2 , \cdots , \alpha_s \ (s \ge 1) α 1 , α 2 , ⋯ , α s ( s ≥ 1 ) ,
若存在不全为零的实数 k 1 , k 2 , ⋯ , k s k_1, k_2, \cdots , k_s k 1 , k 2 , ⋯ , k s , 使
k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0 k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_s \alpha_s = \mathbf{0}
k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0
则称向量组 α 1 , α 2 , ⋯ , α s \alpha_1 , \alpha_2 , \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 线性相关, 否则称之为线性无关
若 α 1 , α 2 , ⋯ , α s ( s ≥ 1 ) \alpha_1 , \alpha_2 , \cdots , \alpha_s \ (s \ge 1) α 1 , α 2 , ⋯ , α s ( s ≥ 1 ) 线性无关, 则
k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0 k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_s \alpha_s = \mathbf{0}
k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0
必可得 k 1 = k 2 = ⋯ = k s = 0 k_1 = k_2 = \cdots = k_s = \mathbf{0} k 1 = k 2 = ⋯ = k s = 0
两个单位向量线性相关即表示它们共线, 三个三位向量线性相关即表示它们共面, 反之仍成立
定理1 向量组 α 1 , α 2 , ⋯ , α s ( s ≥ 2 ) \alpha_1 , \alpha_2 , \cdots , \alpha_s \ (s \ge 2) α 1 , α 2 , ⋯ , α s ( s ≥ 2 ) 线性相关,
当且仅当向量组里至少有一个向量可由其余向量线性表示
对于 α 1 , α 2 , ⋯ , α s 若其中一个向量可由其他向量线性表示 设 α s = k 1 α 1 + k 2 α 2 + ⋯ + k s − 1 α s − 1 则 k 1 α 1 + k 2 α 2 + ⋯ + k s − 1 α s − 1 + ( − 1 ) α s = 0 反之 , 若 α 1 , α 2 , ⋯ , α s 线性相关 , 则有 k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0 设 k s ≠ 0 , 则 α s = − k 1 k s α 1 − k 2 k s α 2 − ⋯ − k s − 1 k s α s − 1 即 α s 可由其他向量线性表示 \begin{aligned}
& 对于 \ \alpha_1 , \alpha_2 , \cdots , \alpha_s \\
& \ \\
& 若其中一个向量可由其他向量线性表示 \\
& 设 \ \alpha_s = k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_{s - 1} \alpha_{s - 1} \\
& 则\ k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_{s - 1} \alpha_{s - 1} + (-1) \alpha_s = \mathbf{0} \\
& \ \\
& 反之, 若 \alpha_1 , \alpha_2 , \cdots , \alpha_s 线性相关, 则有 \\
& k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_s \alpha_s = \mathbf{0} \\
& 设 k_s \ne 0, 则 \\
& \alpha_s = - \frac{k_1}{k_s} \alpha_1 - \frac{k_2}{k_s} \alpha_2 - \cdots - \frac{k_{s - 1}}{k_s} \alpha_{s - 1} \\
& \ \\
& 即 \alpha_s 可由其他向量线性表示
\end{aligned}
对于 α 1 , α 2 , ⋯ , α s 若其中一个向量可由其他向量线性表示 设 α s = k 1 α 1 + k 2 α 2 + ⋯ + k s − 1 α s − 1 则 k 1 α 1 + k 2 α 2 + ⋯ + k s − 1 α s − 1 + ( − 1 ) α s = 0 反之 , 若 α 1 , α 2 , ⋯ , α s 线性相关 , 则有 k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0 设 k s = 0 , 则 α s = − k s k 1 α 1 − k s k 2 α 2 − ⋯ − k s k s − 1 α s − 1 即 α s 可由其他向量线性表示
含零向量的向量组一定线性相关
若向量组 α 1 , α 2 , ⋯ , α s 中 α 1 = 0 则 1 ⋅ α 1 + 0 ⋅ α 2 + 0 ⋅ α 3 + ⋯ + 0 ⋅ α s = 0 \begin{aligned}
& 若向量组 \alpha_1 , \alpha_2 , \cdots , \alpha_s 中 \alpha_1 = \mathbf{0} \\
& 则 \ 1 \cdot \alpha_1 + 0 \cdot \alpha_2 + 0 \cdot \alpha_3 + \cdots + 0 \cdot \alpha_s = \mathbf{0}
\end{aligned}
若向量组 α 1 , α 2 , ⋯ , α s 中 α 1 = 0 则 1 ⋅ α 1 + 0 ⋅ α 2 + 0 ⋅ α 3 + ⋯ + 0 ⋅ α s = 0
定理2 若向量组中有一个部分组线性相关, 则向量组也线性相关;
若向量组线性无关, 则其任何部分组线性无关
定理3 若向量组 α 1 , α 2 , ⋯ , α s \alpha_1 , \alpha_2 , \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 线性无关,
而向量组 α 1 , α 2 , ⋯ , α s , β \alpha_1 , \alpha_2 , \cdots , \alpha_s, \beta α 1 , α 2 , ⋯ , α s , β 线性相关,
则 β \beta β 可由向量组 α 1 , α 2 , ⋯ , α s \alpha_1 , \alpha_2 , \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 线性表示且表示法唯一
k 1 α 1 + k 2 α 2 + ⋯ + k s α s + k β = 0 若 k = 0 , 则有 k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0 且 k 1 , k 2 , ⋯ , k s 不全为零 , 这与 α 1 , α 2 , ⋯ , α s 线性无关矛盾 故 k ≠ 0 则 β = − k 1 k α 1 − k 2 k α 2 − ⋯ − k s k α s 即 β 可由 α 1 , α 2 , ⋯ , α s 线性表示 若存在两组数 t 1 , t 2 , ⋯ , t s , l 1 , l 2 , ⋯ , l s 使 β = t 1 α 1 + t 2 α 2 + ⋯ + t s α s = l 1 α 1 + l 2 α 2 + ⋯ + l s α s 则 ( t 1 − l 1 ) α 1 + ( t 2 − l 2 ) α 2 + ⋯ + ( t s − l s ) α s = 0 又 α 1 , α 2 , ⋯ , α s 线性无关 , 则 t i = l i ( i = 1 , 2 , ⋯ , s ) 即 , 表示法唯一 \begin{aligned}
& k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_s \alpha_s + k \beta = \mathbf{0} \\
& \ \\
& 若 k = 0, 则有 \ k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_s \alpha_s = \mathbf{0} \\
& 且 k_1, k_2, \cdots , k_s 不全为零, 这与 \alpha_1 , \alpha_2 , \cdots , \alpha_s 线性无关矛盾 \\
& 故 k \ne 0 \\
& \ \\
& 则 \beta = - \frac{k_1}{k} \alpha_1 - \frac{k_2}{k} \alpha_2 - \cdots - \frac{k_{s}}{k} \alpha_{s} \\
& 即 \beta 可由 \alpha_1 , \alpha_2 , \cdots , \alpha_s 线性表示 \\
& \ \\
& 若存在两组数 t_1, t_2, \cdots , t_s \ , \ l_1, l_2, \cdots , l_s 使 \\
& \beta = t_1 \alpha_1 + t_2 \alpha_2 + \cdots + t_s \alpha_s = l_1 \alpha_1 + l_2 \alpha_2 + \cdots + l_s \alpha_s \\
& 则 \ (t_1 - l_1) \alpha_1 + (t_2 - l_2) \alpha_2 + \cdots + (t_s - l_s) \alpha_s = \mathbf{0} \\
& \ \\
& 又 \alpha_1 , \alpha_2 , \cdots , \alpha_s 线性无关, 则 t_i = l_i \ (i = 1, 2, \cdots , s) \\
& \ \\
& 即, 表示法唯一
\end{aligned}
k 1 α 1 + k 2 α 2 + ⋯ + k s α s + k β = 0 若 k = 0 , 则有 k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0 且 k 1 , k 2 , ⋯ , k s 不全为零 , 这与 α 1 , α 2 , ⋯ , α s 线性无关矛盾 故 k = 0 则 β = − k k 1 α 1 − k k 2 α 2 − ⋯ − k k s α s 即 β 可由 α 1 , α 2 , ⋯ , α s 线性表示 若存在两组数 t 1 , t 2 , ⋯ , t s , l 1 , l 2 , ⋯ , l s 使 β = t 1 α 1 + t 2 α 2 + ⋯ + t s α s = l 1 α 1 + l 2 α 2 + ⋯ + l s α s 则 ( t 1 − l 1 ) α 1 + ( t 2 − l 2 ) α 2 + ⋯ + ( t s − l s ) α s = 0 又 α 1 , α 2 , ⋯ , α s 线性无关 , 则 t i = l i ( i = 1 , 2 , ⋯ , s ) 即 , 表示法唯一
向量组 α , β , γ \alpha, \beta, \gamma α , β , γ 线性无关, 则向量组 α + β , β + γ , γ + α \alpha + \beta, \beta + \gamma, \gamma + \alpha α + β , β + γ , γ + α 也线性无关
设有 k 1 , k 2 , k 3 使 k 1 ( α + β ) + k 2 ( β + γ ) + k 3 ( γ + α ) = 0 即 ( k 1 + k 3 ) α + ( k 1 + k 2 ) β + ( k 2 + k 3 ) γ = 0 又 α , β , γ 线性无关 , 则 { k 1 + k 3 = 0 k 1 + k 2 = 0 k 2 + k 3 = 0 由克拉默法则得 , 此方程组 D = 2 ≠ 0 , 则方程组只有零解 , 即 k 1 = k 2 = k 3 = 0 则 α + β , β + γ , γ + α 线性无关 \begin{aligned}
& 设有 k_1, k_2, k_3 \\
& 使 \ k_1 (\alpha + \beta) + k_2 (\beta + \gamma) + k_3 (\gamma + \alpha) = \mathbf{0} \\
& 即 \ (k_1 + k_3) \alpha + (k_1 + k_2) \beta + (k_2 + k_3) \gamma = \mathbf{0} \\
& \ \\
& 又 \alpha, \beta, \gamma 线性无关, 则 \\
& \begin{cases}
k_1 + k_3 = 0 \\
k_1 + k_2 = 0 \\
k_2 + k_3 = 0
\end{cases} \\
& \ \\
& 由克拉默法则得, 此方程组 D = 2 \ne 0, 则方程组只有零解, 即 k_1 = k_2 = k_3 = 0 \\
& 则 \alpha + \beta, \beta + \gamma, \gamma + \alpha 线性无关
\end{aligned}
设有 k 1 , k 2 , k 3 使 k 1 ( α + β ) + k 2 ( β + γ ) + k 3 ( γ + α ) = 0 即 ( k 1 + k 3 ) α + ( k 1 + k 2 ) β + ( k 2 + k 3 ) γ = 0 又 α , β , γ 线性无关 , 则 ⎩ ⎨ ⎧ k 1 + k 3 = 0 k 1 + k 2 = 0 k 2 + k 3 = 0 由克拉默法则得 , 此方程组 D = 2 = 0 , 则方程组只有零解 , 即 k 1 = k 2 = k 3 = 0 则 α + β , β + γ , γ + α 线性无关
3.2.2 利用矩阵的秩判定向量组的线性相关性
定理4 设矩阵 A A A 的秩为 r r r , 则 A A A 中存在 r r r 个行向量(或列向量)线性无关,
且 A A A 的任一行向量(或列向量)都可由这 r r r 个行列式线性表示
A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a m 1 a m 2 ⋯ a m n ) = ( α 1 α 2 ⋮ α m ) 其中 α i = ( a i 1 , a i 2 , ⋯ , a i n ) ( i = 1 , 2 , ⋯ , m ) 由矩阵秩的定义 , A 存在一个不为零的 r 阶子式 , 设 A 左上角的 r 阶子式不为零 ∣ D ∣ = ∣ a 11 a 12 ⋯ a 1 r a 21 a 22 ⋯ a 2 r ⋮ ⋮ ⋮ a r 1 a r 2 ⋯ a r r ∣ ≠ 0 若 α 1 , α 2 , ⋯ , α r 线性相关 , 则设 α r = k 1 α 1 + k 2 α 2 + ⋯ + k r − 1 α r − 1 ∣ D ∣ → ( r 1 , r 2 , ⋯ , r r − 1 ) × ( − k 1 , − k 2 , ⋯ , − k r − 1 ) + r r ⋯ 则 ∣ D ∣ 最后一行圈化为零 , 即 ∣ D ∣ = 0 , 与假设矛盾 则 α 1 , α 2 , ⋯ , α r 线性无关 α 1 , α 2 , ⋯ , α r 向量组中每个向量都能由它本事线性表示 , 则只需证 α k ( k > r ) 时能由向量组线性表示 ∣ D t ∣ = ∣ a 11 ⋯ a 1 r a 1 t a 21 ⋯ a 2 r a 2 t ⋮ ⋮ ⋮ a r 1 ⋯ a r r a r t a k 1 ⋯ a k r a k t ∣ , t = 1 , 2 , ⋯ , n t ≤ r 时 , D t 最后一列与前面某列相同 , ∣ D t ∣ = 0 t > r 时 , ∣ D t ∣ 为 A 的 r + 1 阶子式 , 根据秩的定义 , 同样 ∣ D t ∣ = 0 展开 ∣ D t ∣ 最后一列 , 得 a 1 t A 1 + a 2 t A 2 + ⋯ + a r t A r + a k t ∣ D ∣ = 0 A 1 , A 2 , ⋯ , A r 分别为 a 1 t , a 2 t , ⋯ , a r t 的代数余子式 , 取值与 t 无关 ∣ D ∣ ≠ 0 ⇒ a k t = − A 1 ∣ D ∣ a 1 t − A 2 ∣ D ∣ a 2 t − ⋯ − A r ∣ D ∣ a r t , t = 1 , 2 , ⋯ , n 则 ( a k 1 , a k 2 , ⋯ , a k n ) = − A 1 ∣ D ∣ ( a 11 , a 12 , ⋯ , a 1 n ) − ⋯ − A r ∣ D ∣ ( a r 1 , a r 2 , ⋯ , a r n ) 即 α k = − A 1 ∣ D ∣ α 1 − A 2 ∣ D ∣ α 2 − ⋯ − A r ∣ D ∣ α r α k 可由 α 1 , α 2 , ⋯ , α r 线性表示 A → A T , 则可证关于列向量的结论 \begin{aligned}
& A = \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix} = \begin{pmatrix}
\alpha_1 \\ \alpha_2 \\ \vdots \\ \alpha_m
\end{pmatrix} \\
& 其中 \ \alpha_i = (a_{i1}, a_{i2}, \cdots , a_{in}) \ (i = 1, 2, \cdots , m) \\
& \ \\
& 由矩阵秩的定义, A 存在一个不为零的r阶子式, 设A左上角的r阶子式不为零 \\
& \left | D \right | = \begin{vmatrix}
a_{11} & a_{12} & \cdots & a_{1r} \\
a_{21} & a_{22} & \cdots & a_{2r} \\
\vdots & \vdots & & \vdots \\
a_{r1} & a_{r2} & \cdots & a_{rr}
\end{vmatrix} \ne 0 \\
& \ \\
& 若 \alpha_1, \alpha_2, \cdots , \alpha_r线性相关, 则设 \\
& \alpha_r = k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_{r - 1} \alpha_{r - 1} \\
& \ \\
& \left | D \right | \xrightarrow[]{(r_1, r_2, \cdots , r_{r - 1}) \times (-k_1, -k_2, \cdots , -k_{r - 1}) + r_r} \cdots \\
& 则 \left | D \right | 最后一行圈化为零, 即 \left | D \right | = 0, 与假设矛盾 \\
& 则\alpha_1, \alpha_2, \cdots , \alpha_r线性无关 \\
& \ \\
& \alpha_1, \alpha_2, \cdots , \alpha_r向量组中每个向量都能由它本事线性表示, 则只需证\alpha_k \ (k > r)时能由向量组线性表示 \\
& \ \\
& \left | D_t \right | = \begin{vmatrix}
\color{#00aaff}{a_{11}} & \color{#00aaff}{\cdots} & \color{#00aaff}{a_{1r}} & a_{1t} \\
\color{#00aaff}{a_{21}} & \color{#00aaff}{\cdots} & \color{#00aaff}{a_{2r}} & a_{2t} \\
\color{#00aaff}{\vdots} & & \color{#00aaff}{\vdots} & \vdots \\
\color{#00aaff}{a_{r1}} & \color{#00aaff}{\cdots} & \color{#00aaff}{a_{rr}} & a_{rt} \\
a_{k1} & \cdots & a_{kr} & a_{kt}
\end{vmatrix}, \ t = 1, 2, \cdots , n \\
& \ \\
& t \le r时, D_t 最后一列与前面某列相同, \left | D_t \right | = 0 \\
& t > r 时, \left | D_t \right | 为A的r + 1阶子式, 根据秩的定义, 同样\left | D_t \right | = 0 \\
& \ \\
& 展开\left | D_t \right |最后一列, 得 \\
& a_{1t} A_1 + a_{2t} A_2 + \cdots + a_{rt} A_r + a_{kt} \left | D \right | = 0 \\
& A_1, A_2, \cdots , A_r分别为a_{1t}, a_{2t}, \cdots , a_{rt} 的代数余子式 , 取值与t无关 \\
& \ \\
& \left | D \right | \ne 0 \Rightarrow a_{kt} = - \frac{A_1}{\left | D \right |} a_{1t} - \frac{A_2}{\left | D \right |} a_{2t}
- \cdots - \frac{A_r}{\left | D \right |} a_{rt} \ , \ t = 1, 2, \cdots , n \\
& 则 \ (a_{k1}, a_{k2}, \cdots , a_{kn}) = - \frac{A_1}{\left | D \right |} (a_{11}, a_{12}, \cdots , a_{1n})
- \cdots - \frac{A_r}{\left | D \right |} (a_{r1}, a_{r2}, \cdots , a_{rn}) \\
& 即 \ \alpha_k = - \frac{A_1}{\left | D \right |} \alpha_1 - \frac{A_2}{\left | D \right |} \alpha_2
- \cdots - \frac{A_r}{\left | D \right |} \alpha_r \\
& \alpha_k 可由 \alpha_1, \alpha_2, \cdots , \alpha_r 线性表示 \\
& \ \\
& A \rightarrow A^T , 则可证关于列向量的结论
\end{aligned}
A = a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a mn = α 1 α 2 ⋮ α m 其中 α i = ( a i 1 , a i 2 , ⋯ , a in ) ( i = 1 , 2 , ⋯ , m ) 由矩阵秩的定义 , A 存在一个不为零的 r 阶子式 , 设 A 左上角的 r 阶子式不为零 ∣ D ∣ = a 11 a 21 ⋮ a r 1 a 12 a 22 ⋮ a r 2 ⋯ ⋯ ⋯ a 1 r a 2 r ⋮ a rr = 0 若 α 1 , α 2 , ⋯ , α r 线性相关 , 则设 α r = k 1 α 1 + k 2 α 2 + ⋯ + k r − 1 α r − 1 ∣ D ∣ ( r 1 , r 2 , ⋯ , r r − 1 ) × ( − k 1 , − k 2 , ⋯ , − k r − 1 ) + r r ⋯ 则 ∣ D ∣ 最后一行圈化为零 , 即 ∣ D ∣ = 0 , 与假设矛盾 则 α 1 , α 2 , ⋯ , α r 线性无关 α 1 , α 2 , ⋯ , α r 向量组中每个向量都能由它本事线性表示 , 则只需证 α k ( k > r ) 时能由向量组线性表示 ∣ D t ∣ = a 11 a 21 ⋮ a r 1 a k 1 ⋯ ⋯ ⋯ ⋯ a 1 r a 2 r ⋮ a rr a k r a 1 t a 2 t ⋮ a r t a k t , t = 1 , 2 , ⋯ , n t ≤ r 时 , D t 最后一列与前面某列相同 , ∣ D t ∣ = 0 t > r 时 , ∣ D t ∣ 为 A 的 r + 1 阶子式 , 根据秩的定义 , 同样 ∣ D t ∣ = 0 展开 ∣ D t ∣ 最后一列 , 得 a 1 t A 1 + a 2 t A 2 + ⋯ + a r t A r + a k t ∣ D ∣ = 0 A 1 , A 2 , ⋯ , A r 分别为 a 1 t , a 2 t , ⋯ , a r t 的代数余子式 , 取值与 t 无关 ∣ D ∣ = 0 ⇒ a k t = − ∣ D ∣ A 1 a 1 t − ∣ D ∣ A 2 a 2 t − ⋯ − ∣ D ∣ A r a r t , t = 1 , 2 , ⋯ , n 则 ( a k 1 , a k 2 , ⋯ , a kn ) = − ∣ D ∣ A 1 ( a 11 , a 12 , ⋯ , a 1 n ) − ⋯ − ∣ D ∣ A r ( a r 1 , a r 2 , ⋯ , a r n ) 即 α k = − ∣ D ∣ A 1 α 1 − ∣ D ∣ A 2 α 2 − ⋯ − ∣ D ∣ A r α r α k 可由 α 1 , α 2 , ⋯ , α r 线性表示 A → A T , 则可证关于列向量的结论
推论1 向量组线性相关的矩阵判别法
设 α 1 , α 2 , ⋯ , α s \alpha_1, \alpha_2, \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 为一 n n n 维列向量组, 令
A = ( α 1 , α 2 , ⋯ , α s ) A = (\alpha_1, \alpha_2, \cdots , \alpha_s)
A = ( α 1 , α 2 , ⋯ , α s )
为 n × s n \times s n × s 矩阵,
则 α 1 , α 2 , ⋯ , α s \alpha_1, \alpha_2, \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 线性相关的充要条件是 r ( A ) < s r(A) < s r ( A ) < s ,
线性无关的充要条件是 r ( A ) = s r(A) = s r ( A ) = s
特别地, 当 s = n s = n s = n 时, 线性相关充要条件为 ∣ A ∣ = 0 \left | A \right | = 0 ∣ A ∣ = 0
推论2 m > n m > n m > n 时, m m m 个n n n 维向量一定线性相关
3.2.3 向量组的秩
定义2 如果向量组 A A A 中部分组 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 满足条件
α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 线性无关
向量组 A A A 中每个向量都可由 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 线性表示
则称 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 为向量组 A A A 的一个最大无关组或极大无关组
一个向量组的最大无关组与该向量组等价, 且线性无关向量组最大无关组为它本身
例
向量组 α 1 = ( 1 , 0 , 0 ) , α 2 = ( 1 , 1 , 0 ) , α 3 = ( 2 , 1 , 0 ) \alpha_1 = (1, 0, 0), \alpha_2 = (1, 1, 0), \alpha_3 = (2, 1, 0) α 1 = ( 1 , 0 , 0 ) , α 2 = ( 1 , 1 , 0 ) , α 3 = ( 2 , 1 , 0 ) 中, α 1 , α 2 \alpha_1, \alpha_2 α 1 , α 2 线性无关,
而 α 3 = α 1 + α 2 \alpha_3 = \alpha_1 + \alpha_2 α 3 = α 1 + α 2 , 所以 α 1 , α 2 \alpha_1, \alpha_2 α 1 , α 2 为向量组的一个最大无关组,
同理 α 1 , α 3 \alpha_1, \alpha_3 α 1 , α 3 和 α 2 , α 3 \alpha_2, \alpha_3 α 2 , α 3 也为向量组的最大无关组
定理5 由有限个行向量 α 1 , α 2 , ⋯ , α s \alpha_1, \alpha_2, \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 组成的向量组的任一最大无关组中所含的向量个数均相等,
且等于下列矩阵的秩
A = ( α 1 α 2 ⋯ α s ) A = \begin{pmatrix} \alpha_1 \\ \alpha_2 \\ \cdots \\ \alpha_s \end{pmatrix}
A = α 1 α 2 ⋯ α s
证明
设向量组 α i 1 , α 1 2 , ⋯ , α i k 为向量组 α 1 , α 2 , ⋯ , α s 的任一最大无关组 令 B = ( α i 1 α i 2 ⋮ α i k ) 因为 α i 1 , α 1 2 , ⋯ , α i k 线性无关 , 由推论 1 得 , r ( B ) = k 又 B 的行向量都是 A 的行向量 , 则 B 的子式 , 要么是 A 的子式 , 要么与 A 的子式相差一个符号 则 B 的不为零的子式最高阶数小于或等于 A 的不为零子式的最高阶数 , 即 k ≤ r ( A ) 由于 α i 1 , α 1 2 , ⋯ , α i k 为向量组 α 1 , α 2 , ⋯ , α s 的一个最大无关组 , 则对于每个 a j ( j ≠ i 1 , i 2 , ⋯ , i k ) 有 a j = l j 1 α i 1 + l j 2 α i 2 + ⋯ + l j k α i k A → r j + ( r i 1 , r i 2 , ⋯ , r i k ) × ( − l j 1 , − l j 2 , ⋯ , − l j k ) , 则第 j 行化为零 , 通过若干次初等变换 , s − k 行全为零 , 从而 r ( A ) ≤ k k ≤ r ( A ) 且 r ( A ) ≤ k , 则 k = r ( A ) , 即向量组的任一最大无关组中所含的向量个数均相等 , 且等于矩阵 A 的秩 \begin{aligned}
& 设向量组 \alpha_{i_1}, \alpha_{1_2}, \cdots , \alpha_{i_k} 为向量组 \alpha_1, \alpha_2, \cdots , \alpha_s 的任一最大无关组 \\
& \ \\
& 令 \ B = \begin{pmatrix} \alpha_{i_1} \\ \alpha_{i_2} \\ \vdots \\ \alpha_{i_k} \end{pmatrix} \\
& \ \\
& 因为 \alpha_{i_1}, \alpha_{1_2}, \cdots , \alpha_{i_k} 线性无关, 由推论1得, r(B) = k \\
& 又B的行向量都是A的行向量, 则B的子式, 要么是A的子式, 要么与A的子式相差一个符号 \\
& 则B的不为零的子式最高阶数小于或等于A的不为零子式的最高阶数, 即 k \le r(A) \\
& \ \\
& 由于 \alpha_{i_1}, \alpha_{1_2}, \cdots , \alpha_{i_k} 为向量组 \alpha_1, \alpha_2, \cdots , \alpha_s 的一个最大无关组,
则对于每个a_j \ (j \ne i_1, i_2, \cdots , i_k) \\
& 有 \ a_j = l_{j1} \alpha_{i_1} + l_{j2} \alpha_{i_2} + \cdots + l_{jk} \alpha_{i_k} \\
& \ \\
& A \xrightarrow[]{r_j + (r_{i_1}, r_{i_2}, \cdots , r_{i_k}) \times (-l_{j1}, -l_{j2}, \cdots , -l_{jk})} , 则第 j 行化为零
\ , \ 通过若干次初等变换, s - k 行全为零, 从而r(A) \le k \\
& \ \\
& k \le r(A) 且 r(A) \le k, 则k = r(A), 即向量组的任一最大无关组中所含的向量个数均相等, 且等于矩阵A的秩
\end{aligned}
设向量组 α i 1 , α 1 2 , ⋯ , α i k 为向量组 α 1 , α 2 , ⋯ , α s 的任一最大无关组 令 B = α i 1 α i 2 ⋮ α i k 因为 α i 1 , α 1 2 , ⋯ , α i k 线性无关 , 由推论 1 得 , r ( B ) = k 又 B 的行向量都是 A 的行向量 , 则 B 的子式 , 要么是 A 的子式 , 要么与 A 的子式相差一个符号 则 B 的不为零的子式最高阶数小于或等于 A 的不为零子式的最高阶数 , 即 k ≤ r ( A ) 由于 α i 1 , α 1 2 , ⋯ , α i k 为向量组 α 1 , α 2 , ⋯ , α s 的一个最大无关组 , 则对于每个 a j ( j = i 1 , i 2 , ⋯ , i k ) 有 a j = l j 1 α i 1 + l j 2 α i 2 + ⋯ + l jk α i k A r j + ( r i 1 , r i 2 , ⋯ , r i k ) × ( − l j 1 , − l j 2 , ⋯ , − l jk ) , 则第 j 行化为零 , 通过若干次初等变换 , s − k 行全为零 , 从而 r ( A ) ≤ k k ≤ r ( A ) 且 r ( A ) ≤ k , 则 k = r ( A ) , 即向量组的任一最大无关组中所含的向量个数均相等 , 且等于矩阵 A 的秩
定义3 向量组的最大无关组中所含向量的个数称向量组的秩
定理6 矩阵 A A A 的秩等于它行向量组的秩, 也等于它列向量组的秩
例
判断向量组 α 1 = ( 1 , 4 , 1 , 0 ) T , α 2 = ( 2 , 1 , − 1 , − 3 ) T , α 3 = ( 1 , 0 , − 3 , − 1 ) T , α 4 = ( 0 , 2 , − 6 , 3 ) T \alpha_1 = (1, 4, 1, 0)^T, \alpha_2 = (2, 1, -1, -3)^T, \alpha_3 = (1, 0, -3, -1)^T, \alpha_4 = (0, 2, -6, 3)^T α 1 = ( 1 , 4 , 1 , 0 ) T , α 2 = ( 2 , 1 , − 1 , − 3 ) T , α 3 = ( 1 , 0 , − 3 , − 1 ) T , α 4 = ( 0 , 2 , − 6 , 3 ) T
是否线性相关, 并求它的秩
构建矩阵 A = ( α 1 , α 2 , α 3 , α 4 ) = ( 1 2 1 0 4 1 0 2 1 − 1 − 3 − 6 0 − 3 − 1 3 ) A → ⋯ ⋯ ( 1 2 1 0 0 − 3 − 1 3 0 0 − 3 − 9 0 0 0 0 ) r ( A ) = 3 < 4 , 则向量组线性相关 , 它的秩为 3 \begin{aligned}
& 构建矩阵 \\
& A = (\alpha_1, \alpha_2, \alpha_3, \alpha_4) = \begin{pmatrix}
1 & 2 & 1 & 0 \\
4 & 1 & 0 & 2 \\
1 & -1 & -3 & -6 \\
0 & -3 & -1 & 3
\end{pmatrix} \\
& A \xrightarrow[\cdots]{\cdots} \begin{pmatrix}
1 & 2 & 1 & 0 \\
0 & -3 & -1 & 3 \\
0 & 0 & -3 & -9 \\
0 & 0 & 0 & 0
\end{pmatrix} \\
& r(A) = 3 < 4, 则向量组线性相关, 它的秩为3
\end{aligned}
构建矩阵 A = ( α 1 , α 2 , α 3 , α 4 ) = 1 4 1 0 2 1 − 1 − 3 1 0 − 3 − 1 0 2 − 6 3 A ⋯ ⋯ 1 0 0 0 2 − 3 0 0 1 − 1 − 3 0 0 3 − 9 0 r ( A ) = 3 < 4 , 则向量组线性相关 , 它的秩为 3
例
求上述向量组的一个最大无关组
B = ( 1 2 1 0 0 − 3 − 1 3 0 0 − 3 − 9 0 0 0 0 ) B 左上角的三阶子式不为零 , 则 B 前三列三个列向量 α 1 , α 2 , α 3 线性无关 即 α 1 , α 2 , α 3 为向量组 α 1 , α 2 , α 3 , α 4 的一个最大无关组 B = \begin{pmatrix}
1 & 2 & 1 & 0 \\
0 & -3 & -1 & 3 \\
0 & 0 & -3 & -9 \\
0 & 0 & 0 & 0
\end{pmatrix} \\
\ \\
\begin{aligned}
& B左上角的三阶子式不为零, 则B前三列三个列向量 \alpha_1, \alpha_2, \alpha_3 线性无关 \\
& 即 \alpha_1, \alpha_2, \alpha_3 为向量组 \alpha_1, \alpha_2, \alpha_3, \alpha_4 的一个最大无关组
\end{aligned}
B = 1 0 0 0 2 − 3 0 0 1 − 1 − 3 0 0 3 − 9 0 B 左上角的三阶子式不为零 , 则 B 前三列三个列向量 α 1 , α 2 , α 3 线性无关 即 α 1 , α 2 , α 3 为向量组 α 1 , α 2 , α 3 , α 4 的一个最大无关组
定理7 若线性无关向量组 α 1 , α 2 , ⋯ , α s \alpha_1, \alpha_2, \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 可由向量组 β 1 , β 2 , ⋯ , β t \beta_1, \beta_2, \cdots , \beta_t β 1 , β 2 , ⋯ , β t 线性表示, 则 s ≤ t s \le t s ≤ t
证明
设 n 维列向量 α i , β j ( i = 1 , 2 , ⋯ , s ; j = 1 , 2 , ⋯ , t ) , 令 A = ( α 1 , α 2 , ⋯ , α s ) , B = ( α 1 , α 2 , ⋯ , α s , β 1 , β 2 , ⋯ , β t ) 由于 A 的任一子式都为 B 的一个子式 , 咕 r ( A ) ≤ r ( B ) 又 α 1 , α 2 , ⋯ , α s 线性无关 , 则 r ( A ) = s ≤ r ( B ) 又 a l p h a 1 , α 2 , ⋯ , α s 可由 β 1 . β 2 , ⋯ , β t 线性表示 , 则 B = ( α 1 , α 2 , ⋯ , α s , β 1 , β 2 , ⋯ , β t ) → C = ( 0 , 0 , ⋯ , 0 , β 1 , β 2 , ⋯ , β t ) 则 r ( B ) = r ( C ) ≤ t , s ≤ t \begin{aligned}
& 设n维列向量 \alpha_i, \beta_j \ (i = 1, 2, \cdots , s \ ; \ j = 1, 2, \cdots , t) , 令 \\
& A = (\alpha_1, \alpha_2, \cdots , \alpha_s) \ , \ B = (\alpha_1, \alpha_2, \cdots , \alpha_s, \beta_1, \beta_2, \cdots , \beta_t) \\
& \ \\
& 由于A的任一子式都为B的一个子式, 咕 r(A) \le r(B) \\
& 又 \alpha_1, \alpha_2, \cdots , \alpha_s 线性无关, 则r(A) = s \le r(B) \\
& \ \\
& 又 alpha_1, \alpha_2, \cdots , \alpha_s 可由 \beta_1. \beta_2, \cdots , \beta_t 线性表示, 则 \\
& B = (\alpha_1, \alpha_2, \cdots , \alpha_s, \beta_1, \beta_2, \cdots , \beta_t) \rightarrow
C = (\mathbf{0}, \mathbf{0}, \cdots , \mathbf{0}, \beta_1, \beta_2, \cdots , \beta_t) \\
& 则 r(B) = r(C) \le t, \ s \le t
\end{aligned}
设 n 维列向量 α i , β j ( i = 1 , 2 , ⋯ , s ; j = 1 , 2 , ⋯ , t ) , 令 A = ( α 1 , α 2 , ⋯ , α s ) , B = ( α 1 , α 2 , ⋯ , α s , β 1 , β 2 , ⋯ , β t ) 由于 A 的任一子式都为 B 的一个子式 , 咕 r ( A ) ≤ r ( B ) 又 α 1 , α 2 , ⋯ , α s 线性无关 , 则 r ( A ) = s ≤ r ( B ) 又 a lp h a 1 , α 2 , ⋯ , α s 可由 β 1 . β 2 , ⋯ , β t 线性表示 , 则 B = ( α 1 , α 2 , ⋯ , α s , β 1 , β 2 , ⋯ , β t ) → C = ( 0 , 0 , ⋯ , 0 , β 1 , β 2 , ⋯ , β t ) 则 r ( B ) = r ( C ) ≤ t , s ≤ t
定理7等价表示
向量组 α 1 , α 2 , ⋯ , α s \alpha_1, \alpha_2, \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 可由向量组 β 1 , β 2 , ⋯ , β t \beta_1, \beta_2, \cdots , \beta_t β 1 , β 2 , ⋯ , β t 线性表示, 且 s > t s > t s > t ,
则向量组 α 1 , α 2 , ⋯ , α s \alpha_1, \alpha_2, \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 线性相关
推论3 设向量组秩为 r r r 向量组中任意多余 r r r 个向量构成的向量组一定线性相关,
从而向量组中任意 r r r 个线性无关的向量都构成向量组的一个最大无关组
推论4 向量组任一线性无关部分组都可由扩充为向量组的一个最大无关组
推论5 若两个线性无关向量组 &\alpha_1, \alpha_2, \cdots , \alpha_s$ 和 β 1 , β 2 , d o t s , β t \beta_1, \beta_2, \ dots , \beta_t β 1 , β 2 , d o t s , β t , 则 s = t s = t s = t
推论6 向量组 A A A 与向量组 B B B 等价, 则它们有相同的秩
例
向量组 α 1 , α 2 , α 3 \alpha_1, \alpha_2, \alpha_3 α 1 , α 2 , α 3 线性相关, 向量组 α 2 , α 3 , α 4 \alpha_2, \alpha_3, \alpha_4 α 2 , α 3 , α 4 线性无关, 证明
α 1 \alpha_1 α 1 能有 α 2 , α 3 \alpha_2, \alpha_3 α 2 , α 3 线性表示
α 4 \alpha_4 α 4 不能由 α 1 , α 2 , α 3 \alpha_1, \alpha_2, \alpha_3 α 1 , α 2 , α 3 线性表示
证明
α 2 , α 3 , α 4 线性无关 , 则由定理 2 , α 2 , α 3 线性无关 又 α 1 , α 2 , α 3 线性相关 , 由定理 3 , α 1 能由 α 2 , α 3 线性表示 反证法 : 假设 α 4 能由 α 1 , α 2 , α 3 线性表示 , 又 α 1 能由 α 2 , α 3 线性表示 则 α 4 能有 α 2 , α 3 线性表示 , 与 α 2 , α 3 , α 4 线性无关相矛盾 \begin{aligned}
& \alpha_2, \alpha_3, \alpha_4 线性无关, 则由定理2, \alpha_2, \alpha_3 线性无关 \\
& 又 \alpha_1, \alpha_2, \alpha_3 线性相关, 由定理3, \alpha_1 能由 \alpha_2, \alpha_3线性表示 \\
& \ \\
& 反证法: \ 假设 \alpha_4 能由 \alpha_1, \alpha_2, \alpha_3 线性表示, 又 \alpha_1 能由 \alpha_2, \alpha_3 线性表示 \\
& 则 \alpha_4 能有 \alpha_2, \alpha_3 线性表示, 与 \alpha_2, \alpha_3, \alpha_4 线性无关相矛盾
\end{aligned}
α 2 , α 3 , α 4 线性无关 , 则由定理 2 , α 2 , α 3 线性无关 又 α 1 , α 2 , α 3 线性相关 , 由定理 3 , α 1 能由 α 2 , α 3 线性表示 反证法 : 假设 α 4 能由 α 1 , α 2 , α 3 线性表示 , 又 α 1 能由 α 2 , α 3 线性表示 则 α 4 能有 α 2 , α 3 线性表示 , 与 α 2 , α 3 , α 4 线性无关相矛盾
定理8 若向量组线性无关, 则在各向量中相应增加分量后, 所得向量组仍线性无关
设 s 个 m 维向量 α 1 , α 2 , ⋯ , α s 线性无关 , 在每个向量中增加 n − m 个分量后得到 n 维向量组 β 1 , β 2 , ⋯ , β s 先证明分量都添加在各个 α i 后面是结论成立 , 即若 α i = ( a i 1 , a i 2 , ⋯ , a i m ) T 则 β i = ( a i 1 , a i 2 , ⋯ , a i m , a i , a m + 1 , ⋯ , a i n ) T , i = 1 , 2 , ⋯ , s 设 x 1 β 1 + x 2 β 2 ⋯ + x s β s = 0 展开得 { a 11 x 1 + a 21 x 2 + ⋯ + a s 1 x s = 0 a 12 x 1 + a 22 x 2 + ⋯ + a s 2 x s = 0 ⋯ ⋯ ⋯ ⋯ a 1 m x 1 + a 2 m x 2 + ⋯ + a s m x s = 0 a 1 , m + 1 x 1 + a 2 , m + 1 x 2 + ⋯ + a s , m + 1 x s = 0 ⋯ ⋯ ⋯ ⋯ a 1 n x 1 + a 2 n x 2 + ⋯ + a s n x s = 0 则方程组前 m 个方程可写为 x 1 α 1 + x 2 α 2 + ⋯ + x s α s = 0 又 α 1 , α 2 , ⋯ , α s 线性无关 , 则方程只有零解 , 即方程组只有零解 故向量组 β 1 , β 2 , ⋯ , β s 线性无关 若分量加在 α i 个分量之间 , 定理仍成立 \begin{aligned}
& 设s个m维向量 \alpha_1, \alpha_2, \cdots , \alpha_s 线性无关, \ 在每个向量中增加n - m个分量后得到n维向量组 \beta_1, \beta_2, \cdots , \beta_s \\
& \ \\
& 先证明分量都添加在各个\alpha_i后面是结论成立, 即若\alpha_i = (a_{i1}, a_{i2}, \cdots , a_{im})^T \\
& 则 \ \beta_i = (a_{i1}, a_{i2}, \cdots , a_{im}, a_i, a_{m + 1}, \cdots , a_{in})^T \ , \ i = 1, 2, \cdots , s \\
& \ \\
& 设 \ x_1 \beta_1 + x_2 \beta_2 \cdots + x_s \beta_s = \mathbf{0} \\
& 展开得 \ \begin{cases}
a_{11} x_1 + a_{21} x_2 + \cdots + a_{s1} x_s = 0 \\
a_{12} x_1 + a_{22} x_2 + \cdots + a_{s2} x_s = 0 \\
\cdots \cdots \cdots \cdots \\
a_{1m} x_1 + a_{2m} x_2 + \cdots + a_{sm} x_s = 0 \\
a_{1, m + 1} x_1 + a_{2, m + 1} x_2 + \cdots + a_{s, m + 1} x_s = 0 \\
\cdots \cdots \cdots \cdots \\
a_{1n} x_1 + a_{2n} x_2 + \cdots + a_{sn} x_s = 0
\end{cases} \\
& 则方程组前m个方程可写为 \ x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_s \alpha_s = \mathbf{0} \\
& \ \\
& 又 \alpha_1, \alpha_2, \cdots , \alpha_s 线性无关, 则方程只有零解, 即方程组只有零解 \\
& 故向量组 \beta_1, \beta_2, \cdots , \beta_s 线性无关 \\
& \ \\
& 若分量加在 \alpha_i 个分量之间, 定理仍成立
\end{aligned}
设 s 个 m 维向量 α 1 , α 2 , ⋯ , α s 线性无关 , 在每个向量中增加 n − m 个分量后得到 n 维向量组 β 1 , β 2 , ⋯ , β s 先证明分量都添加在各个 α i 后面是结论成立 , 即若 α i = ( a i 1 , a i 2 , ⋯ , a im ) T 则 β i = ( a i 1 , a i 2 , ⋯ , a im , a i , a m + 1 , ⋯ , a in ) T , i = 1 , 2 , ⋯ , s 设 x 1 β 1 + x 2 β 2 ⋯ + x s β s = 0 展开得 ⎩ ⎨ ⎧ a 11 x 1 + a 21 x 2 + ⋯ + a s 1 x s = 0 a 12 x 1 + a 22 x 2 + ⋯ + a s 2 x s = 0 ⋯⋯⋯⋯ a 1 m x 1 + a 2 m x 2 + ⋯ + a s m x s = 0 a 1 , m + 1 x 1 + a 2 , m + 1 x 2 + ⋯ + a s , m + 1 x s = 0 ⋯⋯⋯⋯ a 1 n x 1 + a 2 n x 2 + ⋯ + a s n x s = 0 则方程组前 m 个方程可写为 x 1 α 1 + x 2 α 2 + ⋯ + x s α s = 0 又 α 1 , α 2 , ⋯ , α s 线性无关 , 则方程只有零解 , 即方程组只有零解 故向量组 β 1 , β 2 , ⋯ , β s 线性无关 若分量加在 α i 个分量之间 , 定理仍成立
推论7 若向量组线性相关, 则在个向量中减少响应和分量之后向量组仍线性相关
3.3 向量空间
3.3.1 向量空间
设 S S S 为由 n n n 维向量组成的集合, 若对任意 α , β ∈ S \alpha, \beta \in S α , β ∈ S , 有 α + β ∈ S \alpha + \beta \in S α + β ∈ S ,则称集合 S S S 关于向量的加法封闭
若对于任意 α ∈ S , k ∈ R \alpha \in S, k \in R α ∈ S , k ∈ R , 有 k α ∈ S k \alpha \in S k α ∈ S , 则称集合 S S S 关于向量的数乘封闭
定义1 设 V V V 为 n n n 维向量组成的非空集合, 若 V V V 关于向量的加法和数乘都封闭, 则称 V V V 为向量空间
全体 n n n 维向量的集合就是一个向量空间, 称为 n n n 维向量空间, 记作 R n R^n R n
平面和空间中向量可分别由二维和三位表示, 故 R 2 , R 3 R^2, \ R^3 R 2 , R 3 分别为通常都二维和三维空间
例
判断下列哪些是向量空间
A = { ( a 1 , 0 , ⋯ , 0 ) ∣ a 1 ∈ R } B = { ( a 1 , 1 , 0 , ⋯ , 0 ) ∣ a 1 ∈ R } C = { ( a 1 , a 2 , ⋯ , a n ) ∣ a 1 + a 2 + ⋯ + a n = 0 , a i ∈ R , i = 1 , 2 , ⋯ , n } \begin{aligned}
& A = \{ (a_1, 0, \cdots , 0) | a_1 \in R \} \\
& B = \{ (a_1, 1, 0, \cdots , 0) | a_1 \in R \} \\
& C = \{ (a_1, a_2, \cdots , a_n) | a_1 + a_2 + \cdots + a_n = 0, \ a_i \in R, \ i = 1, 2, \cdots , n \}
\end{aligned}
A = {( a 1 , 0 , ⋯ , 0 ) ∣ a 1 ∈ R } B = {( a 1 , 1 , 0 , ⋯ , 0 ) ∣ a 1 ∈ R } C = {( a 1 , a 2 , ⋯ , a n ) ∣ a 1 + a 2 + ⋯ + a n = 0 , a i ∈ R , i = 1 , 2 , ⋯ , n }
解
A 是向量空间 , ∀ α = ( a , 0 , ⋯ , 0 ) , β = ( b , 0 , ⋯ , 0 ) , k ∈ R α + β = ( a + b , 0 , ⋯ , 0 ) ∈ A k α = ( k a , 0 , ⋯ , 0 ) ∈ A 即 A 关于向量的加法和数乘都封闭 B 不是向量空间 , α = ( a , 1 , 0 , ⋯ , 0 ) , β = ( b , 1 , 0 , ⋯ , 0 ) α + β = ( a + b , 2 , 0 , ⋯ , 0 ) ∉ B 即 B 关于向量加法不封闭 C 是向量空间 , ∀ α = ( a 1 , a 2 , ⋯ , α n ) , β = ( b 1 , b 2 , ⋯ , b n ) 其中 a 1 + a 2 + ⋯ + a n = 0 , b 1 + b 2 + ⋯ + b n = 0 , 有 α + β = ( a 1 + b 1 , a 2 + b 2 , ⋯ , a n + b n ) 且 a 1 + b 1 + a 2 + b 2 + ⋯ + a n + b n = ( a 1 + a 2 + ⋯ + a n ) + ( b 1 + b 2 + ⋯ + b n ) = 0 即 α + β ∈ C 又 ∀ k , k a 1 + k a 2 + ⋯ + k a n = k ( a 1 + a 2 + ⋯ + a n ) = 0 k α = ( k a 1 , k a 2 , ⋯ , k a n ) ∈ C 即 k α ∈ C , 因此 C 关于向量的加法和数乘都封闭 \begin{aligned}
& A是向量空间, \forall \ \alpha = (a, 0, \cdots , 0), \ \beta = (b, 0, \cdots , 0), \ k \in R \\
& \alpha + \beta = (a + b, 0, \cdots , 0) \in A \\
& k \alpha = (ka, 0, \cdots , 0) \in A \\
& 即A关于向量的加法和数乘都封闭 \\
& \ \\
& B不是向量空间, \ \alpha = (a, 1, 0, \cdots , 0), \ \beta = (b, 1, 0, \cdots , 0) \\
& \alpha + \beta = (a + b, 2, 0, \cdots , 0) \notin B \\
& 即B关于向量加法不封闭 \\
& \ \\
& C是向量空间, \forall \ \alpha = (a_1, a_2, \cdots , \alpha_n) , \ \beta = (b_1, b_2, \cdots , b_n) \\
& 其中 a_1 + a_2 + \cdots + a_n = 0\ , \ b_1 + b_2 + \cdots + b_n = 0 , 有 \\
& \alpha + \beta = (a_1 + b_1, a_2 + b_2, \cdots , a_n + b_n) \\
& 且 a_1 + b_1 + a_2 + b_2 + \cdots + a_n + b_n = (a_1 + a_2 + \cdots + a_n) + (b_1 + b_2 + \cdots + b_n) = 0 \\
& 即 \alpha + \beta \in C \\
& 又 \forall k \ , k a_1 + k a_2 + \cdots + k a_n = k (a_1 + a_2 + \cdots + a_n) = 0 \\
& k \alpha = (k a_1, k a_2, \cdots , k a_n) \in C \\
& 即 k \alpha \in C, 因此C关于向量的加法和数乘都封闭
\end{aligned}
A 是向量空间 , ∀ α = ( a , 0 , ⋯ , 0 ) , β = ( b , 0 , ⋯ , 0 ) , k ∈ R α + β = ( a + b , 0 , ⋯ , 0 ) ∈ A k α = ( ka , 0 , ⋯ , 0 ) ∈ A 即 A 关于向量的加法和数乘都封闭 B 不是向量空间 , α = ( a , 1 , 0 , ⋯ , 0 ) , β = ( b , 1 , 0 , ⋯ , 0 ) α + β = ( a + b , 2 , 0 , ⋯ , 0 ) ∈ / B 即 B 关于向量加法不封闭 C 是向量空间 , ∀ α = ( a 1 , a 2 , ⋯ , α n ) , β = ( b 1 , b 2 , ⋯ , b n ) 其中 a 1 + a 2 + ⋯ + a n = 0 , b 1 + b 2 + ⋯ + b n = 0 , 有 α + β = ( a 1 + b 1 , a 2 + b 2 , ⋯ , a n + b n ) 且 a 1 + b 1 + a 2 + b 2 + ⋯ + a n + b n = ( a 1 + a 2 + ⋯ + a n ) + ( b 1 + b 2 + ⋯ + b n ) = 0 即 α + β ∈ C 又 ∀ k , k a 1 + k a 2 + ⋯ + k a n = k ( a 1 + a 2 + ⋯ + a n ) = 0 k α = ( k a 1 , k a 2 , ⋯ , k a n ) ∈ C 即 k α ∈ C , 因此 C 关于向量的加法和数乘都封闭
3.3.2 子空间
定义2 设 W W W 是向量空间 V V V 的一个非空子集, 若 W W W 关于向量的加法和数乘都封闭, 称 W W W 为 V V V 的一个子空间
向量空间 V V V 的非空子集 W W W 是 V V V 的向量子空间当且仅当 ∀ α , β ∈ W , k , l ∈ R \forall \alpha, \beta \in W, \ k, l \in R ∀ α , β ∈ W , k , l ∈ R , 有 k α + l β ∈ W k \alpha + l \beta \in W k α + lβ ∈ W
向量空间 V V V 本身和 V V V 中零向量组成的零空间都是 V V V 的子空间, 这两个子空间称为平凡子空间, 它们分别构成 V V V 的最大和最小子空间
$V$ 其他子空间称为非平凡子空间
上述例子中 A , C A, C A , C 都是 R n R^n R n 的子空间, 同理
W 1 = { ( a 1 , a 2 , ⋯ , a n − 1 , ∑ i = 1 n − 1 a i ) ∣ a i ∈ R , i = 1 , 2 , ⋯ , n − 1 } W 2 = { ( a 1 , a 2 , ⋯ , a n ) ∣ a 1 = a 2 = ⋯ = a n ∈ R } W 3 = { ( a , a + b , a + 2 b , ⋯ , a + ( n − 1 ) b ∣ a , b ∈ R ) } \begin{aligned}
& W_1 = \{ (a_1, a_2, \cdots, a_{n - 1}, \sum_{i = 1}^{n - 1} a_i) \ | \ a_i \in R, i = 1, 2, \cdots, n - 1 \} \\
& W_2 = \{ (a_1, a_2, \cdots , a_n) \ | \ a_1 = a_2 = \cdots = a_n \in R \} \\
& W_3 = \{ (a, a + b, a + 2b, \cdots , a + (n - 1)b \ | \ a, b \in R) \}
\end{aligned}
W 1 = {( a 1 , a 2 , ⋯ , a n − 1 , i = 1 ∑ n − 1 a i ) ∣ a i ∈ R , i = 1 , 2 , ⋯ , n − 1 } W 2 = {( a 1 , a 2 , ⋯ , a n ) ∣ a 1 = a 2 = ⋯ = a n ∈ R } W 3 = {( a , a + b , a + 2 b , ⋯ , a + ( n − 1 ) b ∣ a , b ∈ R )}
都是 R n R^n R n 的子空间
设 V V V 是一个向量空间, α , α 2 , ⋯ , α r ∈ V \alpha_, \alpha_2, \cdots , \alpha_r \in V α , α 2 , ⋯ , α r ∈ V , 则
W = { k 1 α 2 + k 2 α 2 + ⋯ + k r α r ∣ k i ∈ R , i = 1 , 2 , ⋯ , r } W = \{ k_1 \alpha_2 + k_2 \alpha_2 + \cdots + k_r \alpha_r \ | \ k_i \in R, i =1, 2, \cdots , r \}
W = { k 1 α 2 + k 2 α 2 + ⋯ + k r α r ∣ k i ∈ R , i = 1 , 2 , ⋯ , r }
是 V V V 的子空间, 这个子空间称为由 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 生成的子空间, 记作 L ( α 1 , α 2 , ⋯ , α r ) L(\alpha_1, \alpha_2, \cdots , \alpha_r) L ( α 1 , α 2 , ⋯ , α r )
α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 称为这个子空间的一组生成元
对于 α ∈ V , L ( α ) = k α ∣ k ∈ R \alpha \in V, L(\alpha) = {k \alpha \ | \ k \in R} α ∈ V , L ( α ) = k α ∣ k ∈ R 是由 α \alpha α 生成的 V V V 的子空间
设 W 1 , W 2 W_1, W_2 W 1 , W 2 为向量空间 v v v 的两个子空间, 则 V V V 的子集
{ α ∣ α ∈ W 1 且 α ∈ W 2 } { α ∣ α = α 1 + α 2 , 其中 α 1 ∈ W 1 , α 2 ∈ W 2 } \{ \alpha \ | \ \alpha \in W_1 且 \alpha \in W_2 \} \\
\ \\
\{ \alpha \ | \ \alpha = \alpha_1 + \alpha_2 , 其中 \alpha_1 \in W_1, \alpha_2 \in W_2 \}
{ α ∣ α ∈ W 1 且 α ∈ W 2 } { α ∣ α = α 1 + α 2 , 其中 α 1 ∈ W 1 , α 2 ∈ W 2 }
都是 V V V 的子空间, 前者称两个子空间 W 1 , W 2 W_1, W_2 W 1 , W 2 的交, 记作 W 1 ∩ W 2 W_1 \cap W_2 W 1 ∩ W 2 ; 后者称两个子空间 W 1 , W 2 W_1, W_2 W 1 , W 2 的和, 记作 W 1 + W 2 W_1 + W_2 W 1 + W 2
0 ∈ w 1 , 0 ∈ W 2 ⇒ 0 ∈ W 1 ∩ W 2 \mathbf{0} \in w_1, \mathbf{0} \in W_2 \Rightarrow \mathbf{0} \in W_1 \cap W_2 0 ∈ w 1 , 0 ∈ W 2 ⇒ 0 ∈ W 1 ∩ W 2
∀ α , β ∈ W 1 ∩ W 2 , α + β ∈ W 1 ∩ W 2 \forall \alpha, \beta \in W_1 \cap W_2 \ , \ \alpha + \beta \in W_1 \cap W_2 ∀ α , β ∈ W 1 ∩ W 2 , α + β ∈ W 1 ∩ W 2
W 1 ∩ W 2 W_1 \cap W_2 W 1 ∩ W 2 关于向量的加法和数乘都封闭, 是 V V V 的子空间
W ! + W 2 W_! + W_2 W ! + W 2 也是 V V V 的子空间
3.3.3 向量空间的基与维数
定义3 设 V V V 为一个向量空间, α 1 , α 2 , ⋯ , α r ∈ V \alpha_1, \alpha_2, \cdots , \alpha_r \in V α 1 , α 2 , ⋯ , α r ∈ V , 若
α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 线性无关
V V V 的任一向量都可由 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 线性表示
则称向量组 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 为向量空间 V V V 的一组基, r r r 称为向量空间 V V V 的维数, 记作 d i m ( V ) = r dim(V) = r d im ( V ) = r
零空间的维度规定为零
把向量空间看做一个向量组, 则其基就是它的一个最大无关组, 其维数就是它的秩
向量空间可以有很多组基, 但每组基所含向量个数相同, 故向量空间维数唯一确定
例
证明 ε 1 = ( 1 , 0 , ⋯ , 0 ) , ε 2 = ( 0 , 1 , ⋯ , 0 ) , ⋯ , ε n = ( 0 , 0 , ⋯ , 1 ) \varepsilon_1 = (1, 0, \cdots , 0), \varepsilon_2 = (0, 1, \cdots , 0) , \cdots , \varepsilon_n = (0, 0, \cdots , 1) ε 1 = ( 1 , 0 , ⋯ , 0 ) , ε 2 = ( 0 , 1 , ⋯ , 0 ) , ⋯ , ε n = ( 0 , 0 , ⋯ , 1 )
为 R n R^n R n 的一组基, 从而得 R n R^n R n 的维数为 n n n
先证 ε 1 , ε 2 , ⋯ , ε n 线性无关 它们构成矩阵 E = ( ε 1 , ε 2 , ⋯ , ε n ) = ( 1 0 ⋯ 0 0 1 ⋯ 0 ⋮ ⋮ ⋮ 0 0 ⋯ 1 ) r ( E ) = n , 则向量组线性无关 对于 ∀ α ∈ R n , 设 α = ( a 1 , a 2 , ⋯ , a n ) α = a 1 ε 1 + a 2 ε 2 + ⋯ + a n ε 故 ε 1 , ε 2 , ⋯ , ε n 为向量空间 R n 的基 , 且 d i m ( R n ) = n \begin{aligned}
& 先证 \varepsilon_1, \varepsilon_2, \cdots , \varepsilon_n 线性无关 \\
& 它们构成矩阵 E = (\varepsilon_1, \varepsilon_2, \cdots , \varepsilon_n) = \begin{pmatrix}
1 & 0 & \cdots & 0 \\
0 & 1 & \cdots & 0 \\
\vdots & \vdots & & \vdots \\
0 & 0 & \cdots & 1
\end{pmatrix} \\
& r(E) = n, 则向量组线性无关 \\
& \ \\
& 对于 \forall \alpha \in R^n \ , \ 设 \alpha = (a_1, a_2, \cdots , a_n) \\
& \alpha = a_1 \varepsilon_1 + a_2 \varepsilon_2 + \cdots + a_n \varepsilon \\
& 故 \varepsilon_1, \varepsilon_2, \cdots , \varepsilon_n 为向量空间 R^n 的基, 且 dim(R^n) = n
\end{aligned}
先证 ε 1 , ε 2 , ⋯ , ε n 线性无关 它们构成矩阵 E = ( ε 1 , ε 2 , ⋯ , ε n ) = 1 0 ⋮ 0 0 1 ⋮ 0 ⋯ ⋯ ⋯ 0 0 ⋮ 1 r ( E ) = n , 则向量组线性无关 对于 ∀ α ∈ R n , 设 α = ( a 1 , a 2 , ⋯ , a n ) α = a 1 ε 1 + a 2 ε 2 + ⋯ + a n ε 故 ε 1 , ε 2 , ⋯ , ε n 为向量空间 R n 的基 , 且 d im ( R n ) = n
ε 1 , ε 2 , ⋯ , ε n \varepsilon_1, \varepsilon_2, \cdots , \varepsilon_n ε 1 , ε 2 , ⋯ , ε n 称为向量空间 R n R^n R n 的标准基
设 α 1 , α 2 , ⋯ , α m \alpha_1, \alpha_2, \cdots , \alpha_m α 1 , α 2 , ⋯ , α m 是 m m m 个 n n n 为向量,
V = L ( α 1 , α 2 , ⋯ , α m ) = { k 1 α 1 + k 2 α 2 + ⋯ + k m α m ∣ k i ∈ R , i = 1 , 2 , ⋯ , m } V = L(\alpha_1, \alpha_2, \cdots , \alpha_m) =
\{ k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_m \alpha_m \ | \ k_i \in R, i = 1, 2, \cdots , m \}
V = L ( α 1 , α 2 , ⋯ , α m ) = { k 1 α 1 + k 2 α 2 + ⋯ + k m α m ∣ k i ∈ R , i = 1 , 2 , ⋯ , m }
则向量组 α 1 , α 2 , ⋯ , α m \alpha_1, \alpha_2, \cdots , \alpha_m α 1 , α 2 , ⋯ , α m 的一个最大无关组就是 V V V 的一组基,
从而向量组 α 1 , α 2 , ⋯ , α m \alpha_1, \alpha_2, \cdots , \alpha_m α 1 , α 2 , ⋯ , α m 的秩就等于 V V V 的维数
定理1 设 V V V 是一个向量空间, d i m ( V ) = r dim(V) = r d im ( V ) = r , 则 V V V 中任意 r r r 个线性无关的向量都是 V V V 的一组基,
且 V V V 的任一多于 r r r 个向量的向量组一定线性相关
特别地, 任意 n n n 个线性无关的 n n n 维向量都是 R n R^n R n 的一组基
定理2 向量空间 V V V 的任一线性无关向量组都可以扩充为 V V V 的一组基, 特别地, V V V 的任一子空间的基都可扩充为 V V V 的基
3.3.4 向量在给定基下的坐标
设 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 是向量空间 V V V 的一组基, 则 V V V 中每个向量 α \alpha α 都可表示为
α = x 1 α 1 + x 2 α 2 + ⋯ + x r α r \alpha = x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_r \alpha_r
α = x 1 α 1 + x 2 α 2 + ⋯ + x r α r
且有序数组 x 1 , x 2 , ⋯ , x r x_1, x_2, \cdots , x_r x 1 , x 2 , ⋯ , x r 是唯一的
定义4 设 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 是向量空间 V V V 的一组基, α ∈ V \alpha \in V α ∈ V , 若
α = x 1 α 1 + x 2 α 2 + ⋯ + x r α r \alpha = x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_r \alpha_r
α = x 1 α 1 + x 2 α 2 + ⋯ + x r α r
则 r r r 维向量 ( x 1 , x 2 , ⋯ , x r ) (x_1, x_2, \cdots , x_r) ( x 1 , x 2 , ⋯ , x r ) 称为向量 α \alpha α 在基 a l p h a 1 , α 2 , ⋯ , α r alpha_1, \alpha_2, \cdots , \alpha_r a lp h a 1 , α 2 , ⋯ , α r 下的坐标
R n R^n R n 中任意向量在标准基下的坐标为它本身
例
设 α 1 = ( 1 , 1 , 1 ) T , α 2 = ( 1 , 1 , − 1 ) T , α 3 = ( 1 , − 1 , − 1 ) T \alpha_1 = (1, 1, 1)^T, \alpha_2 = (1, 1, -1)^T, \alpha_3 = (1, -1, -1)^T α 1 = ( 1 , 1 , 1 ) T , α 2 = ( 1 , 1 , − 1 ) T , α 3 = ( 1 , − 1 , − 1 ) T , 证明 α 1 , α 2 , α 3 \alpha_1, \alpha_2, \alpha_3 α 1 , α 2 , α 3 是向量空间 R 3 R^3 R 3 的一组基,
并求 β = ( 1 , 2 , 1 ) T \beta = (1, 2, 1)^T β = ( 1 , 2 , 1 ) T 在此基下的坐标
令 A = ( α 1 , α 2 , α 3 ) , 则 ∣ A ∣ = ∣ 1 1 1 1 1 − 1 1 − 1 − 1 ∣ = − 4 ≠ 0 故 α 1 , α 2 , α 3 线性无关 , 从而是 R 3 的一组基 令 β = x 1 α 1 + x 2 α 2 + x 3 α 3 , 即 ( 1 2 1 ) = x 1 ( 1 1 1 ) + x 2 ( 1 1 − 1 ) + x 3 ( 1 − 1 − 1 ) = ( x 1 + x 2 + x 3 x 1 + x 2 − x 3 x 1 − x 2 − x 3 ) 则有 { x 1 + x 2 + x 3 = 1 x 1 + x 2 − x 3 = 2 x 1 − x 2 − x 3 = 1 解得 x 1 = 1 , x 2 = 1 2 , x 3 = − 1 2 即 β 在基 α 1 , α 2 , α 3 下的坐标为 ( 1 , 1 2 , − 1 2 ) \begin{aligned}
& 令 A = (\alpha_1, \alpha_2, \alpha_3), 则 \\
& \left | A \right | = \begin{vmatrix}
1 & 1 & 1 \\
1 & 1 & -1 \\
1 & -1 & -1 \\
\end{vmatrix} = -4 \ne 0 \\
& 故 \alpha_1, \alpha_2, \alpha_3 线性无关, 从而是 R^3 的一组基 \\
& \ \\
& 令 \beta = x_1 \alpha_1 + x_2 \alpha_2 + x_3 \alpha_3 , 即 \\
& \begin{pmatrix} 1 \\ 2 \\ 1 \end{pmatrix} =
x_1 \begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix} +
x_2 \begin{pmatrix} 1 \\ 1 \\ -1 \end{pmatrix} +
x_3 \begin{pmatrix} 1 \\ -1 \\ -1 \end{pmatrix} =
\begin{pmatrix}
x_1 + x_2 + x_3 \\
x_1 + x_2 - x_3 \\
x_1 - x_2 - x_3
\end{pmatrix} \\
& 则有 \ \begin{cases}
x_1 + x_2 + x_3 = 1 \\
x_1 + x_2 - x_3 = 2 \\
x_1 - x_2 - x_3 = 1 \\
\end{cases} \\
& 解得 \ x_1 = 1, x_2 = \frac{1}{2}, x_3 = - \frac{1}{2} \\
& 即 \beta 在基 \alpha_1, \alpha_2, \alpha_3 下的坐标为 (1, \frac{1}{2}, - \frac{1}{2})
\end{aligned}
令 A = ( α 1 , α 2 , α 3 ) , 则 ∣ A ∣ = 1 1 1 1 1 − 1 1 − 1 − 1 = − 4 = 0 故 α 1 , α 2 , α 3 线性无关 , 从而是 R 3 的一组基 令 β = x 1 α 1 + x 2 α 2 + x 3 α 3 , 即 1 2 1 = x 1 1 1 1 + x 2 1 1 − 1 + x 3 1 − 1 − 1 = x 1 + x 2 + x 3 x 1 + x 2 − x 3 x 1 − x 2 − x 3 则有 ⎩ ⎨ ⎧ x 1 + x 2 + x 3 = 1 x 1 + x 2 − x 3 = 2 x 1 − x 2 − x 3 = 1 解得 x 1 = 1 , x 2 = 2 1 , x 3 = − 2 1 即 β 在基 α 1 , α 2 , α 3 下的坐标为 ( 1 , 2 1 , − 2 1 )
若 α , β \alpha, \beta α , β 坐标分别为 ( x 1 , x 2 , ⋯ , x r ) (x_1, x_2, \cdots , x_r) ( x 1 , x 2 , ⋯ , x r ) 及 ( y 1 , y 2 , ⋯ , y r ) (y_1, y_2, \cdots , y_r) ( y 1 , y 2 , ⋯ , y r ) , 则
( x 1 + y 1 , x 2 + y 2 , ⋯ , x r + y r ) = ( x 1 , x 2 , ⋯ , x r ) + ( y 1 , y 2 , ⋯ , y r ) (x_1 + y_1, x_2 + y_2, \cdots , x_r + y_r) = (x_1, x_2, \cdots , x_r) + (y_1, y_2, \cdots , y_r)
( x 1 + y 1 , x 2 + y 2 , ⋯ , x r + y r ) = ( x 1 , x 2 , ⋯ , x r ) + ( y 1 , y 2 , ⋯ , y r )
( λ x 1 , λ x 2 , ⋯ , λ x r ) = λ ( x 1 , x 2 , ⋯ , x r ) (\lambda x_1, \lambda x_2, \cdots , \lambda x_r) = \lambda (x_1, x_2, \cdots , x_r)
( λ x 1 , λ x 2 , ⋯ , λ x r ) = λ ( x 1 , x 2 , ⋯ , x r )
若向量 α \alpha α 在基 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 下坐标为 ( x 1 , x 2 , ⋯ , x r ) (x_1, x_2, \cdots , x_r) ( x 1 , x 2 , ⋯ , x r ) , 即
α = x 1 α 1 + x 2 α 2 + ⋯ + x r α r \alpha = x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_r \alpha_r
α = x 1 α 1 + x 2 α 2 + ⋯ + x r α r
矩阵符号记作
α = ( α 1 , α 2 , ⋯ , α r ) ( x 1 x 2 ⋮ x r ) \alpha = (\alpha_1, \alpha_2, \cdots , \alpha_r) \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_r \end{pmatrix}
α = ( α 1 , α 2 , ⋯ , α r ) x 1 x 2 ⋮ x r
3.3.5 基变换与坐标变换
设 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 和 β 1 , β 2 , ⋯ , β r \beta_1, \beta_2, \cdots , \beta_r β 1 , β 2 , ⋯ , β r 为 V V V 的两组基.
由基的定义得, β 1 , β 2 , ⋯ , β r \beta_1, \beta_2, \cdots , \beta_r β 1 , β 2 , ⋯ , β r 可以由 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 线性表示, 即
{ β 1 = a 11 α 1 + a 21 α 2 + ⋯ + a r 1 α r β 2 = a 12 α 1 + a 22 α 2 + ⋯ + a r 2 α r ⋯ ⋯ ⋯ ⋯ β r = a 1 r α 1 + a 2 r α 2 + ⋯ + a r r α r \begin{cases}
\beta_1 = a_{11} \alpha_1 + a_{21}\alpha_2 + \cdots + a_{r1} \alpha_r \\
\beta_2 = a_{12} \alpha_1 + a_{22}\alpha_2 + \cdots + a_{r2} \alpha_r \\
\cdots \cdots \cdots \cdots \\
\beta_r = a_{1r} \alpha_1 + a_{2r}\alpha_2 + \cdots + a_{rr} \alpha_r
\end{cases}
⎩ ⎨ ⎧ β 1 = a 11 α 1 + a 21 α 2 + ⋯ + a r 1 α r β 2 = a 12 α 1 + a 22 α 2 + ⋯ + a r 2 α r ⋯⋯⋯⋯ β r = a 1 r α 1 + a 2 r α 2 + ⋯ + a rr α r
写成矩阵的形式为
( β 1 , β 2 , ⋯ , β r ) = ( α 1 , α 2 , ⋯ , α r ) A (\beta_1, \beta_2, \cdots , \beta_r) = (\alpha_1, \alpha_2, \cdots , \alpha_r) A
( β 1 , β 2 , ⋯ , β r ) = ( α 1 , α 2 , ⋯ , α r ) A
其中
A = ( a 11 a 12 ⋯ a 1 r a 21 a 22 ⋯ a 2 r ⋮ ⋮ ⋮ a 1 r a r 2 ⋯ a r r ) A = \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1r} \\
a_{21} & a_{22} & \cdots & a_{2r} \\
\vdots & \vdots & & \vdots \\
a_{1r} & a_{r2} & \cdots & a_{rr}
\end{pmatrix}
A = a 11 a 21 ⋮ a 1 r a 12 a 22 ⋮ a r 2 ⋯ ⋯ ⋯ a 1 r a 2 r ⋮ a rr
矩阵 A A A 的第 i i i 列是 β i \beta_i β i 在基 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 下的坐标,
称 A A A 为有基 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 到基 β 1 , β 2 , ⋯ , β r \beta_1, \beta_2, \cdots , \beta_r β 1 , β 2 , ⋯ , β r 的过渡矩阵,
上式称为基变换公式
由于 β 1 , β 2 , ⋯ , β r \beta_1, \beta_2, \cdots , \beta_r β 1 , β 2 , ⋯ , β r 也是一组基, α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 能由其表示, 即
( α 1 , α 2 , ⋯ , α r ) = ( β 1 , β 2 , ⋯ , β r ) B (\alpha_1, \alpha_2, \cdots , \alpha_r) = (\beta_1, \beta_2, \cdots , \beta_r) B
( α 1 , α 2 , ⋯ , α r ) = ( β 1 , β 2 , ⋯ , β r ) B
从而
( β 1 , β 2 , ⋯ , β r ) = ( α 1 , α 2 , ⋯ , α r ) A = ( β 1 , β 2 , ⋯ , β r ) B A (\beta_1, \beta_2, \cdots , \beta_r) = (\alpha_1, \alpha_2, \cdots , \alpha_r) A = (\beta_1, \beta_2, \cdots , \beta_r) BA
( β 1 , β 2 , ⋯ , β r ) = ( α 1 , α 2 , ⋯ , α r ) A = ( β 1 , β 2 , ⋯ , β r ) B A
由 β 1 , β 2 , ⋯ , β r \beta_1, \beta_2, \cdots , \beta_r β 1 , β 2 , ⋯ , β r 线性无关可得 B A = E BA = E B A = E , 即 B = A − 1 B = A^{-1} B = A − 1
设 V V V 中向量 α \alpha α 在基 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 和基 β 1 , β 2 , ⋯ , β r \beta_1, \beta_2, \cdots , \beta_r β 1 , β 2 , ⋯ , β r 中坐标分别为
( x 1 , x 2 , ⋯ , x r ) (x_1, x_2, \cdots , x_r) ( x 1 , x 2 , ⋯ , x r ) 和 ( y 1 , y 2 , ⋯ , y r ) (y_1, y_2, \cdots , y_r) ( y 1 , y 2 , ⋯ , y r ) , 即
α = ( α 1 , α 2 , ⋯ , α r ) ( x 1 x 2 ⋮ x r ) = ( β 1 , β 2 , ⋯ , β r ) ( y 1 y 2 ⋮ y r ) \alpha = (\alpha_1, \alpha_2, \cdots , \alpha_r) \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_r \end{pmatrix} =
(\beta_1, \beta_2, \cdots , \beta_r) \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_r \end{pmatrix}
α = ( α 1 , α 2 , ⋯ , α r ) x 1 x 2 ⋮ x r = ( β 1 , β 2 , ⋯ , β r ) y 1 y 2 ⋮ y r
代入得
α = ( α 1 , α 2 , ⋯ , α r ) ( x 1 x 2 ⋮ x r ) = ( α 1 , α 2 , ⋯ , α r ) A ( y 1 y 2 ⋮ y r ) \alpha = (\alpha_1, \alpha_2, \cdots , \alpha_r) \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_r \end{pmatrix} =
(\alpha_1, \alpha_2, \cdots , \alpha_r) A \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_r \end{pmatrix}
α = ( α 1 , α 2 , ⋯ , α r ) x 1 x 2 ⋮ x r = ( α 1 , α 2 , ⋯ , α r ) A y 1 y 2 ⋮ y r
向量坐标唯一, 可得
( x 1 x 2 ⋮ x r ) = A ( y 1 y 2 ⋮ y r ) \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_r \end{pmatrix} =
A \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_r \end{pmatrix}
x 1 x 2 ⋮ x r = A y 1 y 2 ⋮ y r
定理3 设 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 和 β 1 , β 2 , ⋯ , β r \beta_1, \beta_2, \cdots , \beta_r β 1 , β 2 , ⋯ , β r 是向量空间 V V V 的两组基,
由基 α 1 , α 2 , ⋯ , α r \alpha_1, \alpha_2, \cdots , \alpha_r α 1 , α 2 , ⋯ , α r 到基 β 1 , β 2 , ⋯ , β r \beta_1, \beta_2, \cdots , \beta_r β 1 , β 2 , ⋯ , β r 过渡矩阵为 A A A ,
向量 α \alpha α 在两组基坐标分别为 ( x 1 , x 2 , ⋯ , x r ) (x_1, x_2, \cdots , x_r) ( x 1 , x 2 , ⋯ , x r ) 和 ( y 1 , y 2 , ⋯ , y r ) (y_1, y_2, \cdots , y_r) ( y 1 , y 2 , ⋯ , y r ) , 则
( x 1 x 2 ⋮ x r ) = A ( y 1 y 2 ⋮ y r ) , 或 ( y 1 y 2 ⋮ y r ) = A − 1 ( x 1 x 2 ⋮ x r ) \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_r \end{pmatrix}
= A \begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_r \end{pmatrix}
\ , \ 或 \
\begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_r \end{pmatrix} =
A^{-1} \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_r \end{pmatrix}
x 1 x 2 ⋮ x r = A y 1 y 2 ⋮ y r , 或 y 1 y 2 ⋮ y r = A − 1 x 1 x 2 ⋮ x r
上式称为坐标变换公式
例
已知 β \beta β 在基 α 1 = ( 1 , 1 , 1 ) T , α 2 = ( 1 , 1 , − 1 ) T , α 3 = ( 1 , − 1 , − 1 ) T \alpha_1 = (1, 1, 1)^T, \alpha_2 = (1, 1, -1)^T, \alpha_3 = (1, -1, -1)^T α 1 = ( 1 , 1 , 1 ) T , α 2 = ( 1 , 1 , − 1 ) T , α 3 = ( 1 , − 1 , − 1 ) T 下的坐标为 ( 1 , 1 2 , − 1 2 ) (1, \frac{1}{2}, - \frac{1}{2}) ( 1 , 2 1 , − 2 1 ) ,
求它在标准基 ε 1 , ε 2 , ε 3 \varepsilon_1, \varepsilon_2, \varepsilon_3 ε 1 , ε 2 , ε 3 下的坐标
( α 1 , α 2 , α 3 ) = ( ε 1 , ε 2 , ε 3 ) ( 1 1 1 1 1 − 1 1 − 1 − 1 ) = ( ε 1 , ε 2 , ε 3 ) A A = ( 1 1 1 1 1 − 1 1 − 1 − 1 ) , 为由基 ε 1 , ε 2 , ε 3 到基 α 1 , α 2 , α 3 的过渡矩阵 则向量 β 在基 ε 1 , ε 2 , ε 3 下坐标为 ( x 1 x 2 x 3 ) = A ( 1 1 2 − 1 2 ) = ( 1 1 1 1 1 − 1 1 − 1 − 1 ) ( 1 1 2 − 1 2 ) = ( 1 2 1 ) \begin{aligned}
& (\alpha_1, \alpha_2, \alpha_3) = (\varepsilon_1, \varepsilon_2, \varepsilon_3) \begin{pmatrix}
1 & 1 & 1 \\
1 & 1 & -1 \\
1 & -1 & -1
\end{pmatrix}
= (\varepsilon_1, \varepsilon_2, \varepsilon_3) A \\
& \ \\
& A = \begin{pmatrix}
1 & 1 & 1 \\
1 & 1 & -1 \\
1 & -1 & -1
\end{pmatrix},
为由基 \varepsilon_1, \varepsilon_2, \varepsilon_3 到基 \alpha_1, \alpha_2, \alpha_3 的过渡矩阵 \\
& \ \\
& 则向量 \beta 在基 \varepsilon_1, \varepsilon_2, \varepsilon_3 下坐标为 \\
& \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix}
= A \begin{pmatrix} 1 \\ \frac{1}{2} \\ - \frac{1}{2} \end{pmatrix}
= \begin{pmatrix}
1 & 1 & 1 \\
1 & 1 & -1 \\
1 & -1 & -1
\end{pmatrix}
\begin{pmatrix} 1 \\ \frac{1}{2} \\ - \frac{1}{2} \end{pmatrix}
= \begin{pmatrix} 1 \\ 2 \\ 1 \end{pmatrix}
\end{aligned}
( α 1 , α 2 , α 3 ) = ( ε 1 , ε 2 , ε 3 ) 1 1 1 1 1 − 1 1 − 1 − 1 = ( ε 1 , ε 2 , ε 3 ) A A = 1 1 1 1 1 − 1 1 − 1 − 1 , 为由基 ε 1 , ε 2 , ε 3 到基 α 1 , α 2 , α 3 的过渡矩阵 则向量 β 在基 ε 1 , ε 2 , ε 3 下坐标为 x 1 x 2 x 3 = A 1 2 1 − 2 1 = 1 1 1 1 1 − 1 1 − 1 − 1 1 2 1 − 2 1 = 1 2 1
3.4 欧几里德空间
3.4.1 向量的内积
定义1 设 α = ( x 1 , x 2 , ⋯ , x n ) , β = ( y 1 , y 2 , ⋯ , y n ) \alpha = (x_1, x_2, \cdots , x_n), \beta = (y_1, y_2, \cdots , y_n) α = ( x 1 , x 2 , ⋯ , x n ) , β = ( y 1 , y 2 , ⋯ , y n ) 为两个 n n n 维向量, 则实数 x 1 y 1 + x 2 y 2 + ⋯ + x n y n x_1 y_1 + x_2 y_2 + \cdots + x_n y_n x 1 y 1 + x 2 y 2 + ⋯ + x n y n 称为向量 α , β \alpha, \beta α , β 的内积, 记作 ( α , β ) (\alpha, \beta) ( α , β ) , 即
( α , β ) = x 1 y 1 + x 2 y 2 + ⋯ x n y n (\alpha, \beta) = x_1 y_1 + x_2 y_2 + \cdots x_n y_n
( α , β ) = x 1 y 1 + x 2 y 2 + ⋯ x n y n
定义向量内积的向量空间称为欧几里德空间, 简称欧式空间
欧式空间 V V V 的内积与三位向量空间 R 3 R^3 R 3 中的数量级一样具有以下性质
对称性: ( α , β ) = ( β , α ) (\alpha, \beta) = (\beta, \alpha) ( α , β ) = ( β , α )
双线性性: ( k 1 α 1 + k 2 α 2 , β ) = k 1 ( α 1 , β ) + k 2 ( α 2 , β ) ( α , k 1 β 1 + k 2 β 2 ) = k 2 ( α , β 1 ) + k 2 ( α , β 2 ) \begin{aligned} &(k_1 \alpha_1 + k_2 \alpha_2, \beta) = k_1 (\alpha_1, \beta) + k_2 (\alpha_2, \beta) \\
& (\alpha, k_1 \beta_1 + k_2 \beta_2) = k_2 (\alpha, \beta_1) + k_2 (\alpha, \beta_2) \end{aligned} ( k 1 α 1 + k 2 α 2 , β ) = k 1 ( α 1 , β ) + k 2 ( α 2 , β ) ( α , k 1 β 1 + k 2 β 2 ) = k 2 ( α , β 1 ) + k 2 ( α , β 2 )
非负性: ( α , α ) ≥ 0 (\alpha, \alpha) \ge 0 ( α , α ) ≥ 0
3.4.2 向量的长度与夹角
定义2 设 α = ( x 1 , x 2 , ⋯ , x n ) \alpha = (x_1, x_2, \cdots , x_n) α = ( x 1 , x 2 , ⋯ , x n ) 为欧式空间 V V V 中一向量, 定义 α \alpha α 的长度为
∥ α ∥ = ( α , α ) = x 1 2 + x 2 2 + ⋯ + x n 2 \parallel \alpha \parallel = \sqrt{(\alpha, \alpha)} = \sqrt{x_1^2 + x_2^2 + \cdots + x_n^2}
∥ α ∥= ( α , α ) = x 1 2 + x 2 2 + ⋯ + x n 2
向量长度具有以下性质
非负性: ∥ α ∥ ≥ 0 \parallel \alpha \parallel \ge 0 ∥ α ∥≥ 0 , 当且仅当 a l p h a = 0 alpha = \mathbf{0} a lp ha = 0 时, ∥ α ∥ = 0 \parallel \alpha \parallel = 0 ∥ α ∥= 0
正齐次性: ∥ k α ∥ = ∣ k ∣ ∥ α ∥ \parallel k \alpha \parallel = \left | k \right | \parallel \alpha \parallel ∥ k α ∥= ∣ k ∣ ∥ α ∥
三角不等式: ∥ α + β ∥ ≤ ∥ α ∥ + ∥ β ∥ \parallel \alpha + \beta \parallel \le \parallel \alpha \parallel + \parallel \beta \parallel ∥ α + β ∥≤∥ α ∥ + ∥ β ∥
长度为 1 1 1 的向量称为单位向量
设 α \alpha α 为任一非零向量, 则 1 ∥ α ∥ α \frac{1}{\parallel \alpha \parallel} \alpha ∥ α ∥ 1 α 为单位向量, 即用数 1 ∥ ℵ ∥ \frac{1}{\parallel \aleph \parallel} ∥ ℵ ∥ 1 乘向量 α \alpha α , 则将向量单位化
对于欧式空间两个向量 α = ( a 1 , a 2 , ⋯ , a n ) , β = ( b 1 , b 2 , ⋯ , b n ) \alpha = (a_1, a_2, \cdots , a_n), \beta = (b_1, b_2, \cdots , b_n) α = ( a 1 , a 2 , ⋯ , a n ) , β = ( b 1 , b 2 , ⋯ , b n ) , 定义它们的距离为 ∥ α − β ∥ \parallel \alpha - \beta \parallel ∥ α − β ∥ , 即
( a 1 − b 1 ) 2 + ( a 2 − b 2 ) 2 + ⋯ + ( a n − b n ) 2 \sqrt{(a_1 - b_1)^2 + (a_2 - b_2)^2 + \cdots + (a_n - b_n)^2} ( a 1 − b 1 ) 2 + ( a 2 − b 2 ) 2 + ⋯ + ( a n − b n ) 2
定理1 向量内积满足柯西不等式
( α , β ) 2 ≤ ( α , α ) ( β , β ) , ∀ α , β ∈ V (\alpha, \beta)^2 \le (\alpha, \alpha) (\beta, \beta) \ , \ \ \forall \alpha, \beta \in V
( α , β ) 2 ≤ ( α , α ) ( β , β ) , ∀ α , β ∈ V
等号成立当且仅当 α , β \alpha, \beta α , β 线性相关
此不等式也写做
∣ ( α , β ) ∣ ≤ ∥ α ∥ ∥ β ∥ \left | (\alpha, \beta) \right | \le \parallel \alpha \parallel \parallel \beta \parallel
∣ ( α , β ) ∣ ≤∥ α ∥∥ β ∥
证
若 α , β \alpha, \beta α , β 线性相关, 设 α = k β \alpha = k \beta α = k β , 则
( α , β ) 2 = ( k β , β ) 2 = k 2 ( β , β ) 2 = ( k β , k β ) ( β , β ) = ( α , α ) ( β , β ) (\alpha, \beta)^2 = (k \beta, \beta)^2 = k^2 (\beta, \beta)^2 = (k \beta, k \beta) (\beta, \beta) = (\alpha, \alpha) (\beta, \beta)
( α , β ) 2 = ( k β , β ) 2 = k 2 ( β , β ) 2 = ( k β , k β ) ( β , β ) = ( α , α ) ( β , β )
若 α , β \alpha, \beta α , β 线性无关, 则 ∀ t , t α + β ≠ 0 \forall t, t \alpha + \beta \ne 0 ∀ t , t α + β = 0 , 则
( t α + β , t α + β ) > 0 (t \alpha + \beta, t \alpha + \beta) > 0
( t α + β , t α + β ) > 0
即
( α , α ) t 2 + 2 ( α , β ) t + ( β , β ) > 0 (\alpha, \alpha) t^2 + 2 (\alpha, \beta) t + (\beta, \beta) > 0
( α , α ) t 2 + 2 ( α , β ) t + ( β , β ) > 0
则判别式 Δ = 4 ( ( α , β ) 2 − ( α , α ) ( β , β ) ) \Delta = 4((\alpha, \beta)^2 - (\alpha, \alpha) (\beta, \beta)) Δ = 4 (( α , β ) 2 − ( α , α ) ( β , β )) , 即
( α , β ) 2 < ( α , α ) ( β , β ) (\alpha, \beta)^2 < (\alpha, \alpha) (\beta, \beta)
( α , β ) 2 < ( α , α ) ( β , β )
由可惜不等式得
∣ ( α , β ) ∣ ∥ α ∥ ∥ β ∥ ≤ 1 \frac{\left | (\alpha, \beta) \right |}{\parallel \alpha \parallel \parallel \beta \parallel} \le 1
∥ α ∥∥ β ∥ ∣ ( α , β ) ∣ ≤ 1
定义3 设 α , β \alpha, \beta α , β 为欧式空间 V V V 的两个非零向量, α \alpha α 与 β \beta β 夹角定义为
⟨ α , β ⟩ = a r c c o s ( α , β ) ∥ α ∥ ∥ β ∥ , ⟨ α , β ⟩ ∈ [ 0 , π ] \langle \alpha, \beta \rangle = arccos \frac{(\alpha, \beta)}{\parallel \alpha \parallel \parallel \beta \parallel}
\ , \ \langle \alpha, \beta \rangle \in [0, \pi]
⟨ α , β ⟩ = a rccos ∥ α ∥∥ β ∥ ( α , β ) , ⟨ α , β ⟩ ∈ [ 0 , π ]
当 ( α , β ) = 0 (\alpha, \beta) = 0 ( α , β ) = 0 时, 称 α , β \alpha, \beta α , β 正交, 记作 α ⊥ β \alpha \perp \beta α ⊥ β
α , β \alpha, \beta α , β 非零时, 它们正交当且仅当它们夹角为 π 2 \frac{\pi}{2} 2 π
零向量与任意向量都正交
3.4.3 标准正交基
设 α 1 , α 2 , ⋯ , α s \alpha_1, \alpha_2, \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 是欧式空间 V V V 的一组两两相交的非零向量, 则称向量组 α 1 , α 2 , ⋯ , α s \alpha_1, \alpha_2, \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 为一正交向量组
正交向量组一定线性无关, 设 α 1 , α 2 , ⋯ , α s \alpha_1, \alpha_2, \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 为一正交向量组, 令
k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0 k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_s \alpha_s = \mathbf{0}
k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0
等式两边与 α i \alpha_i α i 做内积, 得 k s ( α i , α i ) = 0 k_s (\alpha_i, \alpha_i) = 0 k s ( α i , α i ) = 0 , 又 α i ≠ 0 \alpha_i \ne 0 α i = 0 , 则 ( α i , α i ) > 0 (\alpha_i, \alpha_i) > 0 ( α i , α i ) > 0 , 故 k − = 0 ( i = 1 , 2 , ⋯ , s ) k_- = 0 \ (i = 1, 2, \cdots , s) k − = 0 ( i = 1 , 2 , ⋯ , s ) ,
则 α 1 , α 2 , ⋯ , α s \alpha_1, \alpha_2, \cdots , \alpha_s α 1 , α 2 , ⋯ , α s 线性无关s
定义4 欧式空间 V V V 中有正交向量组构成的基称为 V V V 的正交基, 若 V V V 的一组正交基中的向量都是单位向量, 则称它为 V V V 的标准正交基
若欧式空间 V V V 维数为 m m m , 则 V V V 中 m m m 个向量 α 1 , α 2 , ⋯ , α m \alpha_1, \alpha_2, \cdots , \alpha_m α 1 , α 2 , ⋯ , α m 是 V V V 的标准正交基的充要条件是
( α i , α j ) = { 0 , i ≠ j 1 , i = j , i , j = 1 , 2 , ⋯ , m (\alpha_i, \alpha_j) = \begin{cases} 0, i \ne j \\ 1, i = j \end{cases}
\ , \ i, j = 1, 2, \cdots , m
( α i , α j ) = { 0 , i = j 1 , i = j , i , j = 1 , 2 , ⋯ , m
例如, R n R^n R n 中, 标准基 ε 1 , ε 2 , ⋯ , ε n \varepsilon_1, \varepsilon_2, \cdots , \varepsilon_n ε 1 , ε 2 , ⋯ , ε n 就标准正交基
欧式空间标准正交基不是唯一的, 如 R 3 R^3 R 3 中标准基 ε 1 , ε 2 , ε 3 \varepsilon_1, \varepsilon_2, \varepsilon_3 ε 1 , ε 2 , ε 3 和向量组
α 1 = ( 0 , 1 , 0 ) , α 2 = ( 1 2 , 0 , 1 2 ) , α 3 = ( 1 2 , 0 , − 1 2 ) \alpha_1 = (0, 1, 0) \ , \ \alpha_2 = (\frac{1}{\sqrt{2}}, 0, \frac{1}{\sqrt{2}})
\ , \ \alpha_3 = (\frac{1}{\sqrt{2}}, 0, - \frac{1}{\sqrt{2}})
α 1 = ( 0 , 1 , 0 ) , α 2 = ( 2 1 , 0 , 2 1 ) , α 3 = ( 2 1 , 0 , − 2 1 )
都是标准正交基
定义5 设 A A A 为 n n n 阶矩阵, 若 A T A = E A^T A = E A T A = E , 则称 A A A 为一个正交矩阵
A T = A − 1 A^T = A^{-1} A T = A − 1 , 即 A T A = A A T = E A^T A = A A^T = E A T A = A A T = E
若 A A A 是正交矩阵, 则 A T A^T A T 也是正交矩阵
两个正交矩阵之积也是正交矩阵
正交矩阵的行列式等于 1 1 1 或 − 1 -1 − 1
定理2 A A A 是正交矩阵当且仅当 A A A 的列向量是 R n R^n R n 的一组标准正交基
证
设 A = ( α 1 , α 2 , ⋯ , α n ) , 按分块矩阵乘法有 A T A = ( α 1 , α 2 , ⋯ , α n ) T ( α 1 , α 2 , ⋯ , α n ) = ( α 1 T α 2 T ⋮ α n T ) ( α 1 , α 2 , ⋯ , α n ) = ( α 1 T α 1 α 1 T α 2 ⋯ α 1 T α n α 2 T α 1 α 2 T α 2 ⋯ α 2 T α n ⋮ ⋮ ⋮ α n T α 1 α n T α 2 ⋯ α n T α n ) 则 A T A = E 当且仅当 α i T α j = ( α i , α j ) = { 1 , i = j 0 , i ≠ j 即 A 的列向量 α 1 , α 2 , ⋯ , α n 是 R n 的一个标准正交基 \begin{aligned}
& 设 A = (\alpha_1, \alpha_2, \cdots , \alpha_n) , 按分块矩阵乘法有 \\
& A^T A = (\alpha_1, \alpha_2, \cdots , \alpha_n)^T (\alpha_1, \alpha_2, \cdots , \alpha_n) \\
& = \begin{pmatrix} \alpha_1^T \\ \alpha_2^T \\ \vdots \\ \alpha_n^T \end{pmatrix} (\alpha_1, \alpha_2, \cdots , \alpha_n) = \begin{pmatrix}
\alpha_1^T \alpha_1 & \alpha_1^T \alpha_2 & \cdots & \alpha_1^T \alpha_n \\
\alpha_2^T \alpha_1 & \alpha_2^T \alpha_2 & \cdots & \alpha_2^T \alpha_n \\
\vdots & \vdots & & \vdots \\
\alpha_n^T \alpha_1 & \alpha_n^T \alpha_2 & \cdots & \alpha_n^T \alpha_n
\end{pmatrix} \\
& \ \\
& 则 A^T A = E 当且仅当 \\
& \alpha_i^T \alpha_j = (\alpha_i, \alpha_j) =
\begin{cases} 1, i = j \\ 0, i \ne j \end{cases} \\
& 即 A 的列向量 \alpha_1, \alpha_2, \cdots , \alpha_n 是 R^n 的一个标准正交基
\end{aligned}
设 A = ( α 1 , α 2 , ⋯ , α n ) , 按分块矩阵乘法有 A T A = ( α 1 , α 2 , ⋯ , α n ) T ( α 1 , α 2 , ⋯ , α n ) = α 1 T α 2 T ⋮ α n T ( α 1 , α 2 , ⋯ , α n ) = α 1 T α 1 α 2 T α 1 ⋮ α n T α 1 α 1 T α 2 α 2 T α 2 ⋮ α n T α 2 ⋯ ⋯ ⋯ α 1 T α n α 2 T α n ⋮ α n T α n 则 A T A = E 当且仅当 α i T α j = ( α i , α j ) = { 1 , i = j 0 , i = j 即 A 的列向量 α 1 , α 2 , ⋯ , α n 是 R n 的一个标准正交基
由 A T A = E A^T A = E A T A = E 得 A T = A − 1 A^T = A^{-1} A T = A − 1 , 所有也有 A A T = E AA^T = E A A T = E
类似的可证明 A A A 是正交矩阵当且仅当 A A A 的行向量是 R n R^n R n 的一组标准正交基
因此 , α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 是 R n R^n R n 的标准正交基的充要条件是以 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 为列向量构成的矩阵是一个正交矩阵
定理3 设 α 1 , α 2 , ⋯ , α m \alpha_1, \alpha_2, \cdots , \alpha_m α 1 , α 2 , ⋯ , α m 是欧式空间 V V V 的一组基, 则存在 V V V 的一组标准正交基 β 1 , β 2 , ⋯ , β m \beta_1, \beta_2, \cdots , \beta_m β 1 , β 2 , ⋯ , β m , 使 β k \beta_k β k 可由 α 1 , α 2 , ⋯ , α k \alpha_1, \alpha_2, \cdots , \alpha_k α 1 , α 2 , ⋯ , α k 线性表示
证明
第一步: 正交化
取 γ 1 = α 1 , 则 γ 1 ≠ 0 再取 γ 2 = α 2 = ( α 1 , γ 1 ) ( γ 1 , γ 1 ) γ 1 则 γ 2 可由 α 1 , α 2 线性表示 , 又 α 1 , α 2 线性无关 , 则 γ 2 ≠ 0 且有 ( γ 2 , γ 2 ) = ( α 2 , γ 1 ) − ( α 2 , γ 1 ) ( γ 1 , γ 1 ) ( γ 1 , γ 1 ) = 0 即 γ 1 ⊥ γ 2 对于 1 < k < m , 可在 V 中取到正交的非零向量 γ 1 , γ 2 , ⋯ , γ k − 1 , 且 γ i 可由 α 1 , α 2 , ⋯ , α k 线性表示 又 α 1 , α 2 , ⋯ , α k 线性无关 , 则 γ k ≠ 0 又 γ 1 , γ 2 , ⋯ , γ k − 1 两两正交 , 且 ( γ k , γ i ) = ( α k , α i ) − ( α k , γ i ) ( γ i , γ i ) ( γ i , γ i ) = 0 , i = 1 , 2 , ⋯ , k − 1 即 γ 1 , γ 2 , ⋯ , γ k 仍两两正交 由数学归纳法可知 , V 中存在一组正交基 γ 1 , γ 2 , ⋯ , γ m , 使 γ k 可由 α 1 , α 2 , ⋯ , α k 线性表示 ( k = 1 , 2 , ⋯ , m ) \begin{aligned}
& 取 \gamma_1 = \alpha_1, 则 \gamma_1 \ne \mathbf{0} \\
& 再取 \gamma_2 = \alpha_2 = \frac{(\alpha_1, \gamma_1)}{(\gamma_1, \gamma_1)} \gamma_1 \\
& 则 \gamma_2 可由 \alpha_1, \alpha_2 线性表示, 又\alpha_1, \alpha_2线性无关, 则 \gamma_2 \ne \mathbf{0} \\
& 且有 \ (\gamma_2, \gamma_2) = (\alpha_2, \gamma_1) - \frac{(\alpha_2, \gamma_1)}{(\gamma_1, \gamma_1)} (\gamma_1, \gamma_1) = 0 \\
& 即 \ \gamma_1 \bot \gamma_2 \\
& \ \\
& 对于 1 < k < m, 可在V中取到正交的非零向量 \gamma_1, \gamma_2, \cdots, \gamma_{k - 1}, 且 \gamma_i 可由 \alpha_1, \alpha_2, \cdots, \alpha_k 线性表示 \\
& 又 \alpha_1, \alpha_2, \cdots, \alpha_k 线性无关, 则 \gamma_k \ne \mathbf{0} \\
& 又 \gamma_1, \gamma_2, \cdots, \gamma_{k - 1} 两两正交, 且 \\
& (\gamma_k, \gamma_i) = (\alpha_k, \alpha_i) - \frac{(\alpha_k, \gamma_i)}{(\gamma_i, \gamma_i)} (\gamma_i, \gamma_i) = 0 \ , \ i = 1, 2, \cdots , k - 1 \\
& 即 \gamma_1, \gamma_2, \cdots, \gamma_k 仍两两正交 \\
& \\
& 由数学归纳法可知, V中存在一组正交基 \gamma_1, \gamma_2, \cdots, \gamma_m, 使 \gamma_k 可由 \alpha_1, \alpha_2, \cdots, \alpha_k 线性表示 (k = 1, 2, \cdots , m)
\end{aligned}
取 γ 1 = α 1 , 则 γ 1 = 0 再取 γ 2 = α 2 = ( γ 1 , γ 1 ) ( α 1 , γ 1 ) γ 1 则 γ 2 可由 α 1 , α 2 线性表示 , 又 α 1 , α 2 线性无关 , 则 γ 2 = 0 且有 ( γ 2 , γ 2 ) = ( α 2 , γ 1 ) − ( γ 1 , γ 1 ) ( α 2 , γ 1 ) ( γ 1 , γ 1 ) = 0 即 γ 1 ⊥ γ 2 对于 1 < k < m , 可在 V 中取到正交的非零向量 γ 1 , γ 2 , ⋯ , γ k − 1 , 且 γ i 可由 α 1 , α 2 , ⋯ , α k 线性表示 又 α 1 , α 2 , ⋯ , α k 线性无关 , 则 γ k = 0 又 γ 1 , γ 2 , ⋯ , γ k − 1 两两正交 , 且 ( γ k , γ i ) = ( α k , α i ) − ( γ i , γ i ) ( α k , γ i ) ( γ i , γ i ) = 0 , i = 1 , 2 , ⋯ , k − 1 即 γ 1 , γ 2 , ⋯ , γ k 仍两两正交 由数学归纳法可知 , V 中存在一组正交基 γ 1 , γ 2 , ⋯ , γ m , 使 γ k 可由 α 1 , α 2 , ⋯ , α k 线性表示 ( k = 1 , 2 , ⋯ , m )
第二步: 单位化
把 γ 1 , γ 2 , ⋯ , γ m 单位化 , 令 β k = 1 ∥ γ k ∥ γ k , k = 1 , 2 , ⋯ , m 则 β 1 , β 2 , ⋯ , β m 为满足要求的标准正交基 \begin{aligned}
& 把 \gamma_1, \gamma_2, \cdots, \gamma_m 单位化, 令 \\
& \beta_k = \frac{1}{\parallel \gamma_k \parallel} \gamma_k \ , \ k = 1, 2, \cdots , m \\
& 则 \beta_1, \beta_2, \cdots , \beta_m 为满足要求的标准正交基
\end{aligned}
把 γ 1 , γ 2 , ⋯ , γ m 单位化 , 令 β k = ∥ γ k ∥ 1 γ k , k = 1 , 2 , ⋯ , m 则 β 1 , β 2 , ⋯ , β m 为满足要求的标准正交基
上述定理提供了通过 V V V 的一组线性无关向量组构造 V V V 的单位正交向量组的方法, 称为 施密特正交化过程
例
设 V = L ( α 1 , α 2 , α 3 V = L(\alpha_1, \alpha_2, \alpha_3 V = L ( α 1 , α 2 , α 3 , 其中
α 1 , ( 1 , 1 , 0 , 0 ) , α 2 = ( 1 , 0 , 1 , 0 ) , α 3 = ( − 1 , 0 , 0 , 1 ) \alpha_1, (1, 1, 0, 0) \ , \ \alpha_2 = (1, 0, 1, 0) \ , \ \alpha_3 = (-1, 0, 0, 1)
α 1 , ( 1 , 1 , 0 , 0 ) , α 2 = ( 1 , 0 , 1 , 0 ) , α 3 = ( − 1 , 0 , 0 , 1 )
试用施密特正交化过程求 V V V 的一组标准正交基
令 A = ( α 1 α 2 α 3 ) = ( 1 1 0 0 1 − 1 0 − 1 0 0 1 ) r ( A ) = 3 , α 1 , α 2 , α 3 线性无关 , 即 α 1 , α 2 , α 3 构成 V 的一组基 正交化 : γ 1 = α 1 = ( 1 , 1 , 0 , 0 ) γ 2 = α 2 − ( α 2 , γ 1 ) ( γ 1 , γ 1 ) γ 1 = ( 1 2 , − 1 2 , 1 , 0 ) = 1 2 ( 1 , − 1 , 2 , 0 ) γ 3 = α 3 − ( α 3 , γ 1 ) ( γ 1 , γ 1 ) γ 1 − ( α 3 , γ 2 ) ( γ 2 , γ 2 ) = ( − 1 3 , 1 3 , 1 3 , 1 ) = 1 3 ( − 1 , 1 , 1 , 3 ) 单位化 : β k = γ k ∥ γ k ∥ β 1 = ( 1 2 , 1 2 , 0 , 0 ) β 2 = ( 1 6 , − 1 6 , 2 6 , 0 ) β 3 = ( − 1 12 , 1 12 , 1 12 , 3 12 ) \begin{aligned}
& 令 \ A = \begin{pmatrix} \alpha_1 \\ \alpha_2 \\ \alpha_3 \end{pmatrix} = \begin{pmatrix}
1 & 1 & 0 & 0 \\
1 & - & 1 & 0 \\
-1 & 0 & 0 & 1
\end{pmatrix} \\
& r(A) = 3, \alpha_1, \alpha_2, \alpha_3 线性无关, 即 \alpha_1, \alpha_2, \alpha_3 构成 V 的一组基 \\
& \ \\
& 正交化: \\
& \gamma_1 = \alpha_1 = (1, 1, 0, 0) \\
& \gamma_2 = \alpha_2 - \frac{(\alpha_2, \gamma_1)}{(\gamma_1, \gamma_1)} \gamma_1 = (\frac{1}{2}, - \frac{1}{2}, 1, 0) = \frac{1}{2} (1, -1, 2, 0) \\
& \gamma_3 = \alpha_3 - \frac{(\alpha_3, \gamma_1)}{(\gamma_1, \gamma_1)} \gamma_1 - \frac{(\alpha_3, \gamma_2)}{(\gamma_2, \gamma_2)} = (-\frac{1}{3}, \frac{1}{3}, \frac{1}{3}, 1) = \frac{1}{3} (-1, 1, 1, 3) \\
& \ \\
& 单位化: \\
& \beta_k = \frac{\gamma_k}{\parallel \gamma_k \parallel} \\
& \beta_1 = (\frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}}, 0, 0) \\
& \beta_2 = (\frac{1}{\sqrt{6}}, - \frac{1}{\sqrt{6}}, \frac{2}{\sqrt{6}}, 0) \\
& \beta_3 = (- \frac{1}{\sqrt{12}}, \frac{1}{\sqrt{12}}, \frac{1}{\sqrt{12}}, \frac{3}{\sqrt{12}})
\end{aligned}
令 A = α 1 α 2 α 3 = 1 1 − 1 1 − 0 0 1 0 0 0 1 r ( A ) = 3 , α 1 , α 2 , α 3 线性无关 , 即 α 1 , α 2 , α 3 构成 V 的一组基 正交化 : γ 1 = α 1 = ( 1 , 1 , 0 , 0 ) γ 2 = α 2 − ( γ 1 , γ 1 ) ( α 2 , γ 1 ) γ 1 = ( 2 1 , − 2 1 , 1 , 0 ) = 2 1 ( 1 , − 1 , 2 , 0 ) γ 3 = α 3 − ( γ 1 , γ 1 ) ( α 3 , γ 1 ) γ 1 − ( γ 2 , γ 2 ) ( α 3 , γ 2 ) = ( − 3 1 , 3 1 , 3 1 , 1 ) = 3 1 ( − 1 , 1 , 1 , 3 ) 单位化 : β k = ∥ γ k ∥ γ k β 1 = ( 2 1 , 2 1 , 0 , 0 ) β 2 = ( 6 1 , − 6 1 , 6 2 , 0 ) β 3 = ( − 12 1 , 12 1 , 12 1 , 12 3 )
定理4 由标准正交基到标准正交基的过渡矩阵是正交矩阵, 反之, 由标准正交基经过渡矩阵得到的基也是标准正交基
设 α 1 , α 2 , ⋯ , α m \alpha_1, \alpha_2, \cdots, \alpha_m α 1 , α 2 , ⋯ , α m 与 β 1 , β 2 , ⋯ , β m \beta_1, \beta_2, \cdots , \beta_m β 1 , β 2 , ⋯ , β m 是 m m m 维欧式空间 V V V 的两组基, 其中 α 1 , α 2 , ⋯ , α m \alpha_1, \alpha_2, \cdots, \alpha_m α 1 , α 2 , ⋯ , α m 是标准正交基, 且从 α 1 , α 2 , ⋯ , α m \alpha_1, \alpha_2, \cdots, \alpha_m α 1 , α 2 , ⋯ , α m 到 β 1 , β 2 , ⋯ , β m \beta_1, \beta_2, \cdots , \beta_m β 1 , β 2 , ⋯ , β m 的过渡矩阵 A = ( a i j ) A = (a_{ij}) A = ( a ij ) , 即
( β 1 , β 2 , ⋯ , β m ) = ( α 1 , α 2 , ⋯ , α m ) ( a 11 a 12 ⋯ a 1 m a 21 a 22 ⋯ a 2 m ⋮ ⋮ ⋮ a m 1 a m 2 ⋯ a m m ) (\beta_1, \beta_2, \cdots , \beta_m) = (\alpha_1, \alpha_2, \cdots, \alpha_m) \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1m} \\
a_{21} & a_{22} & \cdots & a_{2m} \\
\vdots & \vdots & & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mm}
\end{pmatrix}
( β 1 , β 2 , ⋯ , β m ) = ( α 1 , α 2 , ⋯ , α m ) a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋯ ⋯ ⋯ a 1 m a 2 m ⋮ a mm
则 β 1 , β 2 , ⋯ , β m \beta_1, \beta_2, \cdots , \beta_m β 1 , β 2 , ⋯ , β m 为标准正交基当且仅当
( β i , β j ) = a 1 i a 1 j + a 2 i a 2 j + ⋯ + a m i a m j = { 1 , i = j 0 , i ≠ j (\beta_i, \beta_j) = a_{1i}a_{1j} + a_{2i}a_{2j} + \cdots + a_{mi}a_{mj} = \begin{cases}
& 1 \ , \ i = j \\
& 0 \ , \ i \ne j
\end{cases}
( β i , β j ) = a 1 i a 1 j + a 2 i a 2 j + ⋯ + a mi a mj = { 1 , i = j 0 , i = j
上式等价于
A T A = E A^TA = E
A T A = E
即 A A A 为正交矩阵
4 线性方程组
4.1 解线性方程组的消元法
4.1.1 线性方程组解的存在性
设 n n n 个未知元, m m m 个方程的线性方程组为
{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 21 x 2 + ⋯ + a 2 n x n = b 2 ⋯ ⋯ ⋯ ⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m \begin{cases}
a_{11} x_1 + a_{12} x_2 + \cdots + a_{1n} x_n = b_1 \\
a_{21} x_1 + a_{21} x_2 + \cdots + a_{2n} x_n = b_2 \\
\cdots \cdots \cdots \cdots \\
a_{m1} x_1 + a_{m2} x_2 + \cdots + a_{mn} x_n = b_m
\end{cases}
⎩ ⎨ ⎧ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 21 x 2 + ⋯ + a 2 n x n = b 2 ⋯⋯⋯⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a mn x n = b m
记
A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a m 1 a m 2 ⋯ a m n ) , X = ( x 1 x 2 ⋮ x n ) , b = ( b 1 b 2 ⋮ b n ) A = \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
\ , \
X = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}
\ , \
b = \begin{pmatrix} b_1 \\ b_2 \\ \vdots \\ b_n \end{pmatrix}
A = a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a mn , X = x 1 x 2 ⋮ x n , b = b 1 b 2 ⋮ b n
则方程组可写作
A X = b AX = b
A X = b
又记
A ‾ = ( a 11 a 12 ⋯ a 1 n b 1 a 21 a 22 ⋯ a 2 n b 2 ⋮ ⋮ ⋮ ⋮ a m 1 a m 2 ⋯ a m n b m ) \overline{A} = \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\
a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\
\vdots & \vdots & & \vdots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn} & b_m
\end{pmatrix}
A = a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a mn b 1 b 2 ⋮ b m
A A A 和 A ‾ \overline{A} A 分别称为方程组的系数矩阵和增广矩阵
将系数矩阵 A A A 按列分块, 即
A = ( α 1 , α 2 , ⋯ , α n ) A = (\alpha_1, \alpha_2, \cdots, \alpha_n)
A = ( α 1 , α 2 , ⋯ , α n )
其中 α j = ( a 1 j , a 2 j , ⋯ , a m j ) T ( j = 1 , 2 , ⋯ , n ) \alpha_j = (a_{1j}, a_{2j}, \cdots , a_{mj})^T \ (j = 1, 2, \cdots , n) α j = ( a 1 j , a 2 j , ⋯ , a mj ) T ( j = 1 , 2 , ⋯ , n ) 为系数矩阵 A A A 的第 j j j 列, 则方程组又可写作
x 1 α 1 + x 2 α 2 + ⋯ + x n α n = b x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_n \alpha_n = b
x 1 α 1 + x 2 α 2 + ⋯ + x n α n = b
当向量 b ≠ 0 b \ne \mathbf{0} b = 0 时, 称 A X = b AX = b A X = b 为非齐次线性方程组;
而称 A X = 0 AX = \mathbf{0} A X = 0 为齐次线性方程组, 它也称线性方程组 A X = = b AX == b A X == b 的导出组
定义1 若线性方程组有解, 则称改方程组是相容的, 否则称为不相容的
线性方程组是否相容与它的系数矩阵 A A A 和增广矩阵 A ‾ \overline{A} A 的秩有关,
线性方程组 A X = b AX = b A X = b 相容性等价于 b b b 能否用 A A A 的列向量 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 线性表示
若 b b b 能由向量组 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 线性表示, 则向量组 α 1 , α 2 , ⋯ , α n , b \alpha_1, \alpha_2, \cdots , \alpha_n, b α 1 , α 2 , ⋯ , α n , b 与向量组 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 有相同的秩.
又向量组的秩等同于以其为列向量的矩阵的秩, 则 α 1 , α 2 , ⋯ , α n , b \alpha_1, \alpha_2, \cdots , \alpha_n, b α 1 , α 2 , ⋯ , α n , b 与 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 有相同分秩等价于 A A A 与 A ‾ \overline{A} A 秩相等
定理1 线性方程组有解或相容充要条件是它的系数矩阵 A A A 和增广矩阵 A ‾ \overline{A} A 秩相等, 即 r ( A ) = r ( A ‾ ) r(A) = r(\overline{A}) r ( A ) = r ( A )
线性方程组解存在且唯一的充要条件是 b b b 能由系数矩阵 A A A 的列向量组 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 线性表示且表示方法唯一.
则 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 线性无关, 即向量组 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 的秩等于 n n n
定理2 线性方程组存在唯一解的充要条件是它的系数矩阵 A A A 与其增广矩阵 A ‾ \overline{A} A 的秩都等于 n n n , 即 r ( A ) = r ( A ‾ ) = n r(A) = r(\overline{A}) = n r ( A ) = r ( A ) = n
4.1.2 消元法
定理3 设线性方程组 A X = b AX = b A X = b 的增广矩阵 A ‾ = ( A , b ) \overline{A} = (A, b) A = ( A , b ) 经初等行变换后得到矩阵为 B ‾ = ( B , d ) \overline{B} = (B, d) B = ( B , d ) , 则矩阵 B ‾ \overline{B} B 所对应的线性方程组 B X = d BX = d BX = d 与愿方程组 A X = b AX = b A X = b 同解, 即它们有相同的解集
例 解线性方程组
{ x 1 + x 2 + x 3 = 1 x 1 + 2 x 1 − 5 x 3 = 2 2 x 1 + 3 x 2 − 4 x 3 = 3 \begin{cases}
x_1 + x_2 + x_3 = 1 \\
x_1 + 2x_1 - 5x_3 = 2 \\
2x_1 + 3x_2 - 4x_3 = 3
\end{cases}
⎩ ⎨ ⎧ x 1 + x 2 + x 3 = 1 x 1 + 2 x 1 − 5 x 3 = 2 2 x 1 + 3 x 2 − 4 x 3 = 3
解
对方程组增广矩阵进行初等行变换
A ‾ = ( 1 1 1 1 1 2 − 5 2 2 3 − 4 3 ) → r 3 + ( − 2 ) × r 1 r 2 + ( − 1 ) × r 1 ( 1 1 1 1 0 1 6 1 0 1 − 6 1 ) → r 3 + ( − 1 ) × r 1 r 1 + ( − 1 ) × r 2 ( 1 0 7 0 0 1 − 6 1 0 0 0 0 ) \overline{A} = \begin{pmatrix}
1 & 1 & 1 & 1 \\
1 & 2 & -5 & 2 \\
2 & 3 & -4 & 3
\end{pmatrix}
\xrightarrow[r_3 + (-2) \times r_1]{r_2 + (-1) \times r_1}
\begin{pmatrix}
1 & 1 & 1 & 1 \\
0 & 1 & 6 & 1 \\
0 & 1 & -6 & 1
\end{pmatrix}
\xrightarrow[r_3 + (-1) \times r_1]{r_1 + (-1) \times r_2}
\begin{pmatrix}
1 & 0 & 7 & 0 \\
0 & 1 & -6 & 1 \\
0 & 0 & 0 & 0
\end{pmatrix}
A = 1 1 2 1 2 3 1 − 5 − 4 1 2 3 r 2 + ( − 1 ) × r 1 r 3 + ( − 2 ) × r 1 1 0 0 1 1 1 1 6 − 6 1 1 1 r 1 + ( − 1 ) × r 2 r 3 + ( − 1 ) × r 1 1 0 0 0 1 0 7 − 6 0 0 1 0
变换后对应阶梯线性方程组
{ x 1 + 7 x 3 = 0 x 2 − 6 x 3 = 1 \begin{cases}
x_1 \ \ \ \ \ \ \ + 7x_3 = 0 \\
\ \ \ \ \ \ \ x_2 - 6x_3 = 1
\end{cases}
{ x 1 + 7 x 3 = 0 x 2 − 6 x 3 = 1
它与原方程同解, 取 x 3 = k x_3 = k x 3 = k , 则 x 1 = − 7 k , x 2 = 1 + 6 k x_1 = -7k, x_2 = 1 + 6k x 1 = − 7 k , x 2 = 1 + 6 k , 则原方程解为
{ x 1 = − 7 k x 2 = 1 + 6 k x 3 = k \begin{cases}
x_1 = -7k \\
x_2 = 1 + 6k \\
x_3 = k
\end{cases}
⎩ ⎨ ⎧ x 1 = − 7 k x 2 = 1 + 6 k x 3 = k
求解
{ x 1 − x 2 + 5 x 3 − x 4 = 0 x 1 + x 2 − 2 x 3 + 3 x 3 = 0 3 x 1 − x 2 + 8 x + 3 + X 4 = 0 x 1 + 3 x 2 − 9 x 3 + 7 x 4 = 0 \begin{cases}
x_1 - x_2 + 5x_3 - x_4 = 0 \\
x_1 + x_2 - 2x_3 + 3x_3 = 0 \\
3x_1 - x_2 + 8x+3 + X_4 = 0 \\
x_1 + 3x_2 - 9x_3 + 7x_4 = 0
\end{cases}
⎩ ⎨ ⎧ x 1 − x 2 + 5 x 3 − x 4 = 0 x 1 + x 2 − 2 x 3 + 3 x 3 = 0 3 x 1 − x 2 + 8 x + 3 + X 4 = 0 x 1 + 3 x 2 − 9 x 3 + 7 x 4 = 0
解 (变换系数矩阵)
A = ( 1 − 1 5 − 1 1 1 − 2 3 3 − 1 8 1 1 3 − 9 7 ) → ⋯ ⋯ ( 1 0 3 2 1 0 1 − 7 2 2 0 0 0 0 0 0 0 0 ) { x 1 + 3 2 x 3 + x 4 = 0 x 2 − 7 2 x 3 + 2 x 4 = 0 x 3 = k 1 , x 4 = k 2 ⇒ { x 1 = − 3 2 k 1 − k 2 x 2 = 7 2 k 1 − 2 k 2 x 3 = k 1 x 4 = k 2 A = \begin{pmatrix}
1 & -1 & 5 & -1 \\
1 & 1 & -2 & 3 \\
3 & -1 & 8 & 1 \\
1 & 3 & -9 & 7
\end{pmatrix}
\xrightarrow[\cdots]{\cdots}
\begin{pmatrix}
1 & 0 & \frac{3}{2} & 1 \\
0 & 1 & - \frac{7}{2} & 2 \\
0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0
\end{pmatrix}
\\
\begin{cases}
x_1 + \frac{3}{2} x_3 + x_4 = 0 \\
x_2 - \frac{7}{2} x_3 + 2x_4 = 0
\end{cases}
\\
x_3 = k_1, x_4 = k_2 \Rightarrow \begin{cases}
x_1 = - \frac{3}{2} k_1 - k_2 \\
x_2 = \frac{7}{2} k_1 - 2k_2 \\
x_3 = k_1 \\
x_4 = k_2
\end{cases}
A = 1 1 3 1 − 1 1 − 1 3 5 − 2 8 − 9 − 1 3 1 7 ⋯ ⋯ 1 0 0 0 0 1 0 0 2 3 − 2 7 0 0 1 2 0 0 { x 1 + 2 3 x 3 + x 4 = 0 x 2 − 2 7 x 3 + 2 x 4 = 0 x 3 = k 1 , x 4 = k 2 ⇒ ⎩ ⎨ ⎧ x 1 = − 2 3 k 1 − k 2 x 2 = 2 7 k 1 − 2 k 2 x 3 = k 1 x 4 = k 2
上述方法本质为对线性方程组逐步消元, 称为高斯消元法
求解
{ x 1 + x 2 + 2 x 3 + 3 x 4 = 1 x 2 + x 3 − 4 x 4 = 1 x 1 + 2 x 2 + 3 x 3 − 4 x 4 = 4 2 x 1 + 3 x 2 − x 3 − x 4 = − 6 \begin{cases}
x_1 + x_2 + 2x_3 + 3x_4 = 1 \\
x_2 + x_3 - 4x_4 = 1 \\
x_1 + 2x_2 + 3x_3 - 4x_4 = 4 \\
2x_1 + 3x_2 - x_3 - x_4 = -6
\end{cases}
⎩ ⎨ ⎧ x 1 + x 2 + 2 x 3 + 3 x 4 = 1 x 2 + x 3 − 4 x 4 = 1 x 1 + 2 x 2 + 3 x 3 − 4 x 4 = 4 2 x 1 + 3 x 2 − x 3 − x 4 = − 6
解
A ‾ = ( 1 1 2 3 1 0 1 1 − 4 1 1 2 3 − 1 4 2 3 − 1 − 1 − 6 ) → ⋯ ⋯ ( 1 1 2 3 1 0 1 1 − 4 1 0 0 2 1 3 0 0 0 0 1 ) \overline{A} = \begin{pmatrix}
1 & 1 & 2 & 3 & 1 \\
0 & 1 & 1 & -4 & 1 \\
1 & 2 & 3 & -1 & 4 \\
2 & 3 & -1 & -1 & -6
\end{pmatrix}
\xrightarrow[\cdots]{\cdots}
\begin{pmatrix}
1 & 1 & 2 & 3 & 1\\
0 & 1 & 1 & -4 & 1 \\
0 & 0 & 2 & 1 & 3 \\
0 & 0 & 0 & 0 & 1
\end{pmatrix}
A = 1 0 1 2 1 1 2 3 2 1 3 − 1 3 − 4 − 1 − 1 1 1 4 − 6 ⋯ ⋯ 1 0 0 0 1 1 0 0 2 1 2 0 3 − 4 1 0 1 1 3 1
因为 r ( A ) = 3 , r ( A ‾ ) = 4 ≠ r ( A ) r(A) = 3, r(\overline{A}) = 4 \ne r(A) r ( A ) = 3 , r ( A ) = 4 = r ( A ) , 则原方程组无解
实际上上述矩阵最后一行对应方程为 0 x 1 + 0 x 2 + 0 x 3 + 0 x 4 = 1 0x_1 + 0x_2 + 0x_3 + 0x_4 = 1 0 x 1 + 0 x 2 + 0 x 3 + 0 x 4 = 1 , 故无解
4.2 齐次线性方程组解的结构
4.2.1 齐次线性方程组有非零解的条件
n n n 元齐次方程组
A X = 0 AX = \mathbf{0}
A X = 0
其中 A A A 为 m × n m \times n m × n 矩阵, 由于零向量总可以由任意向量组表示, 故齐次线性方程组总是相容的, 显然 X = 0 X = \mathbf{0} X = 0 为一个解(称为零解或平凡解)
将其写成向量形式
x 1 α 1 + x 2 α 2 + ⋯ + x n α n = 0 x_1 \alpha_1 + x_2 \alpha_2 + \cdots + x_n \alpha_n = \mathbf{0}
x 1 α 1 + x 2 α 2 + ⋯ + x n α n = 0
则下面四个命题等价
方程有非零解
存在不全为零的数 x 1 , x 2 , ⋯ , x n x_1, x_2, \cdots , x_n x 1 , x 2 , ⋯ , x n 是方程成立
α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 线性相关
r ( A ) = r ( α 1 , α 2 , ⋯ , α n ) < n r(A) = r(\alpha_1, \alpha_2, \cdots , \alpha_n) < n r ( A ) = r ( α 1 , α 2 , ⋯ , α n ) < n
定理1 设 A A A 是 m × n m \times n m × n 矩阵, 则为齐次线性方程组 A X = 0 AX = \mathbf{0} A X = 0 有非零解地方充要条件是 r ( A ) < n r(A) < n r ( A ) < n
等价命题 n n nn nn 元齐次线性方程组 A X = 0 AX = \mathbf{0} A X = 0 只有零解充要条件是 r ( A ) = n r(A) = n r ( A ) = n
推论1 设 A A A 是 m × n m \times n m × n 矩阵, 则
当 m < n m < n m < n 时, 线性方程组 A X = 0 AX = \mathbf{0} A X = 0 必有非零解
当 m = n m = n m = n 时, 线性方程组 A X = 0 AX = \mathbf{0} A X = 0 有非零解的充要条件是 ∣ A ∣ = 0 \left | A \right | = 0 ∣ A ∣ = 0
例
判断 λ \lambda λ 为何值时, 下列齐次线性方程组有非零解, 只有零解
{ x 1 + λ x 2 + x 3 = 0 x 1 − x 2 + x 3 = 0 λ x 1 + x 2 + 2 x 3 = 0 \begin{cases}
x_1 + \lambda x_2 + x_3 = 0 \\
x_1 - x_2 + x_3 = 0 \\
\lambda x_1 + x_2 + 2x_3 = 0
\end{cases}
⎩ ⎨ ⎧ x 1 + λ x 2 + x 3 = 0 x 1 − x 2 + x 3 = 0 λ x 1 + x 2 + 2 x 3 = 0
解1
设系数矩阵为 A A A
A = ( 1 λ 1 1 − 1 1 λ 1 2 ) → ⋯ ⋯ ( 1 − 1 1 0 λ + 1 0 0 0 2 − λ ) A = \begin{pmatrix}
1 & \lambda & 1 \\
1 & -1 & 1 \\
\lambda & 1 & 2
\end{pmatrix}
\xrightarrow[\cdots]{\cdots}
\begin{pmatrix}
1 & -1 & 1 \\
0 & \lambda + 1 & 0 \\
0 & 0 & 2 - \lambda
\end{pmatrix}
A = 1 1 λ λ − 1 1 1 1 2 ⋯ ⋯ 1 0 0 − 1 λ + 1 0 1 0 2 − λ
则当 λ = 2 \lambda = 2 λ = 2 或 λ = − 1 \lambda = -1 λ = − 1 时, ∣ A ∣ = 0 \left | A \right | = 0 ∣ A ∣ = 0 , 方程组有非零解
当 λ ≠ 2 \lambda \ne 2 λ = 2 且 λ ≠ − 1 \lambda \ne -1 λ = − 1 时, ∣ A ∣ ≠ 0 \left | A \right | \ne 0 ∣ A ∣ = 0 , 方程组只有零解
4.2.2 齐次线性方程组解的结构
记 S S S 为 A X = 0 AX = \mathbf{0} A X = 0 的解集, 则 S S S 构成一个向量空间, 称之为齐次线性方程组的解空间, 该解空间的一组基, 称为该方程组的一个基础解系
齐次线性方程组的全部解都能由基础解系线性组合表示, 基础解系的线性组合也一定是解, 则只需求齐次线性方程组的一个基础解系 ξ 1 , ξ 2 , ⋯ , ξ t \xi_1, \xi_2, \cdots , \xi_t ξ 1 , ξ 2 , ⋯ , ξ t , 便可知道所有解
k 1 ξ 1 + k 2 ξ 2 + ⋯ + k t ξ t , k 1 , k 2 , ⋯ , k t ∈ R k_1 \xi_1 + k_2 \xi_2 + \cdots + k_t \xi_t \ , \ k_1, k_2, \cdots , k_t \in R
k 1 ξ 1 + k 2 ξ 2 + ⋯ + k t ξ t , k 1 , k 2 , ⋯ , k t ∈ R
定理2 设 n n n 元齐次方程组 A X = 0 AX = \mathbf{0} A X = 0 的系数矩阵 A A A 的秩 r ( A ) = r < n r(A) = r < n r ( A ) = r < n , 则齐次线性方程组 A X = 0 AX = \mathbf{0} A X = 0 的解空间是 n − r n - r n − r 维的 , 即 A X = 0 AX = \mathbf{0} A X = 0 的基础解系中含有 n − r n - r n − r 个解向量
r ( A ) = r < n , 则矩阵 A 至少存在一个 r 阶子式不为零 , 而所有的 r + 1 阶子式均为零 , 不妨设左上角的 r 阶子式不为零 , 则初等行变换 A 有 ( c 11 c 12 ⋯ c 1 r c 1 , r + 1 ⋯ c 1 n 0 c 22 ⋯ c 2 r c 2 , r + 1 ⋯ c 2 n ⋮ ⋮ ⋮ ⋮ ⋮ 0 0 ⋯ c r r c r , r + 1 ⋯ c r n 0 0 ⋯ 0 0 ⋯ 0 ⋮ ⋮ ⋮ ⋮ ⋮ 0 0 ⋯ 0 0 ⋯ 0 ) 这里 c i i ≠ 0 ( i ≤ i ≤ r ) , 则 A X = 0 同解方程组如下 { c 11 x 1 + c 12 x 2 + ⋯ + c 1 r x r + c 1 , r + 1 x r + 1 + ⋯ + c 1 n x n = 0 c 22 + ⋯ + c 2 r x r + c 2 , r + 1 x r + 1 + ⋯ + c 2 n x n = 0 ⋯ ⋯ ⋯ ⋯ c r r x r + c r , r + 1 x r + 1 + ⋯ + c r n x n = 0 将 x r + 1 , x r + 2 , ⋯ , x n 移至方程组右边并逐步回代的方程组一般解 { x 1 = d 11 x r + 1 + d 12 x r + 2 + ⋯ + d 1 , n − r x n x 2 = d 21 x r + 1 + d 22 x r + 2 + ⋯ + d 2 , n − r x n ⋯ ⋯ ⋯ ⋯ x r = d r 1 x r + 1 + d r 2 x r + 2 + ⋯ + d r , n − r x n 其中 x r + 1 , x r + 2 , ⋯ , x n 为任意实数 , 称之为自由未知量 若取 x r + 1 , x r + 2 , ⋯ , x n 的 n − r 组值 : ( x r + 1 x r + 2 x r + 3 ⋮ x n ) = ( 1 0 0 ⋮ 0 ) , ( 0 1 0 ⋮ 0 ) , ⋯ , ( 0 0 0 ⋮ 1 ) 则可得齐次线性方程组 A X = 0 的 n − r 个解向量 ξ 1 = ( d 11 , ⋯ , d r 1 , 1 , 0 , ⋯ , 0 ) T ξ 2 = ( d 12 , ⋯ , d r 2 , 0 , 1 , ⋯ , 0 ) T ⋯ ξ n − r = ( d 1 , n − r , ⋯ , d r , n − r , 0 , 0 , ⋯ , 1 ) T 易得 ξ 1 , ξ 2 , ⋯ , ξ n − r 线性无关 \begin{aligned}
& r(A) = r < n, 则矩阵A至少存在一个r阶子式不为零, 而所有的r + 1阶子式均为零, 不妨设左上角的r阶子式不为零, 则初等行变换A有 \\
& \begin{pmatrix}
c_{11} & c_{12} & \cdots & c_{1r} & c_{1, r + 1} & \cdots & c_{1n} \\
0 & c_{22} & \cdots & c_{2r} & c_{2, r + 1} & \cdots & c_{2n} \\
\vdots & \vdots & & \vdots & \vdots & & \vdots \\
0 & 0 & \cdots & c_{rr} & c_{r, r + 1} & \cdots & c_{rn} \\
0 & 0 & \cdots & 0 & 0 & \cdots & 0 \\
\vdots & \vdots & & \vdots & \vdots & & \vdots \\
0 & 0 & \cdots & 0 & 0 & \cdots & 0
\end{pmatrix} \\
& \ \\
& 这里 c_{ii} \ne 0 \ (i \le i \le r), 则 AX = \mathbf{0} 同解方程组如下 \\
& \begin{cases}
c_{11} x_1 + c_{12} x_2 + \cdots + c_{1r} x_r + c_{1, r + 1} x_{r + 1} + \cdots + c_{1n} x_n = 0 \\
c_{22} + \cdots + c_{2r} x_r + c_{2, r + 1} x_{r + 1} + \cdots + c_{2n} x_n = 0 \\
\cdots \cdots \cdots \cdots \\
c_{rr} x_r + c_{r, r + 1} x_{r + 1} + \cdots + c_{rn} x_n = 0
\end{cases} \\
& \ \\
& 将 x_{r + 1}, x_{r + 2}, \cdots , x_n 移至方程组右边并逐步回代的方程组一般解 \\
& \begin{cases}
x_1 = d_{11} x_{r + 1} + d_{12} x_{r + 2} + \cdots + d_{1, n - r} x_n \\
x_2 = d_{21} x_{r + 1} + d_{22} x_{r + 2} + \cdots + d_{2, n - r} x_n \\
\cdots \cdots \cdots \cdots \\
x_r = d_{r1} x_{r + 1} + d_{r2} x_{r + 2} + \cdots + d_{r, n - r} x_n
\end{cases} \\
& 其中 x_{r + 1}, x_{r + 2}, \cdots , x_n 为任意实数, 称之为自由未知量 \\
& \ \\
& 若取 x_{r + 1}, x_{r + 2}, \cdots , x_n 的 n - r 组值 : \\
& \begin{pmatrix} x_{r + 1} \\ x_{r + 2} \\ x_{r + 3} \\ \vdots \\ x_n \end{pmatrix} =
\begin{pmatrix} 1 \\ 0 \\ 0 \\ \vdots \\ 0 \end{pmatrix} \ , \
\begin{pmatrix} 0 \\ 1 \\ 0 \\ \vdots \\ 0 \end{pmatrix} \ , \
\cdots \ , \
\begin{pmatrix} 0 \\ 0 \\ 0 \\ \vdots \\ 1 \end{pmatrix} \\
& 则可得齐次线性方程组 AX = \mathbf{0} 的 n - r 个解向量 \\
& \begin{matrix}
\xi_1 = (d_{11}, \cdots , d_{r1}, 1, 0, \cdots , 0)^T \\
\xi_2 = (d_{12}, \cdots , d_{r2}, 0, 1, \cdots , 0)^T \\
\cdots \\
\xi_{n - r} = (d_{1, n - r}, \cdots , d_{r, n - r}, 0, 0, \cdots , 1)^T
\end{matrix} \\
& 易得 \xi_1, \xi_2, \cdots , \xi_{n - r} 线性无关
\end{aligned}
r ( A ) = r < n , 则矩阵 A 至少存在一个 r 阶子式不为零 , 而所有的 r + 1 阶子式均为零 , 不妨设左上角的 r 阶子式不为零 , 则初等行变换 A 有 c 11 0 ⋮ 0 0 ⋮ 0 c 12 c 22 ⋮ 0 0 ⋮ 0 ⋯ ⋯ ⋯ ⋯ ⋯ c 1 r c 2 r ⋮ c rr 0 ⋮ 0 c 1 , r + 1 c 2 , r + 1 ⋮ c r , r + 1 0 ⋮ 0 ⋯ ⋯ ⋯ ⋯ ⋯ c 1 n c 2 n ⋮ c r n 0 ⋮ 0 这里 c ii = 0 ( i ≤ i ≤ r ) , 则 A X = 0 同解方程组如下 ⎩ ⎨ ⎧ c 11 x 1 + c 12 x 2 + ⋯ + c 1 r x r + c 1 , r + 1 x r + 1 + ⋯ + c 1 n x n = 0 c 22 + ⋯ + c 2 r x r + c 2 , r + 1 x r + 1 + ⋯ + c 2 n x n = 0 ⋯⋯⋯⋯ c rr x r + c r , r + 1 x r + 1 + ⋯ + c r n x n = 0 将 x r + 1 , x r + 2 , ⋯ , x n 移至方程组右边并逐步回代的方程组一般解 ⎩ ⎨ ⎧ x 1 = d 11 x r + 1 + d 12 x r + 2 + ⋯ + d 1 , n − r x n x 2 = d 21 x r + 1 + d 22 x r + 2 + ⋯ + d 2 , n − r x n ⋯⋯⋯⋯ x r = d r 1 x r + 1 + d r 2 x r + 2 + ⋯ + d r , n − r x n 其中 x r + 1 , x r + 2 , ⋯ , x n 为任意实数 , 称之为自由未知量 若取 x r + 1 , x r + 2 , ⋯ , x n 的 n − r 组值 : x r + 1 x r + 2 x r + 3 ⋮ x n = 1 0 0 ⋮ 0 , 0 1 0 ⋮ 0 , ⋯ , 0 0 0 ⋮ 1 则可得齐次线性方程组 A X = 0 的 n − r 个解向量 ξ 1 = ( d 11 , ⋯ , d r 1 , 1 , 0 , ⋯ , 0 ) T ξ 2 = ( d 12 , ⋯ , d r 2 , 0 , 1 , ⋯ , 0 ) T ⋯ ξ n − r = ( d 1 , n − r , ⋯ , d r , n − r , 0 , 0 , ⋯ , 1 ) T 易得 ξ 1 , ξ 2 , ⋯ , ξ n − r 线性无关
下面证明齐次线性方程组 A X = 0 AX = \mathbf{0} A X = 0 的每个解都可由 ξ 1 , ξ 2 , ⋯ , ξ n − r \xi_1, \xi_2 , \cdots , \xi_{n - r} ξ 1 , ξ 2 , ⋯ , ξ n − r 线性表示
上式中 , 任取 x r + 1 , x r + 2 , ⋯ , x n 的一组值 k 1 , k 2 , ⋯ , k n − r , 的齐次线性方程组 A X = 0 的解为 { x 1 = k 1 d 11 + k 2 d 12 + ⋯ + k n − r d 1 , n − r x 2 = k 1 d 21 + k 2 d 22 + ⋯ + k n − r d 2 , n − r ⋯ ⋯ ⋯ ⋯ x r = k 1 d r 1 + k 2 d r 2 + ⋯ + k n − r d r , n − r x r + 1 = k 1 x r + 2 = k 2 ⋯ ⋯ ⋯ ⋯ x n = k n − r 上式写成向量形式为 X = ( x 1 , x 2 , ⋯ , x n ) T = k 1 ξ 1 + k 2 ξ 2 + ⋯ + k n − r ξ n − r 所有 ξ 1 , ξ 2 , ⋯ , ξ n − r 是齐次线性方程组 A X = 0 的一组基 , 从而它的解空间是 n − r 维的 , 而上式为齐次线性方程组通解 \begin{aligned}
& 上式中, 任取 x_{r + 1}, x_{r + 2}, \cdots , x_n 的一组值 k_1, k_2, \cdots , k_{n - r} , 的齐次线性方程组 AX = \mathbf{0} 的解为 \\
& \begin{cases}
x_1 = k_1 d_{11} + k_2 d_{12} + \cdots + k_{n - r} d_{1, n - r} \\
x_2 = k_1 d_{21} + k_2 d_{22} + \cdots + k_{n - r} d_{2, n - r} \\
\cdots \cdots \cdots \cdots \\
x_r = k_1 d_{r1} + k_2 d_{r2} + \cdots + k_{n - r} d_{r, n - r} \\
x_{r + 1} = k_1 \\
x_{r + 2} = k_2 \\
\cdots \cdots \cdots \cdots \\
x_n = k_{n - r}
\end{cases} \\
& \ \\
& 上式写成向量形式为 \\
& X = (x_1, x_2, \cdots , x_n)^T = k_1 \xi_1 + k_2 \xi_2 + \cdots + k_{n - r} \xi_{n - r} \\
& 所有 \xi_1, \xi_2, \cdots , \xi_{n - r} 是齐次线性方程组 AX = \mathbf{0} 的一组基, 从而它的解空间是 n - r 维的, 而上式为齐次线性方程组通解
\end{aligned}
上式中 , 任取 x r + 1 , x r + 2 , ⋯ , x n 的一组值 k 1 , k 2 , ⋯ , k n − r , 的齐次线性方程组 A X = 0 的解为 ⎩ ⎨ ⎧ x 1 = k 1 d 11 + k 2 d 12 + ⋯ + k n − r d 1 , n − r x 2 = k 1 d 21 + k 2 d 22 + ⋯ + k n − r d 2 , n − r ⋯⋯⋯⋯ x r = k 1 d r 1 + k 2 d r 2 + ⋯ + k n − r d r , n − r x r + 1 = k 1 x r + 2 = k 2 ⋯⋯⋯⋯ x n = k n − r 上式写成向量形式为 X = ( x 1 , x 2 , ⋯ , x n ) T = k 1 ξ 1 + k 2 ξ 2 + ⋯ + k n − r ξ n − r 所有 ξ 1 , ξ 2 , ⋯ , ξ n − r 是齐次线性方程组 A X = 0 的一组基 , 从而它的解空间是 n − r 维的 , 而上式为齐次线性方程组通解
例
求下列齐次线性方程组的一个基础解系并写出通解
{ x 1 + 2 x 2 + 2 x 3 + x 4 = 0 2 x 1 + x 2 − 2 x 3 − 2 x 4 = 0 x 1 − x 2 − 4 x 3 − 3 x 4 = 0 \begin{cases}
x_1 + 2x_2 + 2x_3 + x_4 = 0 \\
2x_1 + x_2 - 2x_3 - 2x_4 = 0 \\
x_1 - x_2 - 4x_3 - 3x_4 = 0
\end{cases}
⎩ ⎨ ⎧ x 1 + 2 x 2 + 2 x 3 + x 4 = 0 2 x 1 + x 2 − 2 x 3 − 2 x 4 = 0 x 1 − x 2 − 4 x 3 − 3 x 4 = 0
解
A = ( 1 2 2 1 2 1 − 2 − 2 1 − 1 − 4 − 3 ) → ⋯ ⋯ ( 1 0 − 2 − 5 3 0 1 2 4 3 0 0 0 0 ) A = \begin{pmatrix}
1 & 2 & 2 & 1 \\
2 & 1 & -2 & -2 \\
1 & -1 & -4 & -3
\end{pmatrix}
\xrightarrow[\cdots]{\cdots}
\begin{pmatrix}
1 & 0 & -2 & - \frac{5}{3} \\
0 & 1 & 2 & \frac{4}{3} \\
0 & 0 & 0 & 0
\end{pmatrix}
A = 1 2 1 2 1 − 1 2 − 2 − 4 1 − 2 − 3 ⋯ ⋯ 1 0 0 0 1 0 − 2 2 0 − 3 5 3 4 0
则原方程组同解方程组为
{ x 1 − 2 x 3 − 5 3 x 4 = 0 x 2 + 2 x 3 + 4 3 x 4 = 0 \begin{cases}
x_1 - 2x_3 - \frac{5}{3} x_4 = 0 \\
x_2 + 2x_3 + \frac{4}{3} x_4 = 0
\end{cases}
{ x 1 − 2 x 3 − 3 5 x 4 = 0 x 2 + 2 x 3 + 3 4 x 4 = 0
上式中分别取 x 3 = 1 , x 4 = 0 x_3 = 1, x_4 = 0 x 3 = 1 , x 4 = 0 和 x 3 = 0 , x 4 = 1 x_3 = 0, x_4 = 1 x 3 = 0 , x 4 = 1 , 得到基础解系 ξ 1 , ξ 2 \xi_1, \xi_2 ξ 1 , ξ 2
ξ 1 = ( 2 , − 2 , 1 , 0 ) T , ξ 2 = ( 5 3 , − 4 3 , 0 , 1 ) T \xi_1 = (2, -2, 1, 0)^T \ , \ \xi_2 = (\frac{5}{3}, - \frac{4}{3}, 0, 1)^T
ξ 1 = ( 2 , − 2 , 1 , 0 ) T , ξ 2 = ( 3 5 , − 3 4 , 0 , 1 ) T
则原方程组通解为
X = ( x 1 , x 2 , x 3 , x 4 ) T = k 1 ξ 1 + k 2 ξ 2 X = (x_1, x_2, x_3, x_4)^T = k_1 \xi_1 + k_2 \xi_2
X = ( x 1 , x 2 , x 3 , x 4 ) T = k 1 ξ 1 + k 2 ξ 2
即
{ x 1 = 2 k 1 + 5 3 k 2 x 2 = − 2 k 1 − 4 3 k 2 x 3 = k 1 x 4 = k 2 k 1 , k 2 ∈ R \begin{cases}
x_1 = 2k_1 + \frac{5}{3} k_2 \\
x_2 = -2k_1 - \frac{4}{3} k_2 \\
x_3 = k_1 \\
x_4 = k_2
\end{cases} \\
\ \\
k_1, k_2 \in R
⎩ ⎨ ⎧ x 1 = 2 k 1 + 3 5 k 2 x 2 = − 2 k 1 − 3 4 k 2 x 3 = k 1 x 4 = k 2 k 1 , k 2 ∈ R
求齐次方程组 A X = 0 AX = \mathbf{0} A X = 0 的通解, 其系数矩阵为
A = ( 1 1 − 2 1 3 2 − 1 2 2 6 3 2 − 4 − 5 − 7 ) A = \begin{pmatrix}
1 & 1 & -2 & 1 & 3 \\
2 & -1 & 2 & 2 & 6 \\
3 & 2 & -4 & -5 & -7
\end{pmatrix}
A = 1 2 3 1 − 1 2 − 2 2 − 4 1 2 − 5 3 6 − 7
解
A → ⋯ ⋯ ( 1 1 − 2 1 3 0 − 3 6 0 0 0 − 1 2 − 8 − 16 ) = B A \xrightarrow[\cdots]{\cdots} \begin{pmatrix}
1 & 1 & -2 & 1 & 3 \\
0 & -3 & 6 & 0 & 0 \\
0 & -1 & 2 & -8 & -16
\end{pmatrix} = B
A ⋯ ⋯ 1 0 0 1 − 3 − 1 − 2 6 2 1 0 − 8 3 0 − 16 = B
r ( B ) = 3 r(B) = 3 r ( B ) = 3 , 继续进行初等列变换, 将其第 1 , 2 1, 2 1 , 2 和 4 4 4 列构成的矩阵化为单位矩阵
B → ⋯ ⋯ ( 1 0 0 0 1 0 1 − 2 0 0 0 0 0 1 2 ) B \xrightarrow[\cdots]{\cdots} \begin{pmatrix}
1 & 0 & 0 & 0 & 1 \\
0 & 1 & -2 & 0 & 0 \\
0 & 0 & 0 & 1 & 2
\end{pmatrix}
B ⋯ ⋯ 1 0 0 0 1 0 0 − 2 0 0 0 1 1 0 2
则齐次线性原方程组同解线性方程组为
{ x 1 + x 5 = 0 x 2 − 2 x 3 = 0 x 4 + 2 x 5 = 0 \begin{cases}
x_1 + x_5 = 0 \\
x_2 - 2x_3 = 0 \\
x_4 + 2x_5 = 0
\end{cases}
⎩ ⎨ ⎧ x 1 + x 5 = 0 x 2 − 2 x 3 = 0 x 4 + 2 x 5 = 0
取 x 3 , x 5 x_3, x_5 x 3 , x 5 诶自由未知量, 分别取 x 3 = 1 , x 5 = 0 x_3 = 1, x_5 = 0 x 3 = 1 , x 5 = 0 和 x 3 = 0 , x 5 = 1 x_3 = 0, x_5 = 1 x 3 = 0 , x 5 = 1 , 的基础解系 ξ 1 , ξ 2 \xi_1, \xi_2 ξ 1 , ξ 2 , 其中
ξ 1 = ( 0 , 2 , 1 , 0 , 0 ) T , ξ 2 = ( − 1 , 0 , 0 , − 2 , 1 ) T \xi_1 = (0, 2, 1, 0, 0)^T \ , \ \xi_2 = (-1, 0, 0, -2, 1)^T
ξ 1 = ( 0 , 2 , 1 , 0 , 0 ) T , ξ 2 = ( − 1 , 0 , 0 , − 2 , 1 ) T
而原方程组通解为
X = k 1 ξ 1 + k 2 ξ 2 X = k_1 \xi_1 + k_2 \xi_2
X = k 1 ξ 1 + k 2 ξ 2
即
{ x 1 = − k 2 x 2 = 2 k 1 x 3 = k 1 x 4 = − 2 k 2 x 5 = k 2 \begin{cases}
x_1 = -k_2 \\
x_2 = 2k_1 \\
x_3 = k_1 \\
x_4 = -2k_2 \\
x_5 = k_2
\end{cases}
⎩ ⎨ ⎧ x 1 = − k 2 x 2 = 2 k 1 x 3 = k 1 x 4 = − 2 k 2 x 5 = k 2
求解
{ x 1 + x 2 + x 3 + 4 x 4 − 3 x 5 = 0 x 1 − x 2 + 3 x 3 − 2 x 4 − x 5 = 0 2 x 1 + x 2 + 3 x 3 + 5 x 4 − 5 x 5 = 0 3 x 1 + x 2 + 5 x 3 + 6 x 4 − 7 x 5 = 0 \begin{cases}
x_1 + x_2 + x_3 + 4x_4 - 3x_5 = 0 \\
x_1 - x_2 + 3x_3 - 2x_4 - x_5 = 0 \\
2x_1 + x_2 + 3x_3 + 5x_4 - 5x_5 = 0 \\
3x_1 + x_2 + 5x_3 + 6x_4 - 7x_5 = 0
\end{cases}
⎩ ⎨ ⎧ x 1 + x 2 + x 3 + 4 x 4 − 3 x 5 = 0 x 1 − x 2 + 3 x 3 − 2 x 4 − x 5 = 0 2 x 1 + x 2 + 3 x 3 + 5 x 4 − 5 x 5 = 0 3 x 1 + x 2 + 5 x 3 + 6 x 4 − 7 x 5 = 0
解
方程个数 m = 4 m = 4 m = 4 , 自变量个数 n = 5 n = 5 n = 5 , m < n m < n m < n , 则方程有无穷多组解
A → ⋯ ⋯ ( 1 0 2 1 − 2 0 1 − 1 3 − 1 0 0 0 0 0 0 0 0 0 0 ) { x 1 = − 2 x 3 − x 4 + 2 x 5 x 2 = x 3 − 3 x 4 + x 5 , 其中 x 3 , x 4 , x 5 为自由自变量 分别令 ( x 3 x 4 x 5 ) 取值 ( 1 0 0 ) , ( 0 1 0 ) , ( 0 0 1 ) ξ 1 = ( − 2 , 1 , 1 , 0 , 0 ) T , ξ 2 = ( − 1 , − 3 , 0 , 1 , 0 ) T , ξ 3 = ( 2 , 1 , 0 , 0 , 1 ) T X = k 1 ξ 1 + k 2 ξ 2 + k 3 ξ 3 A \xrightarrow[\cdots]{\cdots} \begin{pmatrix}
1 & 0 & 2 & 1 & -2 \\
0 & 1 & -1 & 3 & -1 \\
0 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0 & 0
\end{pmatrix} \\
\ \\
\begin{cases}
x_1 = -2x_3 - x_4 + 2x_5 \\
x_2 = x_3 - 3x_4 + x_5
\end{cases} \
, \ 其中 x_3, x_4, x_5 为自由自变量 \\
\ \\
分别令 \begin{pmatrix} x_3 \\ x_4 \\ x_5 \end{pmatrix} 取值
\begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix} \ , \
\begin{pmatrix} 0 \\ 1 \\ 0 \end{pmatrix} \ , \
\begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix} \\
\ \\
\xi_1 = (-2, 1, 1, 0, 0)^T \ , \ \xi_2 = (-1, -3, 0, 1, 0)^T \ , \ \xi_3 = (2, 1, 0, 0, 1)^T \\
\ \\
X = k_1 \xi_1 + k_2 \xi_2 + k_3 \xi_3
A ⋯ ⋯ 1 0 0 0 0 1 0 0 2 − 1 0 0 1 3 0 0 − 2 − 1 0 0 { x 1 = − 2 x 3 − x 4 + 2 x 5 x 2 = x 3 − 3 x 4 + x 5 , 其中 x 3 , x 4 , x 5 为自由自变量 分别令 x 3 x 4 x 5 取值 1 0 0 , 0 1 0 , 0 0 1 ξ 1 = ( − 2 , 1 , 1 , 0 , 0 ) T , ξ 2 = ( − 1 , − 3 , 0 , 1 , 0 ) T , ξ 3 = ( 2 , 1 , 0 , 0 , 1 ) T X = k 1 ξ 1 + k 2 ξ 2 + k 3 ξ 3
设 A = ( a i j ) m × n A = (a_{ij})_{m \times n} A = ( a ij ) m × n , B = ( s j k ) n × l B = (s_{jk})_{n \times l} B = ( s jk ) n × l , A B = O AB = O A B = O , 证明 r ( A ) + r ( B ) ≤ n r(A) + r(B) \le n r ( A ) + r ( B ) ≤ n
证明
记 B = ( β 1 , β 2 , ⋯ , β l ) B = (\beta_1, \beta_2, \cdots , \beta_l) B = ( β 1 , β 2 , ⋯ , β l ) , 则从 A B = O AB = O A B = O 和 A B = ( A β 1 , A β 2 , ⋯ , A β l ) AB = (A \beta_1, A \beta_2, \cdots , A \beta_l) A B = ( A β 1 , A β 2 , ⋯ , A β l ) 可知
A β k = 0 , ( k = 1 , 2 , ⋯ , l ) A \beta_k = \mathbf{0} \ , \ (k = 1, 2, \cdots , l)
A β k = 0 , ( k = 1 , 2 , ⋯ , l )
即 B B B 的 l l l 个列向量都是齐次方程 A X = O AX = O A X = O 的解, 由于 A X = O AX = O A X = O 的基础解系含 n − r ( A ) n - r(A) n − r ( A ) 的向量 ξ 1 , ξ 2 , ⋯ , ξ n − r ( A ) \xi_1, \xi_2, \cdots , \xi_{n - r(A)} ξ 1 , ξ 2 , ⋯ , ξ n − r ( A ) , 即方程解空间 V V V 的维数为 n − r ( A ) n - r(A) n − r ( A ) , 则 β 1 , β 2 , ⋯ , β l ∈ V \beta_1, \beta_2, \cdots , \beta_l \in V β 1 , β 2 , ⋯ , β l ∈ V 时, 次组向量的秩不会大于解空间 V V V 的维数, 即 r ( B ) ≤ n − r ( A ) r(B) \le n - r(A) r ( B ) ≤ n − r ( A ) , 则 r ( A ) + r ( B ) ≤ n r(A) + r(B) \le n r ( A ) + r ( B ) ≤ n
4.3 非齐次线性方程组解的结构
非齐次线性方程组 A X = b AX = b A X = b , 其中 A A A 为 m × n m \times n m × n 矩阵, b ≠ 0 b \ne 0 b = 0 为 m m m 维列向量, 则 A X = b AX = b A X = b 有解的充要条件是系数矩阵 A A A 和增广矩阵 A ‾ \overline{A} A 的秩相等, 且这两个矩阵的秩都等于未知数个数 n n n 时 A X = b AX = b A X = b 有唯一解
由上一节知, A X = 0 AX = \mathbf{0} A X = 0 的解关于线性运算封闭, 对于非齐次线性方程组, 这个性质不再保持. 设 X 1 , X 2 X_1, X_2 X 1 , X 2 是非齐次线性方程组 A X = b AX = b A X = b 的解, 因为:
A ( X ! + X 2 ) = A X 1 + A X 2 = b + b = 2 b ≠ B A(X_! + X_2) = AX_1 + AX_2 = b + b = 2b \ne B
A ( X ! + X 2 ) = A X 1 + A X 2 = b + b = 2 b = B
则 X 1 , X 2 X_1, X_2 X 1 , X 2 不再是 A X = b AX = b A X = b 的解
定理1 设 η 1 , η 2 \eta_1, \eta_2 η 1 , η 2 是非齐次线性方程组 A X = b AX = b A X = b 的两个解, ξ \xi ξ 是其导出组 A X = 0 AX = \mathbf{0} A X = 0 的解, 则下面四个命题等价
η 1 − η 2 \eta_1 - \eta_2 η 1 − η 2 是导出组 A X = 0 AX = \mathbf{0} A X = 0 的解
η 1 + ξ \eta_1 + \xi η 1 + ξ 是线性方程组 A X = b AX = b A X = b 的解
证
A ( η 1 − η 2 ) = A η 1 − A η 2 = b − b = 0 A ( η 1 + ξ ) = A η 1 + A ξ = b + 0 = b A(\eta_1 - \eta_2) = A \eta_1 - A \eta_2 = b - b = \mathbf{0} \\
A(\eta_1 + \xi) = A \eta_1 + A \xi = b + \mathbf{0} = b
A ( η 1 − η 2 ) = A η 1 − A η 2 = b − b = 0 A ( η 1 + ξ ) = A η 1 + A ξ = b + 0 = b
定理2 若 η 0 \eta_0 η 0 是非齐次线性方程组 A X = b AX = b A X = b 的一个特解, 则非齐次线性方程组 A X = b AX = b A X = b 的任一解 η \eta η 都可表为
η = η 0 + ξ \eta = \eta_0 + \xi
η = η 0 + ξ
的形式, 其中 ξ \xi ξ 是导出组 A X = 0 AX = \mathbf{0} A X = 0 的解
证
η = η 0 + ( η − η 0 ) \eta = \eta_0 + (\eta - \eta_0)
η = η 0 + ( η − η 0 )
由定理1, ξ = η − η 0 \xi = \eta - \eta_0 ξ = η − η 0 是导出组的一个解, 且 η = η 0 + ξ \eta = \eta_0 + \xi η = η 0 + ξ
据定理2, 求出 A X = b AX = b A X = b 的全部解, 只需找到一个特解以及它的导出组的全部解, 导出组解可由基础解系表示
因此, 只需求 A X = b AX = b A X = b 的特解和导出组 A X = 0 AX = \mathbf{0} A X = 0 的基础解系表示它的全部解.
若 η 0 \eta_0 η 0 是非齐次线性方程组的一个特解, ξ 1 , ξ 2 , ⋯ , ξ n − r \xi_1, \xi_2, \cdots , \xi_{n - r} ξ 1 , ξ 2 , ⋯ , ξ n − r 是其导出组的一个基础解系, 则非齐次线性方程组 A X = b AX = b A X = b 的任一解 η \eta η 都可表为
η = η 0 + k 1 η 1 + k 2 η 2 + ⋯ + k n − r η n − r \eta = \eta_0 + k_1 \eta_1 + k_2 \eta_2 + \cdots + k_{n - r} \eta_{n - r}
η = η 0 + k 1 η 1 + k 2 η 2 + ⋯ + k n − r η n − r
其中 k 1 , k 2 , ⋯ , k n − r k_1, k_2, \cdots , k_{n - r} k 1 , k 2 , ⋯ , k n − r 为任意实数, r = r ( A ) < n r = r(A) < n r = r ( A ) < n
例
下列方程是否有解, 若有解, 求解
{ 2 x + 3 y + z = 1 x + y + 2 z = 2 4 x + 7 y + 7 z = − 1 x + 3 y + 8 z = − 4 \begin{cases}
& 2x + 3y + z = 1 \\
& x + y + 2z = 2 \\
& 4x + 7y + 7z = -1 \\
& x + 3y + 8z = -4
\end{cases}
⎩ ⎨ ⎧ 2 x + 3 y + z = 1 x + y + 2 z = 2 4 x + 7 y + 7 z = − 1 x + 3 y + 8 z = − 4
解
先写出线性方程组的增广矩阵, 并初等变换
A ‾ = ( 2 3 1 1 1 1 − 2 2 4 7 7 − 1 1 3 8 − 4 ) → ⋯ ⋯ ( 1 0 − 7 5 0 1 5 3 0 0 0 0 0 0 0 0 ) \overline{A} = \begin{pmatrix}
2 & 3 & 1 & 1 \\
1 & 1 & -2 & 2 \\
4 & 7 & 7 & -1 \\
1 & 3 & 8 & -4
\end{pmatrix}
\xrightarrow[\cdots]{\cdots}
\begin{pmatrix}
1 & 0 & -7 & 5 \\
0 & 1 & 5 & 3 \\
0 & 0 & 0 & 0 \\
0 & 0 & 0 & 0
\end{pmatrix}
A = 2 1 4 1 3 1 7 3 1 − 2 7 8 1 2 − 1 − 4 ⋯ ⋯ 1 0 0 0 0 1 0 0 − 7 5 0 0 5 3 0 0
r ( A ‾ ) = r ( A ) = 2 < 3 r(\overline{A}) = r(A) = 2 < 3 r ( A ) = r ( A ) = 2 < 3 , 故原方程有无穷组解
{ x 1 − 7 x 3 = 5 x 2 + 5 x 3 = − 3 \begin{cases}
& x_1 - 7x_3 = 5 \\
& x_2 + 5x_3 = -3
\end{cases}
{ x 1 − 7 x 3 = 5 x 2 + 5 x 3 = − 3
得到通解表达式
{ x 1 = 5 + 7 k x 2 = − 3 − 5 k x 3 = k \begin{cases}
& x_1 = 5 + 7k \\
& x_2 = -3 - 5k \\
& x_3 = k
\end{cases}
⎩ ⎨ ⎧ x 1 = 5 + 7 k x 2 = − 3 − 5 k x 3 = k
写成向量形式
( x 1 x 2 x 3 ) = ( 5 − 3 0 ) + k ( 7 − 5 1 ) \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} =
\begin{pmatrix} 5 \\ -3 \\ 0 \end{pmatrix} +
k \begin{pmatrix} 7 \\ -5 \\ 1 \end{pmatrix}
x 1 x 2 x 3 = 5 − 3 0 + k 7 − 5 1
其中 η 0 = ( 5 , − 3 , 0 ) T \eta_0 = (5, -3, 0)^T η 0 = ( 5 , − 3 , 0 ) T 为原线性方程组的一个特解, 而 η 0 = ( 7 , − 5 , 1 ) T \eta_0 = (7, -5, 1)^T η 0 = ( 7 , − 5 , 1 ) T 为导出组的一个基础解系
例
设线性方程组 A X = b AX = b A X = b 的增广矩阵为
( 1 3 − 1 2 − 1 ∣ − 4 − 3 1 2 − 5 − 4 ∣ − 1 2 − 3 − 1 − 1 1 ∣ 4 − 4 16 1 3 − 9 ∣ − 21 ) \begin{pmatrix}
1 & 3 & -1 & 2 & -1 & | & -4 \\
-3 & 1 & 2 & -5 & -4 & | & -1 \\
2 & -3 & -1 & -1 & 1 & | & 4 \\
-4 & 16 & 1 & 3 & -9 & | & -21
\end{pmatrix}
1 − 3 2 − 4 3 1 − 3 16 − 1 2 − 1 1 2 − 5 − 1 3 − 1 − 4 1 − 9 ∣ ∣ ∣ ∣ − 4 − 1 4 − 21
求此线性方程组通解
解
A ‾ → ⋯ ⋯ ( 1 0 0 − 27 − 22 2 0 1 0 − 4 − 4 − 1 0 0 1 − 41 − 33 3 0 0 0 0 0 0 ) \overline{A} \xrightarrow[\cdots]{\cdots}
\begin{pmatrix}
1 & 0 & 0 & -27 & -22 & 2 \\
0 & 1 & 0 & -4 & -4 & -1 \\
0 & 0 & 1 & -41 & -33 & 3 \\
0 & 0 & 0 & 0 & 0 & 0
\end{pmatrix}
A ⋯ ⋯ 1 0 0 0 0 1 0 0 0 0 1 0 − 27 − 4 − 41 0 − 22 − 4 − 33 0 2 − 1 3 0
显然 r ( A ‾ ) = r ( A ) = 3 < 5 r(\overline{A}) = r(A) = 3 < 5 r ( A ) = r ( A ) = 3 < 5 , 故线性方程组有无穷多组解
{ x 1 − 27 x 4 − 22 x 5 = 2 x 2 − 4 x 4 − 4 x 5 = − 1 x 3 − 41 x 4 − 33 x 5 = 3 \begin{cases}
& x_1 - 27x_4 - 22x_5 = 2 \\
& x_2 - 4x_4 - 4x_5 = -1 \\
& x_3 - 41x_4 - 33x_5 = 3
\end{cases}
⎩ ⎨ ⎧ x 1 − 27 x 4 − 22 x 5 = 2 x 2 − 4 x 4 − 4 x 5 = − 1 x 3 − 41 x 4 − 33 x 5 = 3
令 x 4 = x 5 = 0 x_4 = x_5 = 0 x 4 = x 5 = 0 , 的原线性方程组的一个特解 η 0 = ( 2 , − 1 , 3 , 0 , 0 ) T \eta_0 = (2, -1, 3, 0, 0)^T η 0 = ( 2 , − 1 , 3 , 0 , 0 ) T , 令右端向量为零, 分别取 ( x 4 , x 5 ) = ( 1 , 0 ) , ( 0 , 1 ) (x_4, x_5) = (1, 0), (0, 1) ( x 4 , x 5 ) = ( 1 , 0 ) , ( 0 , 1 ) , 可得导出组的一个基础解系
ξ 1 = ( 27 , 4 , 41 , 1 , 0 ) T , ξ 2 = ( 22 , 4 , 33 , 0 , 1 ) T \xi_1 = (27, 4, 41, 1, 0)^T \ , \ \xi_2 = (22, 4, 33, 0, 1)^T
ξ 1 = ( 27 , 4 , 41 , 1 , 0 ) T , ξ 2 = ( 22 , 4 , 33 , 0 , 1 ) T
故原方程的通解为 X = η 0 + k 1 ξ 1 + k 2 ξ 2 X = \eta_0 + k_1 \xi_1 + k_2 \xi_2 X = η 0 + k 1 ξ 1 + k 2 ξ 2
例
设四元非齐次线性方程组系数矩阵秩为 3 3 3 , 已知 η 1 , η 2 , η 3 \eta_1, \eta_2, \eta_3 η 1 , η 2 , η 3 是它的三个解向量, 且 η 1 = ( 2 , 3 , 4 , 5 ) T , η 2 + η 3 = ( 1 , 2 , 3 , 4 ) T \eta_1 = (2, 3, 4, 5)^T , \eta_2 + \eta_3 = (1, 2, 3, 4)^T η 1 = ( 2 , 3 , 4 , 5 ) T , η 2 + η 3 = ( 1 , 2 , 3 , 4 ) T , 求该线性方程组的通解
解
设四元非齐次线性方程组为 A X = b AX = b A X = b , 则 A η 1 = b , A η 2 = b , A η 3 = b A \eta_1 = b, A \eta_2 = b, A \eta_3 = b A η 1 = b , A η 2 = b , A η 3 = b , 又
A ⋅ 1 2 ( η 2 + η 3 ) = 1 2 A η 2 + 1 2 A η 3 = 1 2 b + 1 2 b = b A \cdot \frac{1}{2} (\eta_2 + \eta_3) = \frac{1}{2} A \eta_2 + \frac{1}{2} A \eta_3 = \frac{1}{2} b + \frac{1}{2} b = b
A ⋅ 2 1 ( η 2 + η 3 ) = 2 1 A η 2 + 2 1 A η 3 = 2 1 b + 2 1 b = b
故 1 2 ( η 2 + η 3 ) \frac{1}{2} (\eta_2 + \eta_3) 2 1 ( η 2 + η 3 ) 也是线性方程组 A X = b AX = b A X = b 的解, 因此 η 1 − 1 2 ( η 2 + η 3 ) \eta_1 - \frac{1}{2} (\eta_2 + \eta_3) η 1 − 2 1 ( η 2 + η 3 ) 是它导出组 A X = 0 AX = \mathbf{0} A X = 0 的解
因为 r ( A ) = 3 r(A) = 3 r ( A ) = 3 , 故 A X = 0 AX = \mathbf{0} A X = 0 的基础解系中只含有一个向量, 又
η 1 − 1 2 ( η 2 + η 3 ) = ( 3 2 , 2 , 5 2 , 3 ) T ≠ 0 \eta_1 - \frac{1}{2} (\eta_2 + \eta_3) = (\frac{3}{2}, 2, \frac{5}{2}, 3)^T \ne \mathbf{0}
η 1 − 2 1 ( η 2 + η 3 ) = ( 2 3 , 2 , 2 5 , 3 ) T = 0
故 η 1 − 1 2 ( η 2 + η 3 ) \eta_1 - \frac{1}{2} (\eta_2 + \eta_3) η 1 − 2 1 ( η 2 + η 3 ) 是 A X = 0 AX = \mathbf{0} A X = 0 的基础解系, 故 A X = b AX = b A X = b 的通解为
X = η 1 + k ( η 1 = 1 2 ( η 1 + η 2 ) ) = ( 2 , 3 , 4 , 5 ) T + k ( 3 2 , 2 , 5 2 , 3 ) T X = \eta_1 + k (\eta_1 = \frac{1}{2} (\eta_1 + \eta_2)) = (2, 3, 4, 5)^T + k(\frac{3}{2}, 2, \frac{5}{2}, 3)^T
X = η 1 + k ( η 1 = 2 1 ( η 1 + η 2 )) = ( 2 , 3 , 4 , 5 ) T + k ( 2 3 , 2 , 2 5 , 3 ) T
4.4 矩阵的特征值与特征向量
4.4.1 特征值与特征向量
定义1 设 A A A 是 n n n 阶方阵, 若存在一个数 λ \lambda λ 和 n n n 维非零向量 α \alpha α , 使
A α = λ α A \alpha = \lambda \alpha
A α = λ α
成立, 则称数 λ \lambda λ 为方阵 A A A 的特征值, 非零向量 α \alpha α 称为 A A A 对应于特征值 λ \lambda λ 的特征向量
若 α , β \alpha, \beta α , β 是矩阵 A A A 的属于特征值 λ \lambda λ 的特征向量, 则 k α k \alpha k α 和 k 1 α + k 2 β k_1 \alpha + k_2 \beta k 1 α + k 2 β 也为 A A A 的属于特征值 λ \lambda λ 的特征向量
设 n n n 阶矩阵 A A A 的特征值为 λ \lambda λ , 非零向量 α \alpha α 为 A A A 的属于特征值 λ \lambda λ 的特征向量, 则
( λ E − A ) α = 0 (\lambda E - A) \alpha = \mathbf{0}
( λ E − A ) α = 0
因此, 特征向量 α \alpha α 是齐次线性方程组
( λ E − A ) X = 0 (\lambda E - A) X = \mathbf{0}
( λ E − A ) X = 0
的非零解. 又方程组有非零解充要条件是其系数矩阵为降秩矩阵, 即系数矩阵的行列式
∣ λ E − A ∣ = 0 \left | \lambda E - A \right | = 0
∣ λ E − A ∣ = 0
因此, λ \lambda λ 是方阵 A A A 的特征值的充要条件是 ∣ λ E − A ∣ = 0 \left | \lambda E - A \right | = 0 ∣ λ E − A ∣ = 0
定义2 设 A A A 是 n n n 阶方阵, 称 f ( λ ) = ∣ λ E − A ∣ f(\lambda) = \left | \lambda E - A \right | f ( λ ) = ∣ λ E − A ∣ 为 A A A 的特征多项式, 方程 ∣ λ E − A ∣ = 0 \left | \lambda E - A \right | = 0 ∣ λ E − A ∣ = 0 称为 A A A 的特征方程
由此可知, 矩阵 A A A 的特征值就是其特征方程的根. 复数范围内, n n n 阶矩阵 A A A 有 n n n 个特征值
矩阵 A A A 的属于特征值 λ \lambda λ 的特征向量就是齐次线性方程组 ( λ E − A ) = 0 (\lambda E - A) = \mathbf{0} ( λ E − A ) = 0 的非零解
注意: 由于 ∣ λ E − A ∣ = ( − 1 ) n ∣ λ E − A ∣ \left | \lambda E - A \right | = (-1)^n \left | \lambda E - A \right | ∣ λ E − A ∣ = ( − 1 ) n ∣ λ E − A ∣ , 故又是也称 ∣ λ E − A ∣ \left | \lambda E - A \right | ∣ λ E − A ∣ 为 A A A 的特征方程
相应的, 矩阵 A A A 的属于特征值 λ \lambda λ 的特征向量是齐次线性方程组 ( λ E − A ) X = 0 (\lambda E - A) X = \mathbf{0} ( λ E − A ) X = 0 的非零解
求解一个矩阵 A A A 的特征值与特征方程的步骤为
求出 A A A 的特征方程 ∣ λ E − A ∣ = 0 \left | \lambda E - A \right | = 0 ∣ λ E − A ∣ = 0 的全部根, 即得 A A A 的全部特征值 λ 1 , λ 2 , ⋯ , λ n \lambda_1, \lambda_2, \cdots, \lambda_n λ 1 , λ 2 , ⋯ , λ n
将每个特征值 λ i \lambda_i λ i 代入齐次线性方程组 ( λ i E − A ) X = 0 (\lambda_i E - A) X = \mathbf{0} ( λ i E − A ) X = 0 , 求出基础解系, 就是 A A A 对应于特征值 λ i \lambda_i λ i 的特征向量, 基础解系的线性组合(零向量除外)就是 A A A 对应于 λ i \lambda_i λ i 的全部特征向量
例 求矩阵
A = ( − 1 1 0 − 4 3 0 1 0 2 ) A = \begin{pmatrix}
-1 & 1 & 0 \\
-4 & 3 & 0 \\
1 & 0 & 2
\end{pmatrix}
A = − 1 − 4 1 1 3 0 0 0 2
的特征值和相应的特征向量
解 A A A 的特征方程为
∣ λ E − A ∣ = ∣ λ + 1 − 1 0 4 λ − 3 0 − 1 0 λ − 2 ∣ = ( λ − 2 ) ( λ − 1 ) 2 = 0 \left | \lambda E - A \right | =
\begin{vmatrix}
\lambda + 1 & -1 & 0 \\
4 & \lambda - 3 & 0 \\
-1 & 0 & \lambda - 2
\end{vmatrix}
= (\lambda - 2)(\lambda - 1)^2 = 0
∣ λ E − A ∣ = λ + 1 4 − 1 − 1 λ − 3 0 0 0 λ − 2 = ( λ − 2 ) ( λ − 1 ) 2 = 0
故 A A A 的特征值分别为 λ 1 = 2 , λ 2 = λ 3 = 1 \lambda_1 = 2, \lambda_2 = \lambda_3 = 1 λ 1 = 2 , λ 2 = λ 3 = 1
当 λ = 2 \lambda = 2 λ = 2 时
λ E − A = 2 E − A = ( 3 − 1 0 4 − 1 0 − 1 0 0 ) → ⋯ ⋯ ( 1 0 0 0 1 0 0 0 0 ) \lambda E - A = 2E - A =
\begin{pmatrix}
3 & -1 & 0 \\
4 & -1 & 0 \\
-1 & 0 & 0
\end{pmatrix}
\xrightarrow[\cdots]{\cdots}
\begin{pmatrix}
1 & 0 & 0 \\
0 & 1 & 0 \\
0 & 0 & 0
\end{pmatrix}
λ E − A = 2 E − A = 3 4 − 1 − 1 − 1 0 0 0 0 ⋯ ⋯ 1 0 0 0 1 0 0 0 0
因此, 齐次线性方程组 ( 2 E − A ) X = 0 (2E - A)X = \mathbf{0} ( 2 E − A ) X = 0 的一个基础解系为 ξ 1 = ( 0 , 0 , 1 ) T \xi_1 = (0, 0, 1)^T ξ 1 = ( 0 , 0 , 1 ) T , 从而矩阵 A A A 的属于特征值 λ = 2 \lambda = 2 λ = 2 的一个特征向量为 ξ 1 = ( 0 , 0 , 1 ) T \xi_1 = (0, 0, 1)^T ξ 1 = ( 0 , 0 , 1 ) T
当 λ = 1 \lambda = 1 λ = 1 时
E − A = ( 2 − 1 0 4 − 2 0 − 1 0 − 1 ) → ⋯ ⋯ ( 1 0 1 0 1 2 0 0 0 ) E - A =
\begin{pmatrix}
2 & -1 & 0 \\
4 & -2 & 0 \\
-1 & 0 & -1
\end{pmatrix}
\xrightarrow[\cdots]{\cdots}
\begin{pmatrix}
1 & 0 & 1 \\
0 & 1 & 2 \\
0 & 0 & 0
\end{pmatrix}
E − A = 2 4 − 1 − 1 − 2 0 0 0 − 1 ⋯ ⋯ 1 0 0 0 1 0 1 2 0
因此, 齐次线性方程组 ( E − A ) X = 0 (E - A)X = \mathbf{0} ( E − A ) X = 0 的一个基础解系为 ξ 2 = ( − 1 , − 2 , 1 ) T \xi_2 = (-1, -2, 1)^T ξ 2 = ( − 1 , − 2 , 1 ) T , 从而矩阵 A A A 的属于特征值 λ = 1 \lambda = 1 λ = 1 的一个特征向量为 ξ 2 = ( − 1 , − 2 , 1 ) T \xi_2 = (-1, -2, 1)^T ξ 2 = ( − 1 , − 2 , 1 ) T
综上, k 1 ξ 1 , k 2 ξ 2 k_1 \xi_1, k_2 \xi_2 k 1 ξ 1 , k 2 ξ 2 分别为 A A A 的属于特征值 2 2 2 和 1 1 1 的特征向量
例 求矩阵
A = ( 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ) A = \begin{pmatrix}
1 & 1 & 1 & 1 \\
1 & 1 & 1 & 1 \\
1 & 1 & 1 & 1 \\
1 & 1 & 1 & 1
\end{pmatrix}
A = 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
的特征值和特征向量
解
A A A 的特征多项式
f ( λ ) = ∣ λ E − A ∣ = ∣ λ − 1 − 1 − 1 − 1 − 1 λ − 1 − 1 − 1 − 1 − 1 λ − 1 − 1 − 1 − 1 − 1 λ − 1 ∣ f(\lambda) = \left | \lambda E - A \right | =
\begin{vmatrix}
\lambda - 1 & -1 & -1 & -1 \\
-1 & \lambda - 1 & -1 & -1 \\
-1 & -1 & \lambda - 1 & -1 \\
-1 & -1 & -1 & \lambda - 1
\end{vmatrix}
f ( λ ) = ∣ λ E − A ∣ = λ − 1 − 1 − 1 − 1 − 1 λ − 1 − 1 − 1 − 1 − 1 λ − 1 − 1 − 1 − 1 − 1 λ − 1
把行列式二三四列加到一列, 得
f ( λ ) = ∣ λ − 4 − 1 − 1 − 1 λ − 4 λ − 1 − 1 − 1 λ − 4 − 1 λ − 1 − 1 λ − 4 − 1 − 1 λ − 1 ∣ = ( λ − 4 ) ∣ 1 − 1 − 1 − 1 1 λ − 1 − 1 − 1 1 − 1 λ − 1 − 1 1 − 1 − 1 λ − 1 ∣ = ( λ − 4 ) ∣ 1 − 1 − 1 − 1 0 λ 0 0 0 0 λ 0 0 0 0 λ ∣ = λ 3 ( λ − 4 ) \begin{aligned}
& f(\lambda) = \begin{vmatrix}
\lambda - 4 & -1 & -1 & -1 \\
\lambda - 4 & \lambda - 1 & -1 & -1 \\
\lambda - 4 & -1 & \lambda - 1 & -1 \\
\lambda - 4 & -1 & -1 & \lambda - 1
\end{vmatrix} \\
& = (\lambda - 4) \begin{vmatrix}
1 & -1 & -1 & -1 \\
1 & \lambda - 1 & -1 & -1 \\
1 & -1 & \lambda - 1 & -1 \\
1 & -1 & -1 & \lambda - 1
\end{vmatrix} \\
& =(\lambda - 4) \begin{vmatrix}
1 & -1 & -1 & -1 \\
0 & \lambda & 0 & 0 \\
0 & 0 & \lambda & 0 \\
0 & 0 & 0 & \lambda
\end{vmatrix} \\
& =\lambda^3 (\lambda - 4)
\end{aligned}
f ( λ ) = λ − 4 λ − 4 λ − 4 λ − 4 − 1 λ − 1 − 1 − 1 − 1 − 1 λ − 1 − 1 − 1 − 1 − 1 λ − 1 = ( λ − 4 ) 1 1 1 1 − 1 λ − 1 − 1 − 1 − 1 − 1 λ − 1 − 1 − 1 − 1 − 1 λ − 1 = ( λ − 4 ) 1 0 0 0 − 1 λ 0 0 − 1 0 λ 0 − 1 0 0 λ = λ 3 ( λ − 4 )
故 A A A 的特征值为 λ 1 = λ 2 = λ 3 = 0 , λ 4 = 4 \lambda_1 = \lambda_2 = \lambda_3 = 0, \lambda_4 = 4 λ 1 = λ 2 = λ 3 = 0 , λ 4 = 4
当 λ = 0 \lambda = 0 λ = 0 时, ( λ E − A ) X = − A X = 0 (\lambda E - A) X = -AX = \mathbf{0} ( λ E − A ) X = − A X = 0 的基础解系为方程
x 1 + x 2 + x 3 + x 4 = 0 x_1 + x_2 + x_3 + x_4 = 0
x 1 + x 2 + x 3 + x 4 = 0
的基础解系, 即 ξ 1 = ( − 1 , − 1 , 0 , 0 ) T , ξ 2 = ( − 1 , 0 , 1 , 0 ) T , ξ 3 = ( − 1 , 0 , 0 , 1 ) T \xi_1 = (-1, -1, 0, 0)^T, \xi_2 = (-1, 0, 1, 0)^T, \xi_3 = (-1, 0, 0, 1)^T ξ 1 = ( − 1 , − 1 , 0 , 0 ) T , ξ 2 = ( − 1 , 0 , 1 , 0 ) T , ξ 3 = ( − 1 , 0 , 0 , 1 ) T
故 A A A 的输入 λ = 0 \lambda = 0 λ = 0 的特征向量为全体 k 1 ξ 1 + k 2 ξ 2 + k 3 ξ 3 k_1 \xi_1 + k_2 \xi_2 + k_3 \xi_3 k 1 ξ 1 + k 2 ξ 2 + k 3 ξ 3
当 λ = 4 \lambda = 4 λ = 4 时
4 E − A = ( 3 − 1 − 1 − 1 − 1 3 − 1 − 1 − 1 − 1 3 − 1 − 1 − 1 − 1 3 ) → ( 1 0 0 − 1 0 1 0 − 1 0 0 1 − 1 0 0 0 0 ) 4E - A = \begin{pmatrix}
3 & -1 & -1 & -1 \\
-1 & 3 & -1 & -1 \\
-1 & -1 & 3 & -1 \\
-1 & -1 & -1 & 3
\end{pmatrix}
\xrightarrow[]{} \begin{pmatrix}
1 & 0 & 0 & -1 \\
0 & 1 & 0 & -1 \\
0 & 0 & 1 & -1 \\
0 & 0 & 0 & 0
\end{pmatrix}
4 E − A = 3 − 1 − 1 − 1 − 1 3 − 1 − 1 − 1 − 1 3 − 1 − 1 − 1 − 1 3 1 0 0 0 0 1 0 0 0 0 1 0 − 1 − 1 − 1 0
因此, 齐次线性方程组 ( 4 E − A ) X = 0 (4E - A)X = \mathbf{0} ( 4 E − A ) X = 0 的一个基础解系为 ξ 4 = ( 1 , 1 , 1 , 1 ) T \xi_4 = (1, 1, 1, 1)^T ξ 4 = ( 1 , 1 , 1 , 1 ) T , 而 k 4 ξ 4 k_4 \xi_4 k 4 ξ 4 是 A A A 的属于 λ = 4 \lambda = 4 λ = 4 的全部特征向量
4.4.2 特征值与特征向量的性质
性质1 n n n 阶矩阵 A A A 与它的转置矩阵 A T A^T A T 有相同的特征值
证
∣ λ E − A T ∣ = ∣ ( λ E − A ) T ∣ = ∣ λ E − A ∣ \left | \lambda E - A^T \right | = \left | (\lambda E - A)^T \right | = \left | \lambda E - A \right |
λ E − A T = ( λ E − A ) T = ∣ λ E − A ∣
则 A T A^T A T 和 A A A 有相同的特征多项式
性质2 设 A = ( a i j ) A = (a_{ij}) A = ( a ij ) 是 n n n 阶矩阵, 则
f ( λ ) = ∣ λ E − A ∣ = ∣ λ − a 11 − a 12 ⋯ − a 1 n − a 21 λ − a 22 ⋯ − a 2 n ⋮ ⋮ ⋮ − a n 1 − a n 2 ⋯ λ − a n n ∣ λ n − ( a 11 + a 22 + ⋯ + a n n ) λ n − 1 + ⋯ + ( − 1 ) n ∣ A ∣ \begin{aligned}
& f(\lambda) = \left | \lambda E - A \right | = \\
& \begin{vmatrix}
\lambda - a_{11} & -a_{12} & \cdots & -a_{1n} \\
-a_{21} & \lambda - a_{22} & \cdots & -a_{2n} \\
\vdots & \vdots & & \vdots \\
-a_{n1} & -a_{n2} & \cdots & \lambda - a_{nn}
\end{vmatrix} \\
& \lambda^n - (a_{11} + a_{22} + \cdots + a_{nn}) \lambda^{n - 1} + \cdots + (-1)^n \left | A \right |
\end{aligned}
f ( λ ) = ∣ λ E − A ∣ = λ − a 11 − a 21 ⋮ − a n 1 − a 12 λ − a 22 ⋮ − a n 2 ⋯ ⋯ ⋯ − a 1 n − a 2 n ⋮ λ − a nn λ n − ( a 11 + a 22 + ⋯ + a nn ) λ n − 1 + ⋯ + ( − 1 ) n ∣ A ∣
设 λ 1 , λ 2 , ⋯ , λ n \lambda_1, \lambda_2, \cdots, \lambda_n λ 1 , λ 2 , ⋯ , λ n 是 A A A 的 n n n 个特征值, 则由 n n n 次代数方程组的跟据系数关系知
λ 1 + λ 2 + ⋯ + λ n = a 11 + a 22 + ⋯ + a n n \lambda_1 + \lambda_2 + \cdots + \lambda_n = a_{11} + a_{22} + \cdots + a_{nn} λ 1 + λ 2 + ⋯ + λ n = a 11 + a 22 + ⋯ + a nn
∣ A ∣ = λ 1 λ 2 ⋯ λ n \left | A \right | = \lambda_1 \lambda_2 \cdots \lambda_n ∣ A ∣ = λ 1 λ 2 ⋯ λ n
其中 A A A 的主对角线元素之和 a 11 + a 22 + ⋯ + a n n a_{11} + a_{22} + \cdots + a_{nn} a 11 + a 22 + ⋯ + a nn 称为矩阵 A A A 的迹, 记作 t r ( A ) tr(A) t r ( A )
由性质2可知, 若 A A A 可逆, 则 A A A 的特征值都不等于零, 而 A A A 是奇异矩阵时, A A A 至少有一个零特征值
性质3 设 λ \lambda λ 是矩阵 A A A 的特征值, α \alpha α 是 A A A 的属于特征值 λ \lambda λ 的特征向量, 则
k λ k \lambda kλ 是 k A kA k A 的特征值 ( k ∈ R ) (k \in R) ( k ∈ R )
λ m \lambda^m λ m 是 A m A^m A m 的特征值 ( m 是正整数 ) (m是正整数) ( m 是正整数 )
当 A A A 可逆时, λ − 1 \lambda^{-1} λ − 1 是 A − 1 A^{-1} A − 1 的特征值
而且, α \alpha α 仍是 k A , A m , A − 1 kA, A^m, A^{-1} k A , A m , A − 1 分别属于特征值 k λ , λ m , λ − 1 k \lambda, \lambda^m, \lambda^{-1} kλ , λ m , λ − 1 的特征向量
证明 3
若 A α = λ α A \alpha = \lambda \alpha A α = λ α , 由 λ ≠ 0 \lambda \ne 0 λ = 0 知
λ = A − 1 λ α , A − 1 α = 1 λ α \lambda = A^{-1} \lambda \alpha \ , \ A^{-1} \alpha = \frac{1}{\lambda} \alpha
λ = A − 1 λ α , A − 1 α = λ 1 α
故 1 λ \frac{1}{\lambda} λ 1 是 A − 1 A^{-1} A − 1 的特征值, 同时 α \alpha α 是 A − 1 A^{-1} A − 1 的输入 1 λ \frac{1}{\lambda} λ 1 的特征向量
例 设三阶矩阵 A A A 的特征值为 1 , − 1 , 2 1, -1, 2 1 , − 1 , 2 , A ∗ A^* A ∗ 为 A A A 的伴随矩阵, 求 ∣ A ∗ + 3 A − 2 E ∣ \left | A^* + 3A - 2E \right | ∣ A ∗ + 3 A − 2 E ∣
解
因为 A A A 的特征值全不为零, 则 A A A 可逆. 由 A ∗ A = ∣ A ∣ E A^* A = \left | A \right | E A ∗ A = ∣ A ∣ E 以及 ∣ A ∣ = λ 1 λ 2 λ 3 = − 2 \left | A \right | = \lambda_1 \lambda_2 \lambda_3 = -2 ∣ A ∣ = λ 1 λ 2 λ 3 = − 2 知, A ∗ = − 2 A − 1 A^* = -2 A^{-1} A ∗ = − 2 A − 1 . 所以, 令
B = A ∗ + 3 A − 2 E = − 2 A − 1 + 3 A − 2 E B = A^* + 3A - 2E = -2A^{-1} + 3A - 2E
B = A ∗ + 3 A − 2 E = − 2 A − 1 + 3 A − 2 E
则 B B B 有特征值 − 1 , − 3 , 3 -1, -3, 3 − 1 , − 3 , 3 (一般地, 当 A A A 有特征值 λ \lambda λ 时, a A + b E aA + bE a A + b E 有特征值 a λ + b a \lambda + b aλ + b ), 从而
∣ A ∗ + 3 A − 2 E ∣ = ∣ B ∣ = ( − 1 ) ⋅ ( − 3 ) ⋅ 3 = 9 \left | A^* + 3A - 2E \right | = \left | B \right | = (-1) \cdot (-3) \cdot 3 = 9
∣ A ∗ + 3 A − 2 E ∣ = ∣ B ∣ = ( − 1 ) ⋅ ( − 3 ) ⋅ 3 = 9
性质4 n n n 阶矩阵 A A A 的互不相同的特征值 λ 1 , λ 2 , ⋯ , λ n \lambda_1, \lambda_2, \cdots , \lambda_n λ 1 , λ 2 , ⋯ , λ n 对应的特征向量 α 1 , α 2 , ⋯ , α n \alpha_1, \alpha_2, \cdots , \alpha_n α 1 , α 2 , ⋯ , α n 线性无关
证 数学归纳法
已知 A α i = λ i α i ( i = 1 , 2 , ⋯ , m ) A \alpha_i = \lambda_i \alpha_i \ (i = 1, 2, \cdots , m) A α i = λ i α i ( i = 1 , 2 , ⋯ , m )
当 m = 1 m = 1 m = 1 时, α 1 ≠ 0 \alpha_1 \ne \mathbf{0} α 1 = 0 , 结论成立
假设 m − 1 m - 1 m − 1 时结论成立
设有常数 k 1 . k 2 . ⋯ , k m k_1. k_2. \cdots , k_m k 1 . k 2 . ⋯ , k m , 使
k 1 α 1 + k 2 α 2 + ⋯ + k m − 1 α m − 1 + k m α m = 0 k_1 \alpha_1 + k_2 \alpha_2 + \cdots + k_{m - 1} \alpha_{m - 1} + k_m \alpha_m = \mathbf{0}
k 1 α 1 + k 2 α 2 + ⋯ + k m − 1 α m − 1 + k m α m = 0
用矩阵 A A A 左乘上式
k 1 A α 1 + k 2 A α 2 + ⋯ + k m − 1 A α m − 1 + k m A α m = 0 k_1 A \alpha_1 + k_2 A \alpha_2 + \cdots + k_{m - 1} A \alpha_{m - 1} + k_m A \alpha_m = \mathbf{0}
k 1 A α 1 + k 2 A α 2 + ⋯ + k m − 1 A α m − 1 + k m A α m = 0
代入 A α i = λ i α i ( i = 1 , 2 , ⋯ , m ) A \alpha_i = \lambda_i \alpha_i \ (i = 1, 2, \cdots , m) A α i = λ i α i ( i = 1 , 2 , ⋯ , m )
k 1 λ 1 α 1 + k 2 λ 2 + α 2 + ⋯ + k m − 1 λ m − 1 α m − 1 + k m λ m α m k_1 \lambda_1 \alpha_1 + k_2 \lambda_2 + \alpha_2 + \cdots + k_{m - 1} \lambda_{m - 1} \alpha_{m - 1} + k_m \lambda_m \alpha_m
k 1 λ 1 α 1 + k 2 λ 2 + α 2 + ⋯ + k m − 1 λ m − 1 α m − 1 + k m λ m α m
上式减去 λ m \lambda_m λ m 倍一式, 消去 α m \alpha_m α m , 得
k 1 ( λ 1 − λ m ) α 1 + k 2 ( λ 2 − λ m ) α 2 + ⋯ + k m − 1 ( λ m − 1 − λ m ) α m − 1 = 0 k_1 (\lambda_1 - \lambda_m) \alpha_1 + k_2 (\lambda_2 - \lambda_m) \alpha_2 + \cdots + k_{m - 1} (\lambda_{m - 1} - \lambda_m) \alpha_{m - 1} = \mathbf{0}
k 1 ( λ 1 − λ m ) α 1 + k 2 ( λ 2 − λ m ) α 2 + ⋯ + k m − 1 ( λ m − 1 − λ m ) α m − 1 = 0
假设 m − 1 m - 1 m − 1 时成立, 即 α 1 , α 2 , ⋯ , α m − 1 \alpha_1, \alpha_2, \cdots , \alpha_{m - 1} α 1 , α 2 , ⋯ , α m − 1 线性无关, 则
k i ( λ i − λ m ) = 0 ( i = 1 , 2 , ⋯ , m − 1 ) k_i (\lambda_i - \lambda_m) = 0 \ (i = 1, 2, \cdots , m - 1)
k i ( λ i − λ m ) = 0 ( i = 1 , 2 , ⋯ , m − 1 )
因为 λ 1 , λ 2 , ⋯ , λ m \lambda_1, \lambda_2, \cdots , \lambda_m λ 1 , λ 2 , ⋯ , λ m 互不相同, 则
k i = 0 ( i = 1 , 2 , ⋯ , m − 1 ) k_i = 0 \ (i = 1, 2, \cdots , m - 1)
k i = 0 ( i = 1 , 2 , ⋯ , m − 1 )
代入一式得 k m α m = 0 k_m \alpha_m = \mathbf{0} k m α m = 0 , 而 α m ≠ 0 \alpha_m \ne \mathbf{0} α m = 0 , 则 k m = 0 k_m = 0 k m = 0 , 同理
k 1 = k 2 = ⋯ = k m = 0 k_1 = k_2 = \cdots = k_m = 0
k 1 = k 2 = ⋯ = k m = 0
即 α 1 , α 2 , ⋯ , α m \alpha_1, \alpha_2, \cdots , \alpha_m α 1 , α 2 , ⋯ , α m 线性无关, 证毕
4.5 矩阵的相似对角化
4.5.1 相似矩阵的概念和性质
定义1 设 A , B A, B A , B 都是 n n n 阶矩阵, 若存在可逆矩阵 P P P , 使
P − 1 A P = B P^{-1}AP = B
P − 1 A P = B
则称 B B B 是 A A A 的相似矩阵, 并称矩阵 A A A 与 B B B 相似, 记作 A ∼ B A \sim B A ∼ B
矩阵的相似关系是一种等价关系, 满足
自反性 : A ∼ A A \sim A A ∼ A
对称性 : 若 A ∼ B A \sim B A ∼ B , 则 B ∼ A B \sim A B ∼ A
传递性 : 若 A ∼ B , B ∼ C A \sim B, B \sim C A ∼ B , B ∼ C , 则 A ∼ C A \sim C A ∼ C
证明第三个
若 A ∼ B , B ∼ C A \sim B, B \sim C A ∼ B , B ∼ C , 则分别存在可逆矩阵 P , Q P, Q P , Q , 使
P − 1 A P = B , Q − 1 B Q = C P^{-1}AP = B \ , \ Q^{-1}BQ = C
P − 1 A P = B , Q − 1 BQ = C
故
C = Q − 1 ( P − 1 A P ) Q = ( Q − 1 P − 1 ) A ( P Q ) = ( P Q ) − 1 A ( P Q ) C = Q^{-1}(P^{-1}AP)Q = (Q^{-1}P^{-1})A(PQ) = (PQ)^{-1}A(PQ)
C = Q − 1 ( P − 1 A P ) Q = ( Q − 1 P − 1 ) A ( PQ ) = ( PQ ) − 1 A ( PQ )
则 A ∼ C A \sim C A ∼ C
例 设矩阵 A = ( 3 1 5 − 1 ) , B = ( 4 0 0 − 2 ) A = \begin{pmatrix} 3 & 1 \\ 5 & -1 \end{pmatrix} \ , \ B = \begin{pmatrix} 4 & 0 \\ 0 & -2 \end{pmatrix} A = ( 3 5 1 − 1 ) , B = ( 4 0 0 − 2 ) , 试严重存在可逆矩阵 P = ( 1 1 1 − 5 ) P = \begin{pmatrix} 1 & 1 \\ 1 & -5 \end{pmatrix} P = ( 1 1 1 − 5 ) , 使 A ∼ B A \sim B A ∼ B
易证 P P P 可逆, 且 P − 1 = ( 5 6 1 6 1 6 − 1 6 ) P^{-1} = \begin{pmatrix} \frac{5}{6} & \frac{1}{6} \\ \frac{1}{6} & -\frac{1}{6} \end{pmatrix} P − 1 = ( 6 5 6 1 6 1 − 6 1 ) , 由
P − 1 A P = 1 5 ( 5 1 1 − 1 ) ( 3 1 5 − 1 ) ( 1 1 1 − 5 ) = ( 4 0 0 − 2 ) = B P^{-1}AP = \frac{1}{5} \begin{pmatrix} 5 & 1 \\ 1 & -1 \end{pmatrix} \begin{pmatrix} 3 & 1 \\ 5 & -1 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 1 & -5 \end{pmatrix} = \begin{pmatrix} 4 & 0 \\ 0 & -2 \end{pmatrix} = B
P − 1 A P = 5 1 ( 5 1 1 − 1 ) ( 3 5 1 − 1 ) ( 1 1 1 − 5 ) = ( 4 0 0 − 2 ) = B
得 A ∼ B A \sim B A ∼ B
性质1 若 A ∼ B A \sim B A ∼ B , 则 r ( A ) = r ( B ) r(A) = r(B) r ( A ) = r ( B ) , 即相似矩阵有相同的秩
若 A ∼ B A \sim B A ∼ B , 则 A ≈ B ( 等价 ) A \approx B (等价) A ≈ B ( 等价 ) , 故 r ( A ) = r ( B ) r(A) = r(B) r ( A ) = r ( B )
性质2 相似矩阵行列式相等
∣ P − 1 A P ∣ = ∣ P − 1 ∣ ∣ A ∣ ∣ P ∣ = ∣ P − 1 ∣ ∣ P ∣ ∣ A ∣ = ∣ P − 1 P ∣ ∣ A ∣ = ∣ E ∣ ∣ A ∣ = ∣ A ∣ \left | P^{-1}AP \right | = \left | P^{-1} \right | \left | A \right | \left | P \right |
= \left | P^{-1} \right | \left | P \right | \left | A \right | \\
= \left | P^{-1}P \right | \left | A \right | = \left | E \right | \left | A \right | = \left | A \right |
P − 1 A P = P − 1 ∣ A ∣ ∣ P ∣ = P − 1 ∣ P ∣ ∣ A ∣ = P − 1 P ∣ A ∣ = ∣ E ∣ ∣ A ∣ = ∣ A ∣
性质3 相似矩阵具有相同和可逆性, 当他们可逆时, 他们的逆矩阵也相似
若 A , B A, B A , B 相似且都可逆, 则存在非奇异矩阵 P P P , 使
P − 1 A P = B P^{-1}AP = B
P − 1 A P = B
于是
B − 1 = P − 1 A − 1 P B^{-1} = P^{-1}A^{-1}P
B − 1 = P − 1 A − 1 P
即 A − 1 , B − 1 A^{-1}, B^{-1} A − 1 , B − 1 相似
性质4 若 A ∼ B A \sim B A ∼ B , 则 A . B A. B A . B 存在相同的特征多项式, 从而欧相同的特征值
证
∣ λ E − B ∣ = ∣ λ E − P − 1 A P ∣ = ∣ P − 1 ( λ E − A ) P ∣ = ∣ P − 1 ∣ ∣ λ E − A ∣ ∣ P ∣ = ∣ λ E − A ∣ \left | \lambda E - B \right | = \left | \lambda E - P^{-1}AP \right | = \left | P^{-1}(\lambda E - A)P \right | = \left | P^{-1} \right | \left | \lambda E - A \right | \left | P \right | = \left | \lambda E - A \right |
∣ λ E − B ∣ = λ E − P − 1 A P = P − 1 ( λ E − A ) P = P − 1 ∣ λ E − A ∣ ∣ P ∣ = ∣ λ E − A ∣
即 A , B A, B A , B 有相同的特征多项式, 均为 f ( λ ) = ( λ − 4 ) ( λ + 2 ) f(\lambda) = (\lambda - 4)(\lambda + 2) f ( λ ) = ( λ − 4 ) ( λ + 2 ) , 故 A , B A, B A , B 有相同的特征值 λ 1 = 4 , λ 2 = − 2 \lambda_1 = 4, \lambda_2 = -2 λ 1 = 4 , λ 2 = − 2
4.5.2 矩阵与对角矩阵形似的条件
规定对角矩阵
Λ = ( λ 1 λ 2 ⋱ λ n ) \Lambda = \begin{pmatrix}
\lambda_1 \\
& \lambda_2 \\
& & \ddots \\
& & & \lambda_n
\end{pmatrix}
Λ = λ 1 λ 2 ⋱ λ n
可简记为 Λ = d i a g ( λ 1 , λ 2 , ⋯ , λ n ) \Lambda = diag(\lambda_1, \lambda_2, \cdots , \lambda_n) Λ = d ia g ( λ 1 , λ 2 , ⋯ , λ n )
定理1 n n n 阶矩阵 A A A 与对角矩阵 Λ = d i a g ( λ 1 , λ 2 , ⋯ , λ n ) \Lambda = diag(\lambda_1, \lambda_2, \cdots , \lambda_n) Λ = d ia g ( λ 1 , λ 2 , ⋯ , λ n ) 相似的充要条件为矩阵 A A A 有 n n n 个线性无关的特征向量
证
必要性 若 A A A 与 Λ \Lambda Λ 相似, 则存在可逆矩阵 P P P 使得
P − 1 A P = Λ P^{-1}AP = \Lambda
P − 1 A P = Λ
设 P = ( p 1 , p 2 , ⋯ , p n ) P = (p_1, p_2, \cdots , p_n) P = ( p 1 , p 2 , ⋯ , p n ) , 其中 p i ( i = 1 , 2 , ⋯ , n ) p_i \ (i = 1, 2, \cdots , n) p i ( i = 1 , 2 , ⋯ , n ) 为 P P P 的列向量, 则由 A P = P Λ AP = P\Lambda A P = P Λ 得
A ( p 1 , p 2 , ⋯ , p n ) = ( p 1 , p 2 , ⋯ , p n ) ( λ 1 λ 2 ⋱ λ n ) A(p_1, p_2, \cdots , p_n) = (p_1, p_2, \cdots , p_n)\begin{pmatrix}
\lambda_1 \\
& \lambda_2 \\
& & \ddots \\
& & & \lambda_n
\end{pmatrix}
A ( p 1 , p 2 , ⋯ , p n ) = ( p 1 , p 2 , ⋯ , p n ) λ 1 λ 2 ⋱ λ n
即
A p i = λ i p i ( i = 1 , 2 , ⋯ , n ) Ap_i = \lambda_i p_i \ (i = 1, 2, \cdots , n)
A p i = λ i p i ( i = 1 , 2 , ⋯ , n )
因为 P P P 可逆, 则 ∣ P ∣ ≠ 0 \left | P \right | \ne 0 ∣ P ∣ = 0 , 从而 p i ( i = 1 , 2 , ⋯ , n ) p_i \ (i = 1, 2, \cdots , n) p i ( i = 1 , 2 , ⋯ , n ) 都是非零向量. 因此 p 1 , p 2 , ⋯ , p n p_1, p_2, \cdots , p_n p 1 , p 2 , ⋯ , p n 都是 A A A 的特征向量, 且它们线性无关
充分性 设 p 1 , p 2 , ⋯ , p n p_1, p_2, \cdots , p_n p 1 , p 2 , ⋯ , p n 为 A A A 的 n n n 个线性无关的特征向量, 它们所对应的特征值为 λ 1 , λ 2 , ⋯ , λ n \lambda_1, \lambda_2, \cdots , \lambda_n λ 1 , λ 2 , ⋯ , λ n , 则有
A p i = λ i p i / ( i = 1 , 2 , ⋯ , n ) Ap_i = \lambda_i p_i / (i = 1, 2, \cdots , n)
A p i = λ i p i / ( i = 1 , 2 , ⋯ , n )
令 P = ( p 1 , p − 2 , ⋯ , p n ) P = (p_1, p-2, \cdots , p_n) P = ( p 1 , p − 2 , ⋯ , p n ) , 易知 P P P 可逆, 且
A P = A ( p 1 , p 2 , ⋯ , p n ) = ( A p 1 , A p 2 , ⋯ , A p n ) = ( λ 1 p 1 , λ 2 p 2 , ⋯ , λ n p n ) = ( p 1 , p 2 , ⋯ , p n ) ( λ 1 λ 2 ⋱ λ n ) AP = A(p_1, p_2, \cdots , p_n) = (Ap_1, Ap_2, \cdots , Ap_n) \\ \ \\
= (\lambda_1 p_1, \lambda_2 p_2 , \cdots , \lambda_n p_n) \\ \ \\
= (p_1, p_2, \cdots , p_n) \begin{pmatrix}
\lambda_1 \\
& \lambda_2 \\
& & \ddots \\
& & & \lambda_n
\end{pmatrix}
A P = A ( p 1 , p 2 , ⋯ , p n ) = ( A p 1 , A p 2 , ⋯ , A p n ) = ( λ 1 p 1 , λ 2 p 2 , ⋯ , λ n p n ) = ( p 1 , p 2 , ⋯ , p n ) λ 1 λ 2 ⋱ λ n
推论1 若 n n n 阶矩阵 A A A b b b 个互异的特征值 λ 1 , λ 2 , ⋯ , λ n \lambda_1, \lambda_2, \cdots , \lambda_n λ 1 , λ 2 , ⋯ , λ n , 则 A A A 与对角矩阵 Λ = d i a g ( λ 1 , λ 2 , ⋯ , λ n ) \Lambda = diag(\lambda_1, \lambda_2, \cdots , \lambda_n) Λ = d ia g ( λ 1 , λ 2 , ⋯ , λ n ) 相似
对于 n n n 阶方阵 A A A , 若存在可逆矩阵 P P P , 使 P − 1 A P = Λ P_{-1}AP = \Lambda P − 1 A P = Λ 为对角矩阵, 则称方阵 A A A 可对角化
给定 n n n 阶方阵 A A A , 其特征方程式 f ( λ ) = ( λ − λ 1 ) n 1 ⋯ ( λ − λ s ) n s f(\lambda) = (\lambda - \lambda_1)^{n_1} \cdots (\lambda - \lambda_s)^{n_s} f ( λ ) = ( λ − λ 1 ) n 1 ⋯ ( λ − λ s ) n s , 其中 n 1 + n 2 + ⋯ + n s = n n_1 + n_2 + \cdots + n_s = n n 1 + n 2 + ⋯ + n s = n , 则有
定理2 n n n 阶矩阵 A A A 可对角化的充要条件是对应于 A A A 的每个特征值的线性无关的特征向量的个数恰好等于该特征值的重数, 即设 λ i \lambda_i λ i 为矩阵 A A A 的 n i n_i n i 重特征值, 则 A A A 与 Λ \Lambda Λ 相似, 当且仅当
r ( λ i E − A ) = n − n i ( i = 1 , 2 , ⋯ , s ) r(\lambda_i E - A) = n - n_i \ (i = 1, 2, \cdots , s)
r ( λ i E − A ) = n − n i ( i = 1 , 2 , ⋯ , s )
例如, 矩阵 ( 1 1 1 0 0 0 0 0 0 ) \begin{pmatrix} 1 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix} 1 0 0 1 0 0 1 0 0 的特征值为 1 , 0 , 0 1, 0, 0 1 , 0 , 0 , 对于 λ 2 = 0 , n 2 = 3 , n = 3 \lambda_2 = 0, n_2 = 3, n = 3 λ 2 = 0 , n 2 = 3 , n = 3 , 有
r ( λ 2 E − A ) = 1 = n − n 2 r(\lambda_2 E - A) = 1 = n - n_2
r ( λ 2 E − A ) = 1 = n − n 2
故 a a a 能对角化
又如, 矩阵 ( 1 1 0 0 0 1 0 0 0 ) \begin{pmatrix} 1 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{pmatrix} 1 0 0 1 0 0 0 1 0 的特征值也为 1 , 0 , 0 1, 0, 0 1 , 0 , 0 , 对 λ 2 = 0 , n 2 = 2 , n = 3 \lambda_2 = 0, n_2 = 2, n = 3 λ 2 = 0 , n 2 = 2 , n = 3 , 有
r ( λ 2 E − A ) = 2 ≠ n − n 2 r(\lambda_2 E - A) = 2 \ne n - n_2
r ( λ 2 E − A ) = 2 = n − n 2
故 B B B 不能对角化
4.5.3 矩阵对角化的步骤
定理1证明过程即为矩阵对角化的步骤, 当方阵 A A A 可对角化时
求出 A A A 的全部特征值 λ 1 , λ 2 , ⋯ , λ s \lambda_1, \lambda_2, \cdots , \lambda_s λ 1 , λ 2 , ⋯ , λ s
对于每个特征值 λ i \lambda_i λ i , 设其重数为 n i n_i n i , 则对应齐次方程组
( λ i E − A ) X = 0 (\lambda_i E - A)X = \mathbf{0}
( λ i E − A ) X = 0
的基础解系由 n i n_i n i 个向量 ξ 11 , ξ 12 , ⋯ , ξ 1 n i \xi_{11}, \xi_{12}, \cdots , \xi_{1n_i} ξ 11 , ξ 12 , ⋯ , ξ 1 n i 构成, 即 ξ 11 , ξ 12 , ⋯ , ξ 1 n i \xi_{11}, \xi_{12}, \cdots , \xi_{1n_i} ξ 11 , ξ 12 , ⋯ , ξ 1 n i 为 λ i \lambda_i λ i 对应的特征向量
上面求出的特征向量 ξ 11 , ξ 12 , ⋯ , ξ 1 n 1 ; ξ 21 , ξ 22 , ⋯ , ξ 2 n 2 ; ⋯ ⋯ ; ξ s 1 , ξ s 2 , ⋯ , ξ s n s \xi_{11}, \xi_{12}, \cdots , \xi_{1n_1}; \xi_{21}, \xi_{22}, \cdots , \xi_{2n_2}; \cdots \cdots; \xi_{s1}, \xi_{s2}, \cdots , \xi_{sn_s} ξ 11 , ξ 12 , ⋯ , ξ 1 n 1 ; ξ 21 , ξ 22 , ⋯ , ξ 2 n 2 ; ⋯⋯ ; ξ s 1 , ξ s 2 , ⋯ , ξ s n s 恰好为矩阵 A A A 的 n n n 个线性无关的特征向量
令 Λ = d i a g ( λ 1 , ⋯ , λ 1 ; λ 2 , ⋯ , λ 2 ; ⋯ ⋯ ; λ s , ⋯ , λ s ) \Lambda = diag(\lambda_1, \cdots , \lambda_1; \lambda_2, \cdots , \lambda_2; \cdots \cdots ; \lambda_s, \cdots ,\lambda_s) Λ = d ia g ( λ 1 , ⋯ , λ 1 ; λ 2 , ⋯ , λ 2 ; ⋯⋯ ; λ s , ⋯ , λ s ) , P = ξ 11 , ξ 12 , ⋯ , ξ 1 n 1 ; ξ 21 , ξ 22 , ⋯ , ξ 2 n 2 ; ⋯ ⋯ ; ξ s 1 , ξ s 2 , ⋯ , ξ s n s P = \xi_{11}, \xi_{12}, \cdots , \xi_{1n_1}; \xi_{21}, \xi_{22}, \cdots , \xi_{2n_2}; \cdots \cdots; \xi_{s1}, \xi_{s2}, \cdots , \xi_{sn_s} P = ξ 11 , ξ 12 , ⋯ , ξ 1 n 1 ; ξ 21 , ξ 22 , ⋯ , ξ 2 n 2 ; ⋯⋯ ; ξ s 1 , ξ s 2 , ⋯ , ξ s n s , 则
P − 1 A P = Λ P^{-1}AP = \Lambda
P − 1 A P = Λ
例 设 A = ( 0 0 1 1 1 a 1 0 0 ) A = \begin{pmatrix} 0 & 0 & 1 \\ 1 & 1 & a \\ 1 & 0 & 0 \end{pmatrix} A = 0 1 1 0 1 0 1 a 0 , a a a 为何值时, 矩阵 A A A 能对角化
解
∣ λ E − A ∣ = ( λ 0 − 1 − 1 λ − 1 − a − 1 0 λ ) = ( λ − 1 ) 2 ( λ + 1 ) \left | \lambda E - A \right | = \begin{pmatrix}
\lambda & 0 & -1 \\
-1 & \lambda - 1 & -a \\
-1 & 0 & \lambda
\end{pmatrix}
= (\lambda - 1)^2 (\lambda + 1)
∣ λ E − A ∣ = λ − 1 − 1 0 λ − 1 0 − 1 − a λ = ( λ − 1 ) 2 ( λ + 1 )
得 λ 1 = − 1 , λ 2 = λ 3 = 1 \lambda_1 = -1, \lambda_2 = \lambda_3 = 1 λ 1 = − 1 , λ 2 = λ 3 = 1 , 要使矩阵 A A A 能对角化, 由定理2: 对应单根 λ 1 = − 1 \lambda_1 = -1 λ 1 = − 1 , 可求得线性无关的特征向量恰有 1 1 1 个; 对应重根 λ 2 = λ 3 = 1 \lambda_2 = \lambda_3 = 1 λ 2 = λ 3 = 1 , 应有 2 2 2 个线性无关的特征向量, 即方程
∣ E − A ∣ X = 0 \left | E - A \right | X = 0
∣ E − A ∣ X = 0
有两个线性无关的解, 即系数矩阵 E − A E - A E − A 的秩
r ( E − A ) = 1 r(E - A) = 1
r ( E − A ) = 1
又
E − A = ( 1 0 − 1 − 1 0 − a − 1 0 1 ) → ( 1 0 − 1 0 0 a + 1 0 0 0 ) E - A = \begin{pmatrix}
1 & 0 & -1 \\
-1 & 0 & -a \\
-1 & 0 & 1
\end{pmatrix}
\xrightarrow[]{}
\begin{pmatrix}
1 & 0 & -1 \\
0 & 0 & a + 1 \\
0 & 0 & 0
\end{pmatrix}
E − A = 1 − 1 − 1 0 0 0 − 1 − a 1 1 0 0 0 0 0 − 1 a + 1 0
要使 r = 1 r = 1 r = 1 , 则 a + 1 = 0 a + 1 = 0 a + 1 = 0 , 即 a = − 1 a = -1 a = − 1
因此, a = − 1 a = -1 a = − 1 时, 矩阵 A A A 能对角化
例 给定矩阵
A = ( 1 − 2 2 − 2 − 2 4 2 4 − 2 ) A = \begin{pmatrix}
1 & -2 & 2 \\
-2 & -2 & 4 \\
2 & 4 & -2
\end{pmatrix}
A = 1 − 2 2 − 2 − 2 4 2 4 − 2
判断 A A A 能否化为对角矩阵; 求可逆矩阵 P P P 和对角矩阵 Λ \Lambda Λ , 使 P − 1 A P = Λ P^{-1}AP = \Lambda P − 1 A P = Λ ; 求 A n ( n ≥ 2 ) A^n \ (n \ge 2) A n ( n ≥ 2 )
解
∣ λ E − A ∣ = ( λ − 1 2 − 2 2 λ + 2 4 − 2 − 4 λ + 2 ) = ( λ − 2 ) 2 ( λ + 7 ) = 0 \left | \lambda E - A \right | = \begin{pmatrix}
\lambda - 1 & 2 & -2 \\
2 & \lambda + 2 & 4 \\
-2 & -4 & \lambda + 2
\end{pmatrix}
= (\lambda - 2)^2(\lambda + 7) = 0
∣ λ E − A ∣ = λ − 1 2 − 2 2 λ + 2 − 4 − 2 4 λ + 2 = ( λ − 2 ) 2 ( λ + 7 ) = 0
得特征值 λ 1 = λ 2 = 2 , λ 3 = − 7 \lambda_1 = \lambda_2 = 2, \lambda_3 = -7 λ 1 = λ 2 = 2 , λ 3 = − 7 , 对应 λ 1 , λ 2 \lambda_1, \lambda_2 λ 1 , λ 2 为二重特征值, 可验证 r ( λ 1 E − A ) = 1 r(\lambda_1 E - A) = 1 r ( λ 1 E − A ) = 1 , 故得齐次线性方程组
( λ 1 E − A ) X = 0 (\lambda_1 E - A)X = \mathbf{0}
( λ 1 E − A ) X = 0
的基础解系有两个线性无关的解, 又 λ 3 = − 7 \lambda_3 = -7 λ 3 = − 7 时, 可知 r ( λ 3 E − A ) = 2 r(\lambda_3 E - A) = 2 r ( λ 3 E − A ) = 2 , 则
( λ 3 E − A ) X = 0 (\lambda_3 E - A)X = \mathbf{0}
( λ 3 E − A ) X = 0
的基础解系只有一个向量, 故矩阵 A A A 有三个线性无关的特征向量, 从而 A A A 可以对角化
从上式中分别求出基础解系
p 1 = ( − 1 1 0 ) , p 2 = ( 2 0 1 ) p 3 = ( 1 2 − 2 ) p_1 = \begin{pmatrix} -1 \\ 1 \\ 0 \end{pmatrix} ,
p_2 = \begin{pmatrix} 2 \\ 0 \\ 1 \end{pmatrix} \\
p_3 = \begin{pmatrix} 1 \\ 2 \\ -2 \end{pmatrix}
p 1 = − 1 1 0 , p 2 = 2 0 1 p 3 = 1 2 − 2
令 P = ( p 1 , p 2 , p 3 ) = ( − 2 2 1 1 0 2 0 1 − 2 ) , Λ = ( 2 2 − 7 ) P = (p_1, p_2, p_3) = \begin{pmatrix}
-2 & 2 & 1 \\
1 & 0 & 2 \\
0 & 1 & -2
\end{pmatrix} \ , \ \Lambda = \begin{pmatrix}
2 \\
& 2 \\
& & -7
\end{pmatrix} P = ( p 1 , p 2 , p 3 ) = − 2 1 0 2 0 1 1 2 − 2 , Λ = 2 2 − 7 , 则有
P − 1 A P = Λ P^{-1}AP = \Lambda
P − 1 A P = Λ
此时 P − 1 = 1 9 ( − 2 5 4 2 4 5 1 2 − 2 ) P^{-1} = \frac{1}{9} \begin{pmatrix}
-2 & 5 & 4 \\
2 & 4 & 5 \\
1 & 2 & -2
\end{pmatrix} P − 1 = 9 1 − 2 2 1 5 4 2 4 5 − 2
由 P − 1 A P = Λ P^{-1}AP = \Lambda P − 1 A P = Λ 得 A = P Λ P − 1 A = P\Lambda P^{-1} A = P Λ P − 1 , 从而
A 2 = A ⋅ A = ( P Λ P − 1 ) ( P Λ P − 1 ) = P Λ 2 P − 1 A n = A ⋅ A ⋅ ⋯ ⋅ A = P Λ n P − 1 = ( − 2 2 1 1 0 2 0 1 − 2 ) ( 2 2 − 7 ) n [ 1 9 ( − 2 5 4 2 4 5 1 2 − 2 ) ] = 1 9 ( − 2 2 1 1 0 2 0 1 − 2 ) ( 2 n 2 n ( − 7 ) n ) ( − 2 5 4 2 4 5 1 2 − 2 ) = 1 9 ( − 2 n + 1 2 n + 1 ( − 7 ) n 2 n 0 2 ( − 7 ) n 0 2 n ( − 2 ) ( − 7 ) n ) ( − 2 5 4 2 4 5 1 2 − 2 ) = 1 9 ( 2 n + 3 + ( − 7 ) n − 2 n + 1 + 2 ( − 7 ) n 2 n + 1 − 2 ( − 7 ) n − 2 n + 1 + 2 ( − 7 ) n 5 ⋅ 2 n + 4 ( − 7 ) n 2 n + 2 − 4 ( − 7 ) n 2 n + 1 − 2 ( − 7 ) n 2 n + 2 − 4 ( − 7 ) n 5 ⋅ 2 n + 4 ( − 7 ) n ) A^2 = A \cdot A = (P\Lambda P^{-1})(P\Lambda P^{-1}) = P \Lambda^2 P^{-1} \\
A^n = A \cdot A \cdot \cdots \cdot A = P \Lambda^n P^{-1} \\
= \begin{pmatrix}
-2 & 2 & 1 \\
1 & 0 & 2 \\
0 & 1 & -2
\end{pmatrix} \begin{pmatrix}
2 \\
& 2 \\
& & -7\end{pmatrix}^n [\frac{1}{9} \begin{pmatrix}
-2 & 5 & 4 \\
2 & 4 & 5 \\
1 & 2 & -2
\end{pmatrix}] \\
= \frac{1}{9} \begin{pmatrix}
-2 & 2 & 1 \\
1 & 0 & 2 \\
0 & 1 & -2
\end{pmatrix} \begin{pmatrix}
2^n \\
& 2^n \\
& & (-7)^n
\end{pmatrix} \begin{pmatrix}
-2 & 5 & 4 \\
2 & 4 & 5 \\
1 & 2 & -2
\end{pmatrix} \\
= \frac{1}{9} \begin{pmatrix}
-2^{n + 1} & 2^{n + 1} & (-7)^n \\
2^n & 0 & 2(-7)^n \\
0 & 2^n & (-2)(-7)^n
\end{pmatrix} \begin{pmatrix}
-2 & 5 & 4 \\
2 & 4 & 5 \\
1 & 2 & -2
\end{pmatrix} \\
= \frac{1}{9} \begin{pmatrix}
2^{n + 3} + (-7)^n & -2^{n + 1} + 2(-7)^n & 2^{n + 1} - 2(-7)^n \\
-2^{n + 1} + 2(-7)^n & 5 \cdot 2^n + 4(-7)^n & 2^{n + 2} - 4(-7)^n \\
2^{n + 1} - 2(-7)^n & 2^{n + 2} - 4(-7)^n & 5 \cdot 2^n + 4(-7)^n
\end{pmatrix}
A 2 = A ⋅ A = ( P Λ P − 1 ) ( P Λ P − 1 ) = P Λ 2 P − 1 A n = A ⋅ A ⋅ ⋯ ⋅ A = P Λ n P − 1 = − 2 1 0 2 0 1 1 2 − 2 2 2 − 7 n [ 9 1 − 2 2 1 5 4 2 4 5 − 2 ] = 9 1 − 2 1 0 2 0 1 1 2 − 2 2 n 2 n ( − 7 ) n − 2 2 1 5 4 2 4 5 − 2 = 9 1 − 2 n + 1 2 n 0 2 n + 1 0 2 n ( − 7 ) n 2 ( − 7 ) n ( − 2 ) ( − 7 ) n − 2 2 1 5 4 2 4 5 − 2 = 9 1 2 n + 3 + ( − 7 ) n − 2 n + 1 + 2 ( − 7 ) n 2 n + 1 − 2 ( − 7 ) n − 2 n + 1 + 2 ( − 7 ) n 5 ⋅ 2 n + 4 ( − 7 ) n 2 n + 2 − 4 ( − 7 ) n 2 n + 1 − 2 ( − 7 ) n 2 n + 2 − 4 ( − 7 ) n 5 ⋅ 2 n + 4 ( − 7 ) n
5 二次型
5.1 二次型及其标准形
5.1.1 二次型的矩阵表示
定义1 关于 n n n 个变量 x 1 , x 2 , ⋯ , x n x_1, x_2, \cdots , x_n x 1 , x 2 , ⋯ , x n 的二次其次式
f ( x 1 , x 2 , ⋯ . x n ) = a 11 x 1 2 + 2 a 12 x 1 x 2 + ⋯ + 2 a 1 n x 1 x n + a 22 x 2 2 + 2 a 23 x 2 x 3 + ⋯ + 2 a 2 n x 2 x n + ⋯ + a n n x n 2 f(x_1, x_2, \cdots . x_n) = a_{11} x_1^2 + 2a_{12} x_1 x_2 + \cdots + 2a_{1n} x_1 x_n + a_{22} x_2^2 + \\
2a_{23} x_2 x_3 + \cdots + 2a_{2n} x_2 x_n + \cdots + a_{nn} x_n^2
f ( x 1 , x 2 , ⋯ . x n ) = a 11 x 1 2 + 2 a 12 x 1 x 2 + ⋯ + 2 a 1 n x 1 x n + a 22 x 2 2 + 2 a 23 x 2 x 3 + ⋯ + 2 a 2 n x 2 x n + ⋯ + a nn x n 2
称为一个 n n n 元二次型(简称为二次型). 当二次型系数 a i j ( i , j = 1 , 2 , ⋯ , n ) a_{ij} \ (i, j = 1, 2, \cdots , n) a ij ( i , j = 1 , 2 , ⋯ , n ) 为实数(复数)时, 称此二次型为实(复)二次型
令 a i j = a j i ( i < j > ) a_{ij} = a_{ji} \ (i < j>) a ij = a ji ( i < j > ) , 将上式变形
f ( x 1 , x 2 , ⋯ . x n ) = a 11 x 1 2 + 2 a 12 x 1 x 2 + ⋯ + 2 a 1 n x 1 x n + a 22 x 2 2 + 2 a 23 x 2 x 3 + ⋯ + 2 a 2 n x 2 x n + ⋯ + a n n x n 2 = ∑ j = 1 n a 1 j x 1 x j + ∑ j = 1 n a 2 j x 2 x j + ⋯ + ∑ j = 1 n a n j x n x j = ∑ i = 1 n ∑ j = 1 n a i j x i x j ( 或 ∑ i , j = 1 n a i j x i x j ) f(x_1, x_2, \cdots . x_n) = a_{11} x_1^2 + 2a_{12} x_1 x_2 + \cdots + 2a_{1n} x_1 x_n + a_{22} x_2^2 + \\
2a_{23} x_2 x_3 + \cdots + 2a_{2n} x_2 x_n + \cdots + a_{nn} x_n^2 \\
= \sum_{j = 1}^n a_{1j} x_1 x_j + \sum_{j = 1}^n a_{2j} x_2 x_j + \cdots + \sum_{j = 1}^n a_{nj} x_n x_j \\
= \sum_{i = 1}^n \sum_{j = 1}^n a_{ij} x_i x_j
(或 \sum_{i, j = 1}^n a_{ij} x_i x_j)
f ( x 1 , x 2 , ⋯ . x n ) = a 11 x 1 2 + 2 a 12 x 1 x 2 + ⋯ + 2 a 1 n x 1 x n + a 22 x 2 2 + 2 a 23 x 2 x 3 + ⋯ + 2 a 2 n x 2 x n + ⋯ + a nn x n 2 = j = 1 ∑ n a 1 j x 1 x j + j = 1 ∑ n a 2 j x 2 x j + ⋯ + j = 1 ∑ n a nj x n x j = i = 1 ∑ n j = 1 ∑ n a ij x i x j ( 或 i , j = 1 ∑ n a ij x i x j )
记
A = ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ) , X = ( x 1 x 2 ⋮ x n ) A = \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{pmatrix} ,
X = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}
A = a 11 a 21 ⋮ a n 1 a 12 a 22 ⋮ a n 2 ⋯ ⋯ ⋯ a 1 n a 2 n ⋮ a nn , X = x 1 x 2 ⋮ x n
则上述二次型可用矩阵乘法表示为
f ( x 1 , x 2 , ⋯ , x n ) = ∑ i = 1 n ∑ j = 1 n a i j x i x j = X T B X f(x_1, x_2, \cdots , x_n) = \sum_{i = 1}^n \sum_{j = 1}^n a_{ij} x_i x_j = X^TBX
f ( x 1 , x 2 , ⋯ , x n ) = i = 1 ∑ n j = 1 ∑ n a ij x i x j = X T BX
其中矩阵 A A A 称为二次型的矩阵, 它的秩也称为二次型的秩, 若 r ( A ) = n r(A) = n r ( A ) = n , 则称二次型是满秩的
显然二次型的的矩阵 A A A 为对称矩阵 (a i j = a j i a_{ij} = a_{ji} a ij = a ji ) , 它的元素 a i j a_{ij} a ij 恰为二次型 f ( x 1 , x 2 , ⋯ , x n ) f(x_1, x_2, \cdots , x_n) f ( x 1 , x 2 , ⋯ , x n ) 中 x i x j x_i x_j x i x j 系数的一半; 而 a i i a_{ii} a ii 为 x i 2 x_i^2 x i 2 项的系数, 从而还可知
f ( x 1 , x 2 , ⋯ , x n ) = X T A X = X T B X f(x_1, x_2, \cdots , x_n) = X^TAX = X^TBX
f ( x 1 , x 2 , ⋯ , x n ) = X T A X = X T BX
其中 A T = A , B T = B A^T = A, B^T = B A T = A , B T = B , 则 A = B A = B A = B , 从而二次型 f ( x 1 , x 2 , ⋯ , x n ) f(x_1, x_2, \cdots , x_n) f ( x 1 , x 2 , ⋯ , x n ) 与它的矩阵是一一对应的
例 求二次型 f ( x 1 , x 2 , x 3 ) = x 1 2 − 4 x 1 x 2 + 2 x 1 x 3 − 2 x 2 2 + 6 x 3 2 f(x_1, x_2, x_3) = x_1^2 - 4x_1x_2 + 2x_1x_3 - 2x_2^2 + 6x_3^2 f ( x 1 , x 2 , x 3 ) = x 1 2 − 4 x 1 x 2 + 2 x 1 x 3 − 2 x 2 2 + 6 x 3 2 的秩
解
f ( x 1 , x 2 , x 3 ) = x 1 2 − 2 x 1 x 2 + x 1 x 3 − 2 x 2 x 1 − 2 x 2 2 + 0 x 2 x 3 + x 3 x 1 + 0 x 3 x 2 + 6 x 3 2 f(x_1, x_2, x_3) = x_1^2 - 2x_1x_2 + x_1x_3 - 2x_2x_1 - 2x_2^2 + 0x_2x_3 + x_3x_1 + 0x_3x_2 + 6x_3^2
f ( x 1 , x 2 , x 3 ) = x 1 2 − 2 x 1 x 2 + x 1 x 3 − 2 x 2 x 1 − 2 x 2 2 + 0 x 2 x 3 + x 3 x 1 + 0 x 3 x 2 + 6 x 3 2
则
A = ( 1 − 2 1 − 2 − 2 0 1 0 6 ) → ( 1 − 2 1 0 2 5 0 0 17 ) A = \begin{pmatrix}
1 & -2 & 1 \\
-2 & -2 & 0 \\
1 & 0 & 6
\end{pmatrix}
\rightarrow
\begin{pmatrix}
1 & -2 & 1 \\
0 & 2 & 5 \\
0 & 0 & 17
\end{pmatrix}
A = 1 − 2 1 − 2 − 2 0 1 0 6 → 1 0 0 − 2 2 0 1 5 17
即 r ( A ) = 3 r(A) = 3 r ( A ) = 3 , 则二次型的秩为 3 3 3
定义2 只含平方项的二次型 f ( x 1 , x 2 , ⋯ , x n ) = ∑ i = 1 n λ i x i 2 f(x_1, x_2, \cdots , x_n) = \sum_{i = 1}^n \lambda_i x_i^2 f ( x 1 , x 2 , ⋯ , x n ) = ∑ i = 1 n λ i x i 2 称为标准型
标准型的矩阵为对角矩阵
5.1.2 二次型的变换与矩阵的合同
设 n n n 元二次型 f ( x 1 , x 2 , ⋯ , x n ) = X T A X f(x_1, x_2, \cdots , x_n) = X^TAX f ( x 1 , x 2 , ⋯ , x n ) = X T A X , C C C 是满秩的 n n n 阶方阵, 做线性变换
X = C Y X = CY
X = C Y
其中 Y = ( y 1 , y 2 , ⋯ , y n ) T Y = (y_1, y_2, \cdots , y_n)^T Y = ( y 1 , y 2 , ⋯ , y n ) T , 则原二次型将变为关于新变量 y 1 , y 2 , ⋯ , y n y_1, y_2, \cdots , y_n y 1 , y 2 , ⋯ , y n 的二次型, 且二次型的矩阵为
B = C T A C B = C^TAC
B = C T A C
将 X = C Y X = CY X = C Y 代入二次型 X T A X X^TAX X T A X , 即有
f = X T A X = ( Y T C T ) A ( C Y ) = C T A C f = X^TAX = (Y^TC^T)A(CY) = C^TAC
f = X T A X = ( Y T C T ) A ( C Y ) = C T A C
则 B = C T A C B = C^TAC B = C T A C 为对称矩阵, 故 f = Y T ( C T A C ) Y f = Y^T(C^TAC)Y f = Y T ( C T A C ) Y 是一个关于变量 y 1 , y 2 , ⋯ , y n y_1, y_2, \cdots , y_n y 1 , y 2 , ⋯ , y n 的二次型
定义3 对于连个矩阵 A A A 和 B B B , 若存在满秩矩阵 P P P , 使 P T A P = B P^TAP = B P T A P = B , 则称矩阵 A A A 与 B B B 合同, 记作 A ≃ B A \simeq B A ≃ B
可验证矩阵之间的合同关系具有以下性质
A ≃ A A \simeq A A ≃ A (反身性)
A ≃ B ⇒ B ≃ A A \simeq B \Rightarrow B \simeq A A ≃ B ⇒ B ≃ A (对称性)
A ≃ B , B ≃ C ⇒ A ≃ C A \simeq B , B \simeq C \Rightarrow A \simeq C A ≃ B , B ≃ C ⇒ A ≃ C (传递性)
由性质3可知, 对二次型做满秩线性变换后, 所得新的二次型的矩阵与原二次型的矩阵有合同关系, 变换前后的矩阵关系如下所示
X T A X → 经满秩线性变换 X = P Y Y T B Y ↕ ↕ A → B X^TAX \xrightarrow[]{经满秩线性变换 X = PY} Y^TBY \\
\updownarrow \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \updownarrow \\
A \xrightarrow[]{\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ } B
X T A X 经满秩线性变换 X = P Y Y T B Y ↕ ↕ A B
由于矩阵 A A A 左乘或右乘一个满秩矩阵, 其秩不变, 因此二次型在满秩线性变换中其秩不变
5.1.3 二次型的标准型
如果满秩线性变换 X = C Y X = CY X = C Y 将二次型 X T A X X^TAX X T A X 化成了标准二次型 ∑ i = 1 n λ i y i 2 \sum_{i = 1}^n \lambda_i y_i^2 ∑ i = 1 n λ i y i 2 , 则称 ∑ i = 1 n λ i y i 2 \sum_{i = 1}^n \lambda_i y_i^2 ∑ i = 1 n λ i y i 2 为二次型 X T A X X^TAX X T A X 的一个标准型
5.2 正交变换法化二次型为标准型
如果二次型满秩线性变换 X = C Y X = CY X = C Y 中, 矩阵 C C C 为正交矩阵, 则称这个变换为正交变换
5.2.1 实对称矩阵的对角化
定理1 实对称矩阵的特征值都是实数
证 设 λ \lambda λ 为实对称矩阵 A A A 的特征特质, X X X 为对应的特征向量, 则
A X = λ X , X ≠ 0 AX = \lambda X \ , \ X \ne \mathbf{0}
A X = λ X , X = 0
用 X ‾ \overline{X} X 表示将向量 X X X 所有分量换乘共轭复数后得到的向量, 称之为 X X X 的共轭向量, 上式两边同时取共轭, 则
A X ‾ = λ ‾ X ‾ , X ≠ 0 A \overline{X} = \overline{\lambda} \overline{X} \ , \ X \ne \mathbf{0}
A X = λ X , X = 0
上式两边同时去转置, 又矩阵 A A A 的对称性可得
X ‾ T A = λ ‾ X ‾ T \overline{X}^TA = \overline{\lambda} \overline{X}^T
X T A = λ X T
因此
X ‾ T A X = λ ‾ X ‾ T X \overline{X}^TAX = \overline{\lambda} \overline{X}^TX
X T A X = λ X T X
又由第一个式子得
X ‾ T A X = X ‾ T ( λ X ) = λ X ‾ T X \overline{X}^TAX = \overline{X}^T (\lambda X) = \lambda \overline{X}^TX
X T A X = X T ( λ X ) = λ X T X
所以
( λ − λ ‾ ) X ‾ T X = 0 (\lambda - \overline{\lambda}) \overline{X}^TX = 0
( λ − λ ) X T X = 0
因为 X ≠ 0 X \ne \mathbf{0} X = 0 , 故 λ = λ ‾ \lambda = \overline{\lambda} λ = λ , 即 λ \lambda λ 为实数
定理2 实对称矩阵的不同的特征值对应的特征向量必正交
证 设 λ 1 , λ 2 \lambda_1, \lambda_2 λ 1 , λ 2 是实对称矩阵 A A A 的两个不同的特征值, X 1 , X 2 X_1, X_2 X 1 , X 2 为对应的特征向量, 则
A X 1 = λ 1 X 1 , A X 2 = λ 2 X 2 AX_1 = \lambda_1 X_1 \ , \ AX_2 = \lambda_2 X_2
A X 1 = λ 1 X 1 , A X 2 = λ 2 X 2
又 A T = A A^T = A A T = A , 则
λ 2 X 1 T X 2 = X 1 T A X 2 = ( A X 1 ) T X 2 = ( λ 1 X 1 ) T X 2 = λ 1 X 1 T X 2 \lambda_2 X_1^T X_2 = X_1^T A X_2 = (AX_1)^T X_2 = (\lambda_1 X_1)^T X_2 = \lambda_1 X_1^T X_2
λ 2 X 1 T X 2 = X 1 T A X 2 = ( A X 1 ) T X 2 = ( λ 1 X 1 ) T X 2 = λ 1 X 1 T X 2
从而 ( ∣ l a m b d a 1 − λ 2 ) X 1 T X 2 = 0 (|lambda_1 - \lambda_2)X_1^T X_2 = 0 ( ∣ l amb d a 1 − λ 2 ) X 1 T X 2 = 0 , 又 λ 1 ≠ λ 2 \lambda_1 \ne \lambda_2 λ 1 = λ 2 , 故 X 1 T X 2 = 0 X_1^T X_2 = 0 X 1 T X 2 = 0 , 即 X 1 , X 2 X_1 , X_2 X 1 , X 2 正交
定理3 若实数 λ \lambda λ 为实对称方阵 A A A 的特征方程的 k k k 重根, 则矩阵 A A A 对应于 λ \lambda λ 的线性无关的实特征向量的最大个数恰为 k k k 个
定理4 设 A A A 为 n n n 阶实对称矩阵, 则一定存在正交矩阵 Q Q Q , 使 Q T A Q Q^TAQ Q T A Q 为对角矩阵, 且此对角矩阵的对角元恰为矩阵 A A A 的 n n n 个特征值(重数计算在内)
证 设实对称矩阵 A A A 的特征值为 λ 1 ≤ λ 2 ≤ ⋯ ≤ λ n \lambda_1 \le \lambda_2 \le \cdots \le \lambda_n λ 1 ≤ λ 2 ≤ ⋯ ≤ λ n (重数计算在内), 则由定理3, 对于 A A A 的某个 k k k 重特征值 λ = λ i + 1 = λ i + 2 = ⋯ = λ i + k \lambda = \lambda_{i + 1} = \lambda_{i + 2} = \cdots = \lambda_{i + k} λ = λ i + 1 = λ i + 2 = ⋯ = λ i + k , 恰有 k k k 个线性无关的实特征向量, 将它们正交化, 所得的 k k k 正交向量仍是对应于特征值 k k k 的特征向量. 又由定理2, 矩阵 A A A 不同的特征值对应的特征向量必正交. 则对应于矩阵 A A A 的 n n n 个特征值 λ 1 , λ 2 , ⋯ , λ n \lambda_1, \lambda_2, \cdots , \lambda_n λ 1 , λ 2 , ⋯ , λ n , 可得到 n n n 个两两相交的特征向量. 将其单位化得 n n n 个两两相交的单位化特征向量 η 1 . η 2 , ⋯ , η n \eta_1. \eta_2, \cdots , \eta_n η 1 . η 2 , ⋯ , η n , 且
A η i = λ i η i , i = 1 , 2 , ⋯ , n A \eta_i = \lambda_i \eta_i \ , \ i = 1, 2, \cdots , n
A η i = λ i η i , i = 1 , 2 , ⋯ , n
以 η i \eta_i η i 作为列向量构造矩阵 Q = ( η 1 , η 2 , ⋯ , η n ) Q = (\eta_1, \eta_2, \cdots , \eta_n) Q = ( η 1 , η 2 , ⋯ , η n ) , 则 Q Q Q 正交, 即有 Q T = Q − 1 Q^T = Q^{-1} Q T = Q − 1
记
A = d i a g ( λ 1 , λ 2 , ⋯ , λ n ) = ( λ 1 λ 2 ⋱ λ n ) A = diag(\lambda_1, \lambda_2, \cdots , \lambda_n) = \begin{pmatrix}
\lambda_1 \\
& \lambda_2 \\
& & \ddots \\
& & & \lambda_n
\end{pmatrix}
A = d ia g ( λ 1 , λ 2 , ⋯ , λ n ) = λ 1 λ 2 ⋱ λ n
即
A Q = ( A η 1 , A η 2 , ⋯ , A η n ) = ( λ 1 η 1 , λ 2 η 2 , ⋯ , λ n η n ) = ( η 1 , η 2 , ⋯ , η n ) ( λ 1 λ 2 ⋱ λ n ) = Q A AQ = (A \eta_1, A \eta_2, \cdots , A \eta_n) = (\lambda_1 \eta_1, \lambda_2 \eta_2, \cdots , \lambda_n \eta_n) \\
= (\eta_1, \eta_2, \cdots , \eta_n) \begin{pmatrix}
\lambda_1 \\
& \lambda_2 \\
& & \ddots \\
& & & \lambda_n
\end{pmatrix} \\
= QA
A Q = ( A η 1 , A η 2 , ⋯ , A η n ) = ( λ 1 η 1 , λ 2 η 2 , ⋯ , λ n η n ) = ( η 1 , η 2 , ⋯ , η n ) λ 1 λ 2 ⋱ λ n = Q A
从而得 Q − 1 A Q = Λ Q^{-1}AQ = \Lambda Q − 1 A Q = Λ 为对角矩阵, 且 Λ \Lambda Λ 的对角元恰为矩阵 A A A 的 n n n 个特征值
定理5 任意一个实二次型 f = X T A X = ∑ i = 1 n ∑ j = 1 n a i j x i x j ( a i j = a i j , i , j = 1 , 2 , ⋯ , n ) f = X^TAX = \sum_{i = 1}^n \sum_{j = 1}^n a_{ij} x_i x_j \ (a_{ij} = a_{ij}, i, j = 1, 2, \cdots , n) f = X T A X = ∑ i = 1 n ∑ j = 1 n a ij x i x j ( a ij = a ij , i , j = 1 , 2 , ⋯ , n ) 都可经过正交变换化为标准型, 即存在正交变换 X = Q Y X = QY X = Q Y , 使得
f = ∑ i = 1 n λ i y i 2 = λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2 f = \sum_{i = 1}^n \lambda_i y_i^2 = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \cdots + \lambda_n y_n^2
f = i = 1 ∑ n λ i y i 2 = λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2
其中 λ 1 , λ 2 , ⋯ , λ n \lambda_1, \lambda_2, \cdots , \lambda_n λ 1 , λ 2 , ⋯ , λ n 为二次型的矩阵 A A A 的特征值, Y = ( y 1 , y 2 , ⋯ , y n ) T , X = ( x 1 , x 2 , ⋯ , x n ) T Y = (y_1, y_2, \cdots , y_n)^T , X = (x_1, x_2, \cdots , x_n)^T Y = ( y 1 , y 2 , ⋯ , y n ) T , X = ( x 1 , x 2 , ⋯ , x n ) T
5.2.2 正交变换法化二次型为标准型
利用正交变换法化二次型为标准型的步骤如下
写出 n n n 元二次型所对应的 n n n 阶矩阵 A A A , 并求出 A A A 的全部特征值 λ 1 , λ 2 , ⋯ , λ n \lambda_1, \lambda_2, \cdots , \lambda_n λ 1 , λ 2 , ⋯ , λ n (重数计算在内)
找出对应于各特征值的特征向量, 当 λ i \lambda_i λ i 为 k i k_i k i 重特征值时, 必须找出属于 λ i \lambda_i λ i 的 k i k_i k i 个线性无关的特征向量 (即找出 ( A − λ i E ) X = 0 (A - \lambda_i E)X = \mathbf{0} ( A − λ i E ) X = 0 的一个基础解系), 并用施密特正交法将其正交化
将上述 n n n 个特征向量单位化后记作 η 1 , η 2 , ⋯ , η n \eta_1, \eta_2, \cdots , \eta_n η 1 , η 2 , ⋯ , η n , 并记矩阵 Q = ( η 1 , η 2 , ⋯ , η n ) Q = (\eta_1, \eta_2, \cdots , \eta_n) Q = ( η 1 , η 2 , ⋯ , η n ) , 则 X = Q Y X = QY X = Q Y 为所求的正交变换, 且 f f f 的标准型为
f = λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2 f = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \cdots + \lambda_n y_n^2
f = λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2
例 利用正交变换法化二次型 f = x 1 2 + + 4 x 2 2 − 4 x 1 x 2 + 4 x 1 x 3 − 8 x 1 x 3 f = x_1^2 ++ 4x_2^2 - 4x_1x_2 + 4x_1x_3 - 8x_1x_3 f = x 1 2 + + 4 x 2 2 − 4 x 1 x 2 + 4 x 1 x 3 − 8 x 1 x 3 为标准型
解
二次型矩阵 A = ( 1 − 2 2 − 2 4 − 4 2 − 4 4 ) A = \begin{pmatrix}
1 & -2 & 2 \\
-2 & 4 & -4 \\
2 & -4 & 4
\end{pmatrix} A = 1 − 2 2 − 2 4 − 4 2 − 4 4 , 矩阵 A A A 的特征多项式为
∣ A − λ E ∣ = ( 1 − λ − 2 2 − 2 4 − λ − 4 2 − 4 4 − λ ) = − λ 2 ( λ − 9 ) \left | A - \lambda E \right | = \begin{pmatrix}
1- \lambda & -2 & 2 \\
-2 & 4 - \lambda & -4 \\
2 & -4 & 4 - \lambda
\end{pmatrix} = - \lambda^2 (\lambda - 9)
∣ A − λ E ∣ = 1 − λ − 2 2 − 2 4 − λ − 4 2 − 4 4 − λ = − λ 2 ( λ − 9 )
因此, 矩阵 A A A 的特征值为 λ 1 = 9 , λ 2 = λ 3 = 0 \lambda_1 = 9, \lambda_2 = \lambda_3 = 0 λ 1 = 9 , λ 2 = λ 3 = 0
对于 λ 1 = 9 \lambda_1 = 9 λ 1 = 9 , 由于
A − λ 1 E = ( − 8 − 2 2 − 2 − 5 − 4 2 − 4 − 5 ) ⇒ ⋯ ⋯ ( 2 0 − 1 0 1 1 0 0 0 ) A - \lambda_1 E = \begin{pmatrix}
-8 & -2 & 2 \\
-2 & -5 & -4 \\
2 & -4 & -5
\end{pmatrix}
\xRightarrow[\cdots]{\cdots}
\begin{pmatrix}
2 & 0 & -1 \\
0 & 1 & 1 \\
0 & 0 & 0
\end{pmatrix}
A − λ 1 E = − 8 − 2 2 − 2 − 5 − 4 2 − 4 − 5 ⋯ ⋯ 2 0 0 0 1 0 − 1 1 0
则齐次线性方程组 ( A − λ 1 E ) X = 0 (A - \lambda_1 E)X = \mathbf{0} ( A − λ 1 E ) X = 0 的基础解系为 ξ 1 = ( 1 , − 2 , 2 ) T \xi_1 = (1, -2, 2)^T ξ 1 = ( 1 , − 2 , 2 ) T , 从而获得 A A A 的属于特征值 λ 1 = 9 \lambda_1 = 9 λ 1 = 9 的特征向量 ξ 1 = ( 1 , − 2 , 2 ) T \xi_1 = (1, -2, 2)^T ξ 1 = ( 1 , − 2 , 2 ) T
对于 λ 2 = λ 3 = 0 \lambda_2 = \lambda_3 = 0 λ 2 = λ 3 = 0 , 由于
A − λ 2 E = ( 1 − 2 2 − 2 4 − 4 2 − 4 4 ) ⇒ ( 1 − 2 2 0 0 0 0 0 0 ) A - \lambda_2 E = \begin{pmatrix}
1 & -2 & 2 \\
-2 & 4 & -4 \\
2 & -4 & 4
\end{pmatrix}
\xRightarrow[]{}
\begin{pmatrix}
1 & -2 & 2 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{pmatrix}
A − λ 2 E = 1 − 2 2 − 2 4 − 4 2 − 4 4 1 0 0 − 2 0 0 2 0 0
通过求齐次线性方程组 ( A − λ 2 E ) X = 0 (A - \lambda_2 E)X = \mathbf{0} ( A − λ 2 E ) X = 0 的基础解系并将其正交化, 可得 A A A 的属于特征值 λ 2 = λ 3 = 0 \lambda_2 = \lambda_3 = 0 λ 2 = λ 3 = 0 的两个相互正交的特征向量 ξ 1 = ( 0 , 1 , 1 ) T , ξ 1 = ( 4 , 1 , − 1 ) T \xi_1 = (0, 1, 1)^T , \xi_1 = (4, 1, -1)^T ξ 1 = ( 0 , 1 , 1 ) T , ξ 1 = ( 4 , 1 , − 1 ) T
将上述三个两两正交的特征向量 ξ 1 , ξ 2 , ξ 3 \xi_1, \xi_2, \xi_3 ξ 1 , ξ 2 , ξ 3 正交化, 得
η 1 = ( 1 3 , − 2 3 , 2 3 ) T , η 2 = ( 0 , 1 2 , 1 2 ) T , η 3 = ( 4 3 2 , 1 3 2 , − 1 3 2 ) T \eta_1 = (\frac{1}{3}, - \frac{2}{3}, \frac{2}{3})^T , \eta_2 = (0, \frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}})^T , \eta_3 = (\frac{4}{3 \sqrt{2}}, \frac{1}{3 \sqrt{2}}, - \frac{1}{3 \sqrt{2}})^T
η 1 = ( 3 1 , − 3 2 , 3 2 ) T , η 2 = ( 0 , 2 1 , 2 1 ) T , η 3 = ( 3 2 4 , 3 2 1 , − 3 2 1 ) T
则在正交变换
( x 1 x 2 x 3 ) = ( 1 3 0 4 3 2 − 2 3 1 2 1 3 2 2 3 1 2 − 1 3 2 ) ( y 1 y 2 y 3 ) \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix}
= \begin{pmatrix}
\frac{1}{3} & 0 & \frac{4}{3 \sqrt{2}} \\
- \frac{2}{3} & \frac{1}{\sqrt{2}} & \frac{1}{3 \sqrt{2}} \\
\frac{2}{3} & \frac{1}{\sqrt{2}} & - \frac{1}{3 \sqrt{2}}
\end{pmatrix}
\begin{pmatrix} y_1 \\ y_2 \\ y_3 \end{pmatrix}
x 1 x 2 x 3 = 3 1 − 3 2 3 2 0 2 1 2 1 3 2 4 3 2 1 − 3 2 1 y 1 y 2 y 3
下, 二次型的标准型为 f = 9 y 1 2 f = 9y_1^2 f = 9 y 1 2
5.2.3 正交变换法化二次型为标准型在几何方面的应用
下面讨论如何识别三元二次方程表示的曲面形状, 设 X = ( x , y , z ) T X = (x, y, z)^T X = ( x , y , z ) T , 则二元二次型 X T A X X^TAX X T A X 可视为几何空间向量 α \alpha α 的函数, 其中 α \alpha α 在标准基 ε 1 , ε 2 , ε 3 \varepsilon_1, \varepsilon_2, \varepsilon_3 ε 1 , ε 2 , ε 3 写的坐标便是 X X X . 做满秩线性变换 X = C Y X = CY X = C Y , 所得新的二次型 Y T C T A C Y Y^TC^TACY Y T C T A C Y 就是关于 α \alpha α 在另一组基 η 1 , η 2 , η 3 \eta_1, \eta_2, \eta_3 η 1 , η 2 , η 3 下的坐标 ( x ′ , y ′ , z ′ ) (x', y', z') ( x ′ , y ′ , z ′ ) 的二次齐次式, 其中 Y = ( x ′ , y ′ , z ′ ) T , ( η 1 , η 2 , η 3 ) = ( ε 1 , ε 2 , ε 3 ) C Y = (x', y', z')^T, (\eta_1, \eta_2, \eta_3) = (\varepsilon_1, \varepsilon_2, \varepsilon_3)C Y = ( x ′ , y ′ , z ′ ) T , ( η 1 , η 2 , η 3 ) = ( ε 1 , ε 2 , ε 3 ) C
对于方程
X T A X = 1 X^TAX = 1
X T A X = 1
如果将 X = ( x , y , z ) T X = (x, y, z)^T X = ( x , y , z ) T 视为动点 M M M 在空间直角坐标系下的坐标, 则满足上述方程的点点全体构成空间曲面 S S S , 当 A A A 不是对角矩阵时, 上述方程不是标准饭程序, 因此不易识别曲面 S S S 的具体形状. 为此, 采用正交变换 X = Q Y X = QY X = Q Y 化二次型 X T A X X^TAX X T A X 为标准型 Y T A Y Y^T \Alpha Y Y T A Y , 从而曲面 S S S 在新的直角坐标系下的方程为
Y T A Y = 1 Y^T \Alpha Y = 1
Y T A Y = 1
由正交变换的特定, 知上述两方程是同一空间曲面在不同的空间直角坐标系下的方程, 即上述两方程对应的形状相同
例 设二次型 f ( x 1 , x 2 , x 3 ) = 5 x 1 2 + 5 x 2 2 + 3 x 3 2 − 2 x 1 x 2 + 6 x 1 x 3 − 6 x 2 x 3 f(x_1, x_2, x_3) = 5x_1^2 + 5x_2^2 + 3x_3^2 - 2x_1x_2 + 6x_1x_3 - 6x_2x_3 f ( x 1 , x 2 , x 3 ) = 5 x 1 2 + 5 x 2 2 + 3 x 3 2 − 2 x 1 x 2 + 6 x 1 x 3 − 6 x 2 x 3 , 指出方程 f ( x 1 , x 2 , x 3 ) = 1 f(x_1, x_2, x_3) = 1 f ( x 1 , x 2 , x 3 ) = 1 表示何种二次曲面
解 二次型 f f f 的矩阵为
A = = ( 5 − 1 3 − 1 5 − 3 3 − 3 3 ) A == \begin{pmatrix}
5 & -1 & 3 \\
-1 & 5 & -3 \\
3 & -3 & 3
\end{pmatrix}
A == 5 − 1 3 − 1 5 − 3 3 − 3 3
因为
∣ A = λ E ∣ = ( 5 − λ − 1 3 − 1 5 − λ − 3 3 − 3 3 − λ ) = − λ ( λ − 4 ) ( λ − 9 ) \left | A = \lambda E \right | = \begin{pmatrix}
5 - \lambda & -1 & 3 \\
-1 & 5 - \lambda & -3 \\
3 & -3 & 3 - \lambda
\end{pmatrix}
= - \lambda (\lambda - 4)(\lambda - 9)
∣ A = λ E ∣ = 5 − λ − 1 3 − 1 5 − λ − 3 3 − 3 3 − λ = − λ ( λ − 4 ) ( λ − 9 )
所以 A A A 的特征值为 λ 1 = 0 , λ 2 = 4 , λ 3 = 9 \lambda_1 = 0, \lambda_2 = 4, \lambda_3 = 9 λ 1 = 0 , λ 2 = 4 , λ 3 = 9 , 因此, 可利用正交变换将此二次型化为标准型 f = 4 y 2 2 + 9 y 3 2 f = 4y_2^2 + 9y_3^2 f = 4 y 2 2 + 9 y 3 2 , 而 4 y 2 3 + 9 y 3 2 = 1 4y_2^3 + 9y_3^2 = 1 4 y 2 3 + 9 y 3 2 = 1 在 R 3 R^3 R 3 中表示椭圆柱面, 所以 f ( x 1 , x 2 , x 3 ) = 1 f(x_1, x_2, x_3) = 1 f ( x 1 , x 2 , x 3 ) = 1 表示的是椭圆柱面