线性代数(6): 谱理论(5)

Posted by w@hidva.com on July 14, 2024

系列导言, 本文是作者在学习 Peter D. Lax 线性代数及其应用的读书笔记, 侧重于记录我当时没有看懂的部分, 以及对书中部分知识点的一些扩展. 非常零散, 不成系统. 对本系列的使用最好是读者也在学习 Peter D. Lax 线代并且恰好有某处不太明白, 可以参考着本系列说不定这里就有答案. 本系列文章在写作时参考了互联网上零零散散非常多的资料在此表示感谢!

之前在介绍矩阵的本征值, 本征向量时都是将矩阵 A 视为 $C^n \to C^n$ 上的线性映射. 以此类推定义线性空间 X 上线性映射 $A: X \to X$ 对应的本征值, 本征向量等概念. 若存在标量 a, 使得线性映射 $A - aI$, 这里 I 为恒等映射, 不可逆. 则意味着 a 是线性映射 A 的本征值. 若 $\exists h \in X, Ah = ah$, 则 h 是 A 的本征向量. 若 $\exists m, (A - aI)^m f = 0_X, f \in X$, 则 f 是 A 关于本征值 a 的广义特征向量. 此时由谱定理可知 $X = N^{(1)} \oplus \cdots \oplus N^{(k)}$, 这里 $N^{(i)}$ 为线性映射 $(A - a_i I) ^{d_i}$ 的零空间, $d_i$ 为 $a_i$ 的指数.

定理 13 讲的是 X 有一个基, 基中的元素同时是 A, B 的广义本征向量. 在证明过程中可得 $X = N_1^{(1)} \oplus N_2^{(1)} \oplus \cdots \oplus N_{i_k}^{(k)}$, 这里 $N_{j}^{(i)}$ 为 $N^{(i)}$ 依映射 B 分解后的值. 此时 $\forall x \in N_{j}^{(i)}, x \in N^{(i)}$ 易证 x 同时是 A, B 的广义本征向量.

P.S. 从第 8 章再次回到这里探究之前遗留的一个问题. 设这里 B 的特征值为 $a_i, i=1,\cdots, n$, 对应的指数是 $d_i$, 令 $N_i^j$ 表示 $(B - a_i I)^j$ 的零空间. 由谱定理可知 $X = \bigoplus_{i=1}^n N_i^{d_i}$. 这里 $N^{(i)}$ 是 X 的子空间如上讨论所示, 其也可以分解为 B 的广义特征向量之和, 那么这个分解是什么形式的呢?

考虑映射 $B: N^{(i)} \to N^{(i)}$, 若 $f \in N^{(i)}, \exists a’, m’, (B - a’I)^{m’} f = 0$, 此时意味着 f 是 B 关于特征值 $a’$ 的广义本征向量. 此时易证 $\exists i, a’ = a_i, m’ \le d_i$, 即若 $a’, f$ 是映射 $B: N^{(i)} \to N^{(i)}$ 的本征值与广义本征向量, 则其也是映射 $B: X \to X$ 的本征值与广义本征向量.

但反过来, 若 $a, f$ 是映射 $B: X \to X$ 的本征值与广义本征向量, 此时可能会出现 $\forall g \in N^{(i)}, \forall m, (B-aI)^m g \ne 0$, 即此时 a 不是映射$B: N^{(i)} \to N^{(i)}$ 的本征值.

因此 $N^{(i)} = \bigoplus_{j=1}^n N_j^{d_j’}, 0 \le d_j’ \le d_j$.

定理 15 略作补充, 由之前定理已知 $\dim N_T + \dim R_T = \dim X = \dim X’ = \dim N_{T’} + \dim R_{T’}$, 而 $\dim R_{T’} = \dim R_T$, 所以有 $\dim N_T = \dim N_{T’}$. 若 a 是 A 的特征值, 意味着 $A - aI$ 不可逆, 即 $\dim N_{A - aI} \gt 0$, 即 $\dim N_{A’ - aI’} \gt 0$, 所以 $A’ - aI’$ 也不可逆, 即 a 也是 $A’$ 特征值, 反之亦然.

P.S. 这里提到了本征空间的概念, 但原文未定义过. 这里本征值 a 对应的本征空间即 $A - aI$ 的零空间.


6.5.zy1, 对于线性映射 $f: X \to Y$, 若 f 是个单射, 则 $\dim X \le \dim Y$.

证明: 已知 $\dim X = \dim N_f + \dim R_f$, f 是个单射意味着 $\dim N_f = 0$, 所以 $\dim X = \dim R_f$, 而 $R_f \subseteq Y, \dim R_f \le \dim Y$.

这里接着附录 15, 若当标准形的内容. 唉, 这节 Lax 老师写的很简略, 再加上中文翻译之后有点失真, 看得我脑壳疼.

设 a 为矩阵 A 的特征值, 其指数为 d, 令 $N_i$ 为 $(A - aI)^i$ 的零空间, 易知 $N_1 \subset N_2 \subset \cdots \subset N_{d-1} \subset N_d$. 记 $A’ = A - aI$, 则 0 为 $A’$ 的本征值, 易证 $(A’)^i$ 的零空间即 $(A - aI)^i$ 的零空间, 所以 0 的指数也是 d. 原文混用了 $A, A’$ 加剧了头秃.

引理 2, A’ 将商空间 $N_{i+1}/N_i$ 映射到 $N_i / N_{i-1}$, 且是个单射.

证明: $\forall x \in N_{i+1}, (A’)^{i+1}(x) = 0, (A’)^i (A’(x)) = 0$, 即 $A’(x) \in N_i, A’: N_{i+1} \to N_i$. 定义映射 $(A’)([x]) = [A’x], x \in N_{i+1}/N_i$, 观察到 $[A’x] \in N_i / N_{i-1}$; 且 $\forall x_1, x_2 \in N_{i+1}; [x_1] = [x_2]$ 有 $x_1 - x_2 \in N_i, (A’)(x_1 - x_2) \in N_{i-1}$ 即 $[A’x_1] = [A’ x_2]$. 所以此时 $(A’)([x]): N_{i+1}/N_i \to N_i / N_{i-1}$ 是个合法映射.

$\forall x_1, x_2 \in N_{i+1}$, 若 $(A’)([x_1]) = (A’)([x_2]), [(A’) x_1] = [(A’) x_2], (A’)(x_1 - x_2) \in N_{i-1}$, 即 $(A’)^{i-1}((A’)(x_1 - x_2)) = 0, x_1 - x_2 \in N_i, [x_1] = [x_2]$. 所以 (A’) 是个单射.

P.S. 由 6.5.zy1 这里意味着 $\dim N_{i+1}/N_i \le \dim N_i / N_{i-1}$

现在准备选取 $N_d$ 的一个基,

  1. 任取 $N_d$ 中的 $l_0$ 个向量 $x_1, \cdots, x_{l_0}, l_0 = \dim(N_d / N_{d-1})$ 且 $[x_1], \cdots, [x_{l_0}] \in N_d / N_{d-1}$ 线性无关.

6.5.zy2, 这里 $x_1, \cdots, x_{l_0}$ 线性无关.

证明: 反证假设线性相关 $\sum_{j=1}^{l_0} a_j x_j = 0, a_j$ 不全为 0, 则 $[\sum_{j=1}^{l_0} a_j x_j] = [0] = \sum_{j=1}^{l_0} a_j [x_j]$, 矛盾了.

P.S. 这里意味着 $x_i \notin N_{d-1}$, 否则 $N_d / N_{d-1}$ 中 $[x_i] = [0]$, 与线性无关矛盾了.

6.5.zy3, $A’ x_1, \cdots, A’ x_{l_0}$ 属于 $N_{d-1}$ 且模 $N_{d-2}$ 后线性无关, 即 $[A’ x_1], \cdots, [A’ x_{l_0}]$ 是 $N_{d-1} / N_{d-2}$ 线性无关组.

证明: 假设模 $N_{d-2}$ 后线性相关, 即 $\sum_{j=1}^{l_0} a_j [A’ x_j] = [0], a_j$ 不全为 0. 即 $A’(\sum_{j=1}^{l_0} a_j x_j) \in N_{d-2}$ 即 $\sum_{j=1}^{l_0} a_j x_j \in N_{d-1}$. 即在 $N_d / N_{d-1}$ 中 $[\sum_{j=1}^{l_0} a_j x_j] = [0] = \sum_{j=1}^{l_0} a_j [x_j]$, 矛盾了!

P.S. 这里 “模 $N_{d-2}$ 后线性无关” 我一开始也没搞懂其啥意思…

  1. 记 $l_1 = \dim(N_{d-1}/ N_{d-2}), l_0 \le l_1$, 在 $N_{d-1}$ 中再选择 $x_{l_0 + 1}, \cdots x_{l_1}$ 使得 $[A’ x_1], \cdots, [A’ x_{l_0}], [x_{l_0 + 1}], [x_{l_1}]$ 是 $N_{d-1}/N_{d-2}$ 的基. 具体如何选择见第一章定理 4.

  2. 重复步骤 2 直至到达 $N_1$, 将找到的向量组列成下表:

$x_1$ $(A’) x_1$ $(A’)^2 x_1$ $(A’)^{d-2} x_1$ $(A’)^{d-1} x_1$
$x_{l_0}$ $(A’) x_{l_0}$ $(A’)^2 x_{l_0}$ $(A’)^{d-2} x_{l_0}$ $(A’)^{d-1} x_{l_0}$
  $x_{l_0 + 1}$ $(A’) x_{l_0 + 1}$ $(A’)^{d-3} x_{l_0 + 1}$ $(A’)^{d-2} x_{l_0 + 1}$
 
  $x_{l_1}$ $(A’) x_{l_1}$ $(A’)^{d-3} x_{l_1}$ $(A’)^{d-2} x_{l_1}$
    $x_{l_1 + 1}$
   
    $x_{l_2}$
        $x_{l_{d-3} + 1}$ $(A’) x_{l_{d-3} + 1}$
       
        $x_{l_{d-2}}$ $(A’) x_{l_{d-2}}$
          $x_{l_{d-2} + 1}$
         
          $x_{l_{d-1}}$

这里如上可知我们已经证明了如上表格每一纵列都是线性无关, 而且这里每一纵列中的所有向量模 $N_{i-1}$ 之后都是某个 $N_i / N_{i-1}$ 的基, 比如最右侧一列 $[(A’)^{d-1} x_1], \cdots, [x_{l_{d-1}}]$是 $N_1/ N_0$ 的基.

现在证如上向量组是 $N_d$ 的基, 首先这组向量组中包含向量的个数为 $\dim(N_d /N_{d-1}) + \cdots + \dim(N_1 / N_0)$ 即为 $\dim N_d$. 假设这些向量线性相关:

\[\begin{align} &c_{10} x_1 + \cdots + c_{l_0,0} x_{l_0} + \cdots + c_{1,d-1} (A')^{d-1} x_1 + \cdots + c_{l_{d-1},d-1} x_{l_{d-1}} = 0 \\ &A'(c_{10} x_1 + \cdots + c_{l_0,0} x_{l_0} + \cdots + c_{1,d-1} (A')^{d-1} x_1 + \cdots + c_{l_{d-1},d-1} x_{l_{d-1}}) = 0\\ & A'(c_{10} x_1 + \cdots + c_{l_0,0} x_{l_0} + \cdots) + A'(c_{1,d-1} (A')^{d-1} x_1 + \cdots + c_{l_{d-1},d-1} x_{l_{d-1}}) = 0 \end{align}\]

而这里易证 $A’(c_{1,d-1} (A’)^{d-1} x_1 + \cdots + c_{l_{d-1},d-1} x_{l_{d-1}}) = 0$. 所以有 $c_{10} A’(x_1) + \cdots + c_{l_0,0} A’(x_{l_0}) + \cdots = 0$. 反复乘以 $A’$ 最终会发现表格中某一纵列中的向量线性相关, 矛盾了.

则 $\forall x \in N_d$, x 都可以唯一地表示为如上向量的线性组合 $x = c_1 x_1 + c_2 (A’) x_1 + c_3 (A’)^2 x_1 + \cdots$, 定义映射 $P: N_d \to C^{\dim N_d}, P(x) = (c_1, c_2, \cdots)$, 则易证 P 是线性同构. 定义矩阵 $J’$:

\[J' = \begin{pmatrix} 0 & 0 & 0 & \cdots & 0 \\ 1 & 0 & 0 & \cdots & 0 \\ 0 & 1 & 0 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & 0 \\ 0 & 0 & 0 & \cdots & 0 \end{pmatrix} J = \begin{pmatrix} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ 0 & 0 & 0 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & 1 \\ 0 & 0 & 0 & \cdots & 0 \end{pmatrix} T= \begin{pmatrix} 0 & 0 & 0 & \cdots & 1 \\ 0 & 0 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & 0 \\ 1 & 0 & 0 & \cdots & 0 \end{pmatrix}\]

这里 $J’$ 是 J 的转置, 我本来想用转置矩阵是相似来表示这俩相似, 但意识到现在我们正在证明转置矩阵相似路上, 不能直接使用定理 15, 不过没关系很容易发现 $T^{-1} = T, J = T J’ T^{-1}$. 下面证映射 $A’: N_d \to N_d$ 与 $P^{-1} J’ P$ 相同, 此时我们只要证明两个映射会将基中每一个向量映射到相同的向量即可, 以 $x_1$ 为例, $P^{-1} J’ P(x_1) = A’ x_1$ 其他类似. 进一步可得 $A = A’ + aI = P^{-1} (J’ + aI) P$.

P.S. 这里矩阵 T 可以用来证明上三角矩阵与其对应的下三角矩阵是相似的.

即在以如上表格作为 $N_d$ 基的情况下, 存在可逆映射 P, 使得 $A = P^{-1} (J’ + aI) P$, 这里 $A: N_d \to N_d$ 不是 $C^n \to C^n$. 这里 $J + aI$ 为 a 对应的 Jordan 方块.

P.S. 这里使用 $A_0$ 来表示 $A’$ 是不是更合适? $A’$ 会不会让人联想到 A 的转置.