线性代数(6): 谱理论(6)

Posted by w@hidva.com on July 14, 2024

系列导言, 本文是作者在学习 Peter D. Lax 线性代数及其应用的读书笔记, 侧重于记录我当时没有看懂的部分, 以及对书中部分知识点的一些扩展. 非常零散, 不成系统. 对本系列的使用最好是读者也在学习 Peter D. Lax 线代并且恰好有某处不太明白, 可以参考着本系列说不定这里就有答案. 本系列文章在写作时参考了互联网上零零散散非常多的资料在此表示感谢!

在上一篇文章, 对于 A 的每一个本征值 a, 我们找到了 a 对应 $N_d$ 的基, 以及 a 对应的 Jordan 方块. 现在对于 A 的所有本征值 $a_i, i = 1,\cdots,k$; $d_i$ 为 $a_i$ 的指数, $N_i$ 为 $(A - a_i I)^{d_i}$ 零空间, $m_i = \dim N_i, E_i$ 为 $N_i$ 的基. 由定理 7 谱定理可知 $C^n = \bigoplus_{i=1}^k N_i$, 即 $E = \bigcup_{i=1}^k E_i$ 为 $C^n$ 的基. $\forall x \in C^n$, x 可以唯一表示为 E 的线性组合 $x = x_{1,1} e_{1,1} + \cdots + x_{1, m_1} e_{1, m_1} + \cdots + x_{k, 1} e_{k, 1} + \cdots + x_{k, m_k} e_{k, m_k}$, 由此定义可逆映射 $Q: C^n \to C^n, Q(x) = (x_{1,1}, \cdots, x_{k, m_k})$.

由谱定理可知 $\forall x \in C^n, x = x_1 + \cdots + x_n, x_i \in N_i, x_i = x_{i,1} e_{i,1} + \cdots + x_{i, m_i} e_{i, m_i}$. 且 $Ax = A(x_1) + \cdots + A(x_n)$. 现在证 $A = Q^{-1} J_A’ Q, Q A = J_A’ Q$, 即 $Q(A(x_1)) + \cdots + Q(A(x_k)) = J_A’(Q(x_1)) + \cdots + J_A’(Q(x_k))$. 回到我们上一篇文章, $P_i A(x_i) = (J_i’ P_i)(x_i)$, 这里 $J_i’$ 为 $a_i$ 对应 Jordan 方阵对应的转置, 即 $J’ + a_i I, J’$ 引用自上一篇文章, $P_i$ 引用着上一篇文章的 $P’$. 如下表示 $J_A’ (Q(x))$:

\[\begin{pmatrix} 0 \\ a_1 & 0 \\ & \ddots & \ddots \\ & & a_1 & 0 \\ & & & a_2 & 0 \\ & & & & \ddots & \ddots \\ & & & & & a_2 & 0 \\ & & & & & & \ddots & \ddots \\ & & & & & & & a_k & 0 \\ & & & & & & & & \ddots & \ddots \\ & & & & & & & & & a_k & 0 \end{pmatrix} \begin{pmatrix} x_{1,1} \\ \vdots \\ x_{1,m_1} \\ x_{2, 1} \\ \vdots \\ x_{2, m_2} \\ \vdots \\ x_{k, 1} \\ \vdots \\ x_{k, m_k} \\ \end{pmatrix} = \begin{pmatrix} J_1' \begin{pmatrix} x_{1,1} \\ \vdots \\ x_{1,m_1} \\ \end{pmatrix} \\ J_2' \begin{pmatrix} x_{2,1} \\ \vdots \\ x_{2,m_2} \\ \end{pmatrix} \\ \vdots \\ J_k' \begin{pmatrix} x_{k,1} \\ \vdots \\ x_{k,m_k} \\ \end{pmatrix} \end{pmatrix}\]

这里易证 $Q(x_i) = (0, \cdots, 0, P_i(x_i), 0, \cdots, 0)^T, Q(x_1) = (P_1(x_1), 0, \cdots, 0)^T$, 因为 $x_i \in N_i$, 在其关于 E 的分解中, 所有 $E_j, j \ne i$ 的系数都为 0. 结合上面等式图容易观察到 $Q(A(x_i)) = P_i (A(x_i))$, 比较时抹掉了无关紧要的 0. 以及 $J_A’(Q(x_i)) = (J_i’P_i)(x_i)$. P.S. 或许还有一点细节要补充, 但我太乏了=.

综上我们证明了任何矩阵都与其对应的 $J_A’$ 相似, 而已知 $J_A$ 与 $J_A’$ 相似, 所以任意矩阵都与其 $J_A$ 相似, 这里 $J_A$ 被称为 A 的 Jordan 标准形. 且由证明过程可知, $J_A$ 仅与 A 的本征值以及零空间有关, 所以定理 12 得证!


6.6.zy1 Jordan 标准形有什么用呢? 还记得例 1 我们展示了本征向量存在的意义, 用来加速类似 $A^N h$ 计算, 而 Jordan 标准形正有这种作用: 对于一个 Jordan 块,我们可以很容易地计算其幂方乘积和多项式。设 $ a \in \mathbb{C}, f \in \mathbb{C}[x], A \in \mathbb{C}^{n \times n}$, a 是 A 的特征值, f 是复数域上的多项式, $J_n(a)$ 是 a 对应的 Jordan 方块, n 为 a 的指数.

\[f(J_n(a)) = \sum_{k=0}^{n-1} \frac{f^{(k)} (a)}{k!} (J_n(0))^k = \begin{pmatrix} f(a) & f'(a) & \frac{f''(a)}{2!} & \cdots & \frac{f^{(n-1)}(a)}{(n-1)!} \\ & f(a) & f'(a) & \cdots & \frac{f^{(n-2)}(a)}{(n-2)!} \\ & & f(a) & \cdots & \frac{f^{(n-3)}(a)}{(n-3)!} \\ & & & \ddots & \vdots \\ & & & & f(a) \end{pmatrix}\]

从而,对于任意方阵 A,我们可以利用 Jordan 标准形分解 $ A = P \, \text{diag}(J_{n_1}(a_1), J_{n_2}(a_2), \ldots, J_{n_k}(a_k)) P^{-1} $,得出的矩阵幂和多项式 $ f(A) = P \, \text{diag}(f(J_{n_1}(a_1)), f(J_{n_2}(a_2)), \ldots, f(J_{n_k}(a_k))) P^{-1} $。 P.S. 这一段内容我直接摘自王新茂老师讲义, 我没细算, 我太乏了==

至于 P, 考虑到 $AP = PJ$, 在 A, J 已知的情况下, P 可以通过解线性方程组计算得:

\[\begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{pmatrix} \begin{pmatrix} p_{11} & p_{12} & p_{13} \\ p_{21} & p_{22} & p_{23} \\ p_{31} & p_{32} & p_{33} \end{pmatrix} = \begin{pmatrix} p_{11} & p_{12} & p_{13} \\ p_{21} & p_{22} & p_{23} \\ p_{31} & p_{32} & p_{33} \end{pmatrix} \begin{pmatrix} j_{11} & j_{12} & j_{13} \\ j_{21} & j_{22} & j_{23} \\ j_{31} & j_{32} & j_{33} \end{pmatrix}\]

此时可得 $a_{11} p_{11} + a_{12} p_{21} + a_{13} p_{31} = p_{11} j_{11} + p_{12} j_{21} + p_{13} j_{31}$ 等方程组.


$(A - aI)^m f = 0$, 这里 m 较大时, 比如为 3 时, 还能推出公式 25 那种结论么? 此时 f 作为广义本征向量还能取到计算加速的效果么? 这是我之前遗留的一个疑问, 现在看来, 广义本征向量存在意义之一就是推出 Jordan 标准形之后加速计算, 其自身是无法直接用来进行加速计算的.

P.S. 本征向量也是广义本征向量, 此时对应的 $m = 1$.