线性代数(6): 谱理论(1)

Posted by w@hidva.com on July 14, 2024

系列导言, 本文是作者在学习 Peter D. Lax 线性代数及其应用的读书笔记, 侧重于记录我当时没有看懂的部分, 以及对书中部分知识点的一些扩展. 非常零散, 不成系统. 对本系列的使用最好是读者也在学习 Peter D. Lax 线代并且恰好有某处不太明白, 可以参考着本系列说不定这里就有答案. 本系列文章在写作时参考了互联网上零零散散非常多的资料在此表示感谢!

代数基本定理. 这里整理下代数基本定理的证明, 所依赖知识仅限于陶哲轩 analysis i/ii.

证明: $P(z) = a_n z^n + \cdots + a_0, a_n \ne 0$. 令 $m = \inf_{z \in \mathbb{C}} |P(z)|$, 这里 $|P(z)| \ge 0$, 由陶 analysis i 定理 5.5.9 有下界必有下确界可知这里 m 是存在的 $m \ge 0$. 令 $R = 1 + \frac{m + |a_{n-1}| + \cdots + |a_0|}{|a_n|}$, 则 ${z\in \mathbb{C}\mid |z| \gt R}, 0 \lt (\frac{1}{|z|})^k \lt 1, k = 1, 2, \cdots,$. 所以 $|P(z)| \gt \frac{|P(z)|}{|z^{n-1}|} = \left \vert \frac{P(z)}{z^{n-1}} \right \vert$. 而 $\frac{P(z)}{z^{n-1}} = a_n z + a_{n-1} + a_{n-2} \frac{1}{z} + \cdots + a_1 \frac{1}{z^{n-2}} + a_0 \frac{1}{z^{n-1}}$. 根据 $|z_1 + z_2| \ge |z_1| - |z_2|$ 可得:

\[\begin{align} \left \vert \frac{P(z)}{z^{n-1}} \right \vert &\ge \|a_n \|\|z\| - \|a_{n-1}\| - \cdots - \|a_0\|\| \frac{1}{z^{n-1}}\| \\ &\gt \|a_n\|\|z\| - \|a_{n-1}\| - \cdots - \|a_0\| \\ &\gt m \quad \leftarrow \|z\| \gt R \end{align}\]

也即 $m = \inf_{|z| \le R} |P(z)|$. 这里 $P(z)$ 是连续函数, 易证 $|P(z)|$ 也是连续函数. 再由陶哲轩 analysis ii 习题 4.6.13, 命题 2.3.2 最大值原理可得 $\exists z_0, |P(z_0)| = m$. 反证假设 $m \gt 0$, 令 $P’(z) = \frac{1}{m} P(z) = a_n’ z^n + \cdots + a_0’$ 且 $|P’(z)|$ 在 $z = z_0$ 处达到了最小值 1. 再令 $Q(z) = P’(z + z_0) = b_n z^n + \cdots + b_0, b_n \ne 0$, 则可知 $|Q(z)|$ 在 $z = 0$ 处达到了最小值 1. 现在按次数从小到大写出 $Q(z) = 1 + b_k z^k + \cdots + b_n z^n, b_k \ne 0; b_i = 0, \forall i \lt k$. 由习题 15.7.6 可知 $a_k$ 可以写作 $a_k = -r e^{-i\theta}, r \gt 0$. 令 $f(\delta) = Q(\delta e^{i\theta / k}) = 1 + \delta^k(g(\delta) - r), \delta \gt 0$.手动展开一下可以计算 $g(\delta)$ 形如 $\delta(\cdots), \lim_{\delta \to 0} g(\delta) = 0$, 即存在 0 附近一个邻域使得该邻域内 $g(\delta) \lt r$, 此时 $f(\delta) \lt 1$, 即 $\exists z, Q(z) \lt 1$ 矛盾了!

P.S. $f \in o(g), x \to x_0$ 意味着 $\lim_{x \to x_0} \frac{f(x)}{g(x)} = 0$.

$p(t) = c \prod (t-a_j), p(A) = c \prod (A-a_jI)$, 这个 $a_j I$ 让我有点迷惑. 本质上还是我对多项式中未定元的理解不到位. p(t) 因式分解完整形式是 $p(t) = c \prod (t^1-a_j t^0)$, 这样使用 A 作为未定元 t 的取值便可得 $p(A) = c \prod (A^1-a_j A^0)$.

P.S. 这里基于代数基本定理证明了复数域上的矩阵一定具有本征向量. 那实数域呢, 考虑到实数域中代数基本定理不成立, 比如 $x^2+1 = 0$ 无实数解, 所以实数域矩阵没有这个结论.


例 1 展示了本征向量的现实意义, 现在有一个现实问题需要计算 $A^N h$, 通过本征向量 $A^N h = b_1 a_1^N h_1 + b_2 a_2^N h_2$ 可以进行计算加速.

例 2, 让我想起了我的一位前同事, 他给我分享了他写的 “用生成函数解斐波那契数列递归式”..

P.S. 我可能会混用特征值, 本征值. 特征向量, 本征向量..


定理 1, 这里重新整理下证明.

证明: 设这里 A 对应的不同的本征值分别是 $a_1, \cdots, a_m$, 对应的本征向量分别是 $h_1, \cdots, h_m$, 假设这些本征向量线性相关, 定义集合 $Q = {\sum_{j=1}^k c_{i_j} h_{i_j}=0 \mid c_{i_j} \ne 0 }$, 则 Q 不为空. 定义映射 $f: Q \to \mathbb{N}, f(q)$ 为 q 中包含本征向量的个数. 由陶 analysis 可知 $f(Q)$ 为良序集, 其一定存在最小值 l, 即存在 $\sum_{j=1}^l c_{i_j} h_{i_j}=0$.

\[\begin{align} & A(\sum_{j=1}^l c_{i_j} h_{i_j}) = 0 = \sum_{j=1}^l c_{i_j} A(h_{i_j}) = \sum_{j=1}^l c_{i_j} a_{i_j} h_{i_j} \\ &\sum_{j=1}^l c_{i_j} h_{i_j}=0 \to \sum_{j=1}^l c_{i_j} a_{i_l} h_{i_j}=0 \\ &\sum_{j=1}^l c_{i_j} a_{i_j} h_{i_j} - \sum_{j=1}^l c_{i_j} a_{i_l} h_{i_j} = 0 \\ &\sum_{j=1}^{l-1} (c_{i_j} a_{i_j} - c_{i_j} a_{i_l}) h_{i_j} = 0 \in Q \end{align}\]

这意味着 $l - 1 \in f(Q)$, 与最小值 l 矛盾了!

P.S. 每当这个时候, 我都特别庆幸我的数学学习之路第一本书是陶哲轩老师的 analysis i/ii. 不然我一定很迷惑为啥这里集合中的最小值一定存在.


定理 3, 这里略作补充.

  • $p_A(s) = s^n - (\mbox{tr} A) s^{n - 1} + \cdots + (-1)^n \det A$ 的推导. 这里 $\delta_{ij} = 1, i = j; 0, i \ne j$.
\[\begin{align} p_A(s) &= \det(sI - A) = \det \begin{pmatrix} s\delta_{11} - a_{11} & s\delta_{12} -a_{12} & \cdots & s\delta_{1n} -a_{1n} \\ s\delta_{21} -a_{21} & s\delta_{22} -a_{22} & \cdots & s\delta_{2n} -a_{2n} \\ \vdots & \vdots & \vdots & \vdots \\ s\delta_{n1}-a_{n1} & s\delta_{n2}-a_{n2} & \cdots & s\delta_{nn} - a_{nn} \end{pmatrix} \\ &= \sum \sigma(p) \prod_{j=1}^n(s \delta_{p_j j} - a_{p_j j}) \end{align}\]

观察置换 p, 若其是恒等置换, 则对应着 $\prod_{j=1}^n(s - a_{jj}) = s^n - (\mbox{tr} A) s^{n-1} + \cdots$. 若 p 不是恒等置换, 设 $p_{k_1} = k_2, k_1 \ne k_2, \forall k \lt k_1, p(k) = k$, 则容易看到 $p_{k_2} \ne k_2$, 这意味着对应的 $\prod_{j=1}^n(s \delta_{p_j j} - a_{p_j j})$ 至多包含 n - 2 个 $s - a_{kk}$ 项. 也即 $p_A(s)$ 展开式中 $s^n$ 的次数是 1, $s^{n-1}$ 的次数是 $-\mbox{tr} A$.

$p_A(0) = \det(-A) = (-1)^n \det A$, 即 $s^0$ 的系数是 $(-1)^n \det A$.

  • 这里应用了代数学基础提到的韦达定理.

P.S. 我一开始使用的是 $p_A(s) = \det(A - sI) = \prod_{i=1}^n (s - a_i)$ 得出了结论 $\det A = (-1)^n \prod_{i=1}^n a_i$. 我对韦达定理应用错了呗, 韦达定理指出了: $f(x) = a_n (x - x_1) \cdots (x - x_n)$, 在 $\det(A - sI)$ 中 $a_n$ 并不是 1, 即 $s^n$ 对应的系数并不是 1! 这也是为啥本征多项式是 $\det (sI - A)$, 确保了 $s^n$ 首项系数为 1.