系列导言, 本文是作者在学习 Peter D. Lax 线性代数及其应用的读书笔记, 侧重于记录我当时没有看懂的部分, 以及对书中部分知识点的一些扩展. 非常零散, 不成系统. 对本系列的使用最好是读者也在学习 Peter D. Lax 线代并且恰好有某处不太明白, 可以参考着本系列说不定这里就有答案. 本系列文章在写作时参考了互联网上零零散散非常多的资料在此表示感谢!
自伴随映射 A 满足 $A^* = A$. 如同 7.3.zy1 我们引入在标准正交基下映射 A 的矩阵表示. 我简单搜了下, 好像自伴随映射在非标准正交基下也是个对称矩阵.
二次型, 这里原文以一个现实物理问题引入了二次型, 之后紧接着引入了定理 1. 我这里重新组织下, 去掉了物理背景. 实二次型是形如 $q(y) = \sum_{i=1}^n \sum_{j=1}^n h_{ij} y_i y_j$, 这里 $q: \mathbb{R}^n \to \mathbb{R}, y = (y_1, \cdots, y_n), h_{ij} = h_{ji}$ 映射. 以 $h_{ij}$ 定义矩阵 H 易证 H 是个对称矩阵, 借助内积可将 q 表示为 $q(y) = (y, Hy)$.
定理 1(a) 讲的是我们可以找到一个可逆矩阵 $L, h(y) = Ly, p(z) = \sum_{i=1}^n d_i z_i^2$ 使得 $q(y) = p(h(y))$. 定理 1 证明过程也是构造 L 以及 $d_i$ 的过程. 证明:
若 H 对角线元素不全为 0, 不失一般性, 设 $h_{11}$ 不为 0, 定义 $q_1(y) = h_{11} y_1 y_1 + \sum_{j=2}^n h_{1j} y_1 y_j + \sum_{i=2}^n h_{i1} y_i y_1$ 其为 $q(y)$ 中所有包含 $y_1$ 的项, 记 $q(y) = q_1(y) + Q_1(y)$. 令 $z_1 = y_1 + h_{11}^{-1} \sum_{j=2}^n h_{1j} y_j$, 则容易计算 $q_1(y) = h_{11} z_1^2 - h_{11}^{-1} (\sum_{j=2}^n h_{1j} y_j)^2$. 记 $q_2(y) = Q_1(y) - h_{11}^{-1} (\sum_{j=2}^n h_{1j} y_j)^2$ 此时 $q(y) = h_{11} z_1^2 + q_2(y)$, 这里 $q_2(y)$ 只包含 $y_2, \cdots, y_n$.
若 H 对角线元素全为 0, 但其他元素不为 0, 不失一般性设 $h_{12} = h_{21} \ne 0$, 此时令 $x_1 = y_1 + y_2, x_2 = y_1 - y_2$ 并使用这俩新变量替换 $y_1, y_2$, 此时 q 在新矩阵表示下对角线元素不全为 0. 这里以 $q(y) = h_{12} y_1 y_2 + h_{21} y_2 y_1$ 为例展示下替换为 $q(y) = \frac{h_{12}}{2} x_1^2 - \frac{h_{12}}{2} x_2^2, \frac{h_{12}}{2}$ 作为新的对角线元素不为 0. 若所有元素都为 0, 此时 q(y) 恒为 0. 不需要处理.
由公式 (13) $q(y) = h_{11} z_1^2 + q_2(y)$, 此时 q(y) 包含 n 个变量, $q_2(y)$ 包含 n - 1 个变量, 对 n 进行归纳. 若对于 $q_2(y)$, 存在定理 1(a) 提到的可逆矩阵 $L_2$, 对于 $q(y)$ 情况令 L 如下:
\[L = \begin{pmatrix} 1 & h_{11}^{-1} h_{12} & h_{11}^{-1} h_{13} & \cdots & h_{11}^{-1} h_{1n} \\ 0 & & & & \\ \vdots & & L_2 & & \\ 0 & & & & \end{pmatrix}\]此时 $\det L = \det L_2$, L 可逆, 且其便是定理 1 要求的可逆矩阵.
P.S. 原文在定理 1 证明中有一些让人理解偏差的 typo 痛苦=.
P.S. $p(z) = \sum_{i=1}^n d_i z_i^2$ 可以视为 $p(z) = (z, Dz)$, 其中 D 为对角线为 $d_i$ 的对角矩阵. 这个过程也证明了定理 3.
定理 1(b) 证明是通过 p 的特性而不是原来的 q 特性, 毕竟 p 是比 q 简单的. p, q 之间只差着一个可逆矩阵 L, 意味着 p 在维度为 m 的子空间上正定当且仅当 q 也在一个维度为 m 的子空间上正定.
练习 3 的证明与定理 1(b) 证明基本一样, 我们对 $d_i$ 重新排序, 使得先是所有大于 0 的值紧接着为 0 的值. 此时继续用定理 1(b) 证明即可.
8.1.zy1, 若 H 是复数域上自伴随映射, $a + bi$ 为其特征值, 则 $B = H - aI$ 也是自伴随映射, 且 bi 是 B 特征值. 证明很直观.
8.1.zy2, 若 H 是复数域上自伴随映射, 则 H 只有实数特征值.
证明: 设 H 有一特征值为 a + bi, 此时存在非零向量 h, H h = (a + bi)h; 此时 $(H h, h) = (a + bi)(h, h) = a(h, h) + b(h, h) i$, 考虑到 $(Hx, y) = (x, Hy) = \overline{(x, Hy)}$, 这意味着 $(Hh, h)$ 为实数, 即 $b(h, h) = 0$, b = 0.
8.1.zy3, 若 H 是复数域上自伴随映射, 则 H 只有真正的本征向量.
证明: 首先我们证, 若 a = 0 是 H 的特征值, 则 a 对应的只有真正的本征向量. 之后对于不为 0 的特征值 b, 令 $H’ = H - bI$, 则 a = 0 为 $H’$ 的特征值, 此时由 $H’$ 在 a = 0 处只有真正的本征向量可以推出 H 在 b 处也只有真正的本征向量. 具体证明见原文.
定理 4’ 证明略作补充:
- H 是实数域上的自伴随矩阵, 为什么可以用 8.1.zy2?
解: 考虑到实数是复数的子集, 这里可以将 H 视为复数域的矩阵, 根据复数域上自伴随矩阵定义, 这里 H 也是复数域上的自伴随矩阵, 所以可以用 8.1.zy2. 由之前的代数学基本定理可知, 这里 H 存在 n 个特征值, 且 8.1.zy2 可知这 n 个特征值都是实数.
设 a 是 H 特征值, 其特征向量 Hf = af, 这里 $f \in \mathbb{C}^n, f = (x_1 + y_1 i, \cdots, x_n + y_n i)$, 则由 Hf = af 易证 $(x_1, \cdots, x_n), (y_1, \cdots, y_n)$ 也是 a 的特征向量. 这也是原文所说我们总能找到实特征向量.
-
$z_j$ 是实数. 我们仅在如上证明中将 H 临时视为复数域上的矩阵, 在此之后 H 仍然是实数域上的矩阵, $\forall y \in \mathbb{R}^n, y = \sum_{j=1}^n z_j f_j$, 这里 $z_j$ 是实数域中的标量, 其自然是实数.
-
$M^* H M$ 是对角矩阵
证明: 由原文可知 $\forall z, (z, M^* H M z) = (z, Dz)$, 这里 D 为对角线为 $a_i$ 的对角矩阵, 由等式可知 $M^* H M = D$.
我之前好奇这里 $a_i$ 在 D 对角上顺序的问题, 其实从证明过程可以看到, M 是根据 D 中特征值的顺序来确定的. 简单来说假设我们 n 个不同的特征值 $a_1, a_2, \cdots, a_n$, 每个特征值对应着一个特征向量 $f_1, f_2, \cdots, f_n$, 此时 $z = z_1 f_1 + \cdots + z_n f_n$, 此时 M 负责将 z 映射到 $z_1, \cdots, z_n$. 如果调换 $a_2, a_1, \cdots, a_n$, 此时 $z = z_2 f_2 + z_1 f_1 + \cdots + z_n f_n$, 此时会生成新的 $M’$ 将 z 映射到 $z_2,z_1, \cdots, z_n$.
练习 4 M 列向量是 H 的本征向量. 证明: 已知 $H M = MD$, 这里 $M = (c_1, \cdots, c_n)$ 由如下等式易得结论.
\[\begin{align} HM &= (H c_1, \cdots, H c_n) \\ MD &= (c_1 a_1, \cdots c_n a_n) \end{align}\]