线性代数(9): 矩阵微积分(2)

Posted by w@hidva.com on July 14, 2024

系列导言, 本文是作者在学习 Peter D. Lax 线性代数及其应用的读书笔记, 侧重于记录我当时没有看懂的部分, 以及对书中部分知识点的一些扩展. 非常零散, 不成系统. 对本系列的使用最好是读者也在学习 Peter D. Lax 线代并且恰好有某处不太明白, 可以参考着本系列说不定这里就有答案. 本系列文章在写作时参考了互联网上零零散散非常多的资料在此表示感谢!

接着上一篇文章, 这里我们继续补充下一些为了学习第 9 章所需要补充的一些知识.

定义 1, 设 $ V $ 是域 $ P $ 上的线性空间,如果对 $ V $ 中任意向量 $ \mathbf{x} $,都有一个非负实数 $ \lVert \mathbf{x} \rVert $ 与之对应,且满足:

  • 正定性:若 $\mathbf{x} = \mathbf{0} $ 时,$\lVert \mathbf{x} \rVert = 0$;若 $\mathbf{x} \neq \mathbf{0} $,则 $\lVert \mathbf{x} \rVert > 0 $,
  • 齐次性:$\lVert \lambda \mathbf{x} \rVert = \vert \lambda \vert \lVert\mathbf{x}\rVert, \lambda \in P$,
  • 三角不等式:$ \lVert\mathbf{x} + \mathbf{y} \rVert \leq \lVert\mathbf{x} \rVert + \lVert\mathbf{y} \rVert$,

就称 $\lVert \mathbf{x} \rVert $ 是向量 $ \mathbf{x} $ 的范数,并称定义了该范数的线性空间为赋范空间。

P.S. 欧几里得空间总是赋范空间, 但赋范空间不一定是欧几里得空间. $\lVert x \rVert = (x, x)$ 便是欧几里得空间合法的范数定义.

P.S. 这里 $\vert \lambda \vert $ 绝对值运算见 绝对值

定义 2, 设 $\lVert\cdot\rVert_a$ 和 $\lVert\cdot\rVert_b$ 是线性空间 $ V $ 中的两种范数,若存在正数 $ M, m $,使对任意 $ \mathbf{x} \in V $,

\[m \lVert\mathbf{x}\rVert_b \leq \lVert\mathbf{x}\rVert_a \leq M \lVert\mathbf{x}\rVert_b,\]

就称 $\lVert\cdot\rVert_a$ 与 $\lVert\cdot\rVert_b$ 等价。

P.S. 令 $c = \max(M, \frac{1}{m})$, 如上定义等同于 $\exists c, \lVert\mathbf{x}\rVert_b \le c \lVert\mathbf{x}\rVert_a, \lVert\mathbf{x}\rVert_a \le c \lVert\mathbf{x}\rVert_b$.

9.2.zy1, 范数的等价关系满足反身性、对称性、传递性。证明: 显然.

9.2.zy2, 有限维线性空间 V 中任意两种范数都等价

证明: 由对称性和传递性可知只须证明任意范数都与特定范数 $\lVert \cdot\lVert_a$ 等价即可。取定 $V$ 基 $\mathbf{e}_1, \mathbf{e}_2, \ldots, \mathbf{e}_n$,设 $\mathbf{x} = \xi_1 \mathbf{e}_1 + \xi_2 \mathbf{e}_2 + \cdots + \xi_n \mathbf{e}_n$ ,定义 $\lVert \mathbf{x}\lVert_a = \sqrt{\vert \xi_1 \vert^2 + \cdots + \vert \xi_n \vert^2}$, 易证 $\lVert \mathbf{x}\lVert_a$ 是个合法范数.

设 $\lVert \cdot\lVert $ 是 $V$ 中的范数,先证明 $\lVert \mathbf{x}\lVert $ 是 $(\xi_1, \ldots, \xi_n)^T$ 的连续函数。设 $\mathbf{y} = \zeta_1 \mathbf{e}_1 + \cdots + \zeta_n \mathbf{e}_n$,则

\[\begin{align} 0 &\leq \vert \lVert \mathbf{x}\lVert - \lVert \mathbf{y}\lVert \vert \leq \lVert \mathbf{x} - \mathbf{y}\lVert \\ & \leq \lVert \xi_1 \mathbf{e}_1 + \cdots + \xi_n \mathbf{e}_n - \zeta_1 \mathbf{e}_1 - \cdots - \zeta_n \mathbf{e}_n \lVert \\ & \leq \vert\xi_1 - \zeta_1\vert \lVert \mathbf{e}_1\lVert + \cdots + \vert\xi_n - \zeta_n\vert \lVert \mathbf{e}_n \lVert \\ & \to 0 ( \xi_k - \zeta_k, k=1\cdots n) \end{align}\]

已证 $\lVert \mathbf{x}\lVert $ 是 $(\xi_1, \ldots, \xi_n)^T$ 的连续函数. 注意到 $S = \left\{ (\xi_1, \ldots, \xi_n)^T \mid \lVert \mathbf{x}\lVert _a = 1 \right\}$ 是有界闭集,因此 $\lVert \mathbf{x}\lVert$ 在 $ S $ 上有最大值 $ M $ 和最小值 $ m $。 由于 $ S $ 中没有零向量,于是 $ m > 0 $,即有 $m \leq \lVert \mathbf{x}\lVert \leq M, \quad \mathbf{x} \in S$.

当 $\mathbf{x} = 0$ 时,$\lVert \mathbf{x}\lVert = \lVert \mathbf{x}\lVert _a = 0$. 当 $\mathbf{x} \neq 0$ 时,$\frac{\mathbf{x}}{\lVert \mathbf{x}\lVert _a} \in S$ 于是 $m \leq \left\lVert \frac{\mathbf{x}}{\lVert \mathbf{x}\lVert _a}\right\lVert \leq M$ 即 $m \lVert \mathbf{x}\lVert _a \leq \lVert \mathbf{x}\lVert \leq M \lVert \mathbf{x}\lVert _a$. 这就证明了任意范数 $\lVert \cdot\lVert $ 与特定范数 $\lVert \cdot\lVert _a$ 是等价的。

P.S. 如上证明在复数域/实数域上创建, 但其实对其他数域也成立.

定义 3, 矩阵范数. $C^{m \times n}$ 可以看作 mn 维线性空间, 如上结论定义对 $C^{m \times n}$ 也生效. 矩阵范数有新的要求, 相容性 $\lVert AB \rVert \le \lVert A \rVert \lVert B \rVert $.

P.S. 易证我们之前定义的 $\lVert A \rVert_F, \lVert A \rVert_2$ 都是合法的矩阵范数. 由 9.2.zy2 可知这俩范数是等价的, 这点我们在 9.1.zy7 中也证明过.

9.2.zy3, 矩阵收敛当且仅当分量收敛.

证明: 首先由范数等价性易知矩阵以任一范数收敛都意味着以其他范数也收敛. 而针对 Frobenius 范数, 我们已经在 Tao analysis 中证明过收敛当且仅当分量收敛, Tao 命题 12.1.18.

9.2.zy4, 收敛的矩阵(向量)序列的范数有界. (任一种范数).

证明: 同实数序列收敛必有界一样证明.

9.2.zy5, 矩阵收敛运算法则

\[\begin{align} \lim_{k \to \infty} (A_k + B_k) &= \lim_{k \to \infty} A_k + \lim_{k \to \infty} B_k \\ \lim_{k \to \infty} (\lambda_k A_k) &= \lim_{k \to \infty} \lambda_k \lim_{k \to \infty} A_k \\ \lim_{k \to \infty} (A_k B_k) &= \lim_{k \to \infty} A_k \lim_{k \to \infty} B_k \\ \lim_{k \to \infty} A_k^{-1} &= \left( \lim_{k \to \infty} A_k \right)^{-1} \end{align}\]

证明: (3) 设 $A_k \to A$, $B_k \to B$ ($k \to \infty$), 则 $\lVert A_k - A\lVert \to 0, \quad \lVert B_k - B\lVert \to 0 \quad (k \to \infty) $. 注意 $\lVert B_k\lVert $ 有界,所以:

\[\begin{align} \lVert A_k B_k - AB\lVert &= \lVert (A_k B_k - AB_k) + (AB_k - AB)\lVert \\ &\leq \lVert A_k - A\lVert \cdot \lVert B_k\lVert + \lVert A\lVert \cdot \lVert B_k - B\lVert \\ &\to 0 \quad (k \to \infty). \end{align}\]

(4) 设 $A_k \to A$ ($k \to \infty$), 则 $a_{ij}^{(k)} \to a_{ij}$ ($k \to \infty$)。注意到 $A_k^*, |A_k|$ 都是由 $a_{ij}^{(k)}$ 进行加、减、乘运算所得,于是由数列极限性质可得

\[\begin{align} &\lim_{k \to \infty} A_k^* = A^*, \quad \lim_{k \to \infty} \|A_k\| = \|A\| \\ &\lim_{k \to \infty} A_k^{-1} = \lim_{k \to \infty} \frac{A_k^*}{\|A_k\|} = \left( \lim_{k \to \infty} A_k \right)^{-1} \end{align}\]

P.S. 这里 $A_k^*$ 是我们在 6.2.zy1 中介绍的 adj(A) 矩阵, 不是伴随矩阵的标记…

P.S. 其实很像我们在 Tao 定理 15.6.14 复数的极限定律中的证明.

9.2.zy7, $A^k \to O (k\to \infty)$ 当且仅当 A 所有特征值的模都小于 1.

证明: 设 $A = Q J Q^{-1}$, J 为 A 的 Jordan 标准形, 易证 $A^k \to O (k\to \infty)$ 当且仅当 $J^k \to O (k\to \infty)$, 根据 6.6.zy1 我们可得特征值 $\lambda_0$ 对应的 Jordan 块 k 次方 $J_0^k$:

\[J_0^k = \begin{pmatrix} \lambda_0^k & k\lambda_0^{k-1} & \cdots & \binom{k}{r-1} \lambda_0^{k-r+1} \\ & \lambda_0^k & \ddots & \vdots \\ & & \ddots & k\lambda_0^{k-1} \\ & & & \lambda_0^k \end{pmatrix}_{r\times r}\]

即 $\lim_{k\to \infty} J^k = O \iff \vert \lambda \vert \lt 1, \forall \lambda$, 这里 $\lambda$ 为 A 特征值.

P.S. 考虑到谱半径的定义, 这里意味着 A 的谱半径小于 1.

9.2.zy8, $\lVert A \rVert \lt 1 \to A^k \to O (k\to \infty)$

证明: $A^k \to O (k\to \infty)$ 即 $\lim_{k \to \infty} \lVert A^k - O \rVert = 0$, 由 $\lVert A^k \rVert \le \lVert A \rVert^k$ 易得结论.

P.S. 反过来若 $A^k \to O$ 则无法证明 $\lVert A \rVert \lt 1$.