多元微积分: 再看反函数定理

Posted by w@hidva.com on May 14, 2024

如之前几篇文章所示, 在我完成陶哲轩 analysis-ii 第 6 章多元微积分学习之后, 我怀着愉悦的心情对第 6 章最后一个 remark 进行收尾

Sets which look like graphs of continuous functions at every point have a name, they are called manifolds.

映入眼帘地便是这一句话! 这让我有点懵, 因为在我们对隐函数定理证明的过程中, 我们只证明了 g 在 $(y_1,…,y_{n−1})$ 点是可微, 即在这一点是连续的; 并没有证明过 g 在整个 U 都是连续的! 但看着原文这句话以及其后举的例子, 分明是说 g 在 U 是连续的. 我最初以后这是一个笔误, 或者这里的 ‘continuous functions’ 仅是指 g 在一点是连续的. 但在网上简单搜了下, 发现其实这里 g 确实是连续的, 并且还是连续可微的. 即原文反函数定理中定义的 $f^{-1}$ 是具有更多特性的.

首先我们引入更强大的反函数定理. 已知开集 $E \subseteq R^n, f: E \to R^n$ 连续可微, $\exists x_0 \in E, f’(x_0)$ 可逆. 则:

  • $\exists U \subseteq E, x_0 \in U; \exists V \subseteq R^n, f(x_0) \in V$, U, V 是开集; f 是 U, V 之间的双射. 存在 $f^{-1}: V \to U$, 这块是原文中的定理可以推出来的结论.
  • $f^{-1}$ 在 V 上连续可微, 这一块是我们这篇文章新引入的结论. 接下来我们会完成对这个更强大反函数定理的证明.

17.7.2.zy240514.1, 矩阵函数的连续收敛. 令 $f(x): R^n \to M_{kl}$, 即 f 将 n 维向量映射到 k*l 矩阵. 这里我们将矩阵视为 k*l 维向量, 采用欧几里得度量来定义矩阵所处的度量空间. 则在此基础上我们可以定义 f 连续性/收敛性. 令

\[f(x) = \begin{pmatrix} f_{11}(x) & \cdots & f_{1n}(x)\\ \vdots & \ddots & \vdots \\ f_{n1}(x) & \cdots & f_{nn}(x) \end{pmatrix}\]

根据命题 13.1.5(b) 与命题 12.1.18(d) 易证 f(x) 在某点连续/收敛等同于所有 $f_{ij}(x)$ 连续/收敛.

这里引入行列式概念, 由线性代数相关知识可知行列式函数是 $f_{ij}(x)$ 的多项式表示. 即若 $f_{ij}(x)$ 连续, 由复合函数连续法则, 行列式函数 $det(M_{nn}) \to R$ 连续. 且行列式不为 0 等同于矩阵可逆.

逆矩阵函数 $inverse(M_{nn}) \to M_{nn}$ 为 $M_{nn}$ 到自身的映射, 其返回矩阵对应的逆矩阵. 由线性代数知识可知 inverse 是连续的.


17.7.2.zy240514.2, 已知 $f: R^n \to R^m$ 连续可微, 等同于 $f’$ 存在且连续. 这里 $f’$ 是个 $R^n \to M_{mn}$ 映射.

证明: 根据定理 17.3.8 导数矩阵介绍可以看到只要 f 在某点可微, 则 f’ 就可以写成全矩阵的形式:

\[f'(x) = \begin{pmatrix} \frac{\partial f_1}{\partial x_1}(x) & \cdots & \frac{\partial f_1}{\partial x_n}(x)\\ \vdots & \ddots & \vdots \\ \frac{\partial f_m}{\partial x_1}(x) & \cdots & \frac{\partial f_m}{\partial x_n}(x) \end{pmatrix}\]

结合 17.7.2.zy240514.1 中的结论, 很容易看到若 f 连续可微, 则 f’ 存在且连续. 同理若 f’ 存在且连续, 则已知 f 连续可微.


17.7.2.zy240514.3, 已知 $f: E \to R^n$ 连续可微, $\exists x_0 \in E, f’(x_0)$ 可逆; 则存在 $x_0$ 的一个邻域, 在该邻域内每一点, f 都可微且可逆.

证明: 令 $F(x) = det(f’(x)), E \to R$, 由于 f’, det 连续, 结合复合函数连续性法则可知 F(x) 是连续的, 且 $F(x_0)\ne 0$, 所以令 $\epsilon=\frac{ | F(x_0) | }{2}, \exists \delta, \forall x \in B(x_0, \delta), | F(x) - F(x_0) | \lt \epsilon$, 即 $\forall x \in B(x_0, \delta), F(x) \ne 0$.


17.7.2.zy240514.4, 接着定理 17.7.2, 证明 $f^{-1}$ 在 V 上是连续的.

证明: 这里我们也继续接着定理 17.7.2 证明, 已知 $\forall x_1, x_2, \lVert g(x_1) - g(x_2) \rVert \le \frac{1}{2}\lVert x_1 - x_2 \rVert$. 即 $\lVert f(x_1) - x_1 - (f(x_2) - x_2) \rVert \le \frac{1}{2}\lVert x_1 - x_2 \rVert$.

\[\lVert f(x_1) - f(x_2) \rVert - \lVert x_1 - x_2 \rVert \le \lVert f(x_1) - x_1 - (f(x_2) - x_2) \rVert\]

即 $\lVert f(x_1) - f(x_2) \rVert \le \frac{3}{2}\lVert x_1 - x_2 \rVert$, 所以 f 在这个小邻域内都是一致连续的呀.

从这些不等式可以得出另一个结论, 已知 $\lVert (x_1 - x_2) - (f(x_1) - f(x_2)) \rVert \le \frac{1}{2}\lVert x_1 - x_2 \rVert$, 即

\[\lVert (x_1 - x_2) \rVert - \lVert f(x_1) - f(x_2) \rVert \le \frac{1}{2}\lVert x_1 - x_2 \rVert\]

所以可得 $\lVert f(x_1) - f(x_2) \rVert \ge \frac{1}{2}\lVert x_1 - x_2 \rVert$, $\lVert x_1 - x_2 \rVert \le 2\lVert f(x_1) - f(x_2) \rVert$.

对于 $\forall y_0 \in V$, 证明 $f^{-1}$ 在 $y_0$ 处连续, 即证 $\forall \epsilon, \exists \delta, \lVert y - y_0 \rVert \lt \delta, \lVert f^{-1}(y) - f^{-1}(y_0) \rVert \lt \epsilon$. 令 $f(x) = y, f(x_0) = y_0$, 则待证项转换为 $\forall \epsilon, \exists \delta$, 当 $\lVert f(x) - f(x_0) \rVert \lt \delta$ 时, 有 $\lVert x - x_0 \rVert \lt \epsilon$. 结合我们上面已知的 $\lVert x_1 - x_2 \rVert \le 2\lVert f(x_1) - f(x_2) \rVert$ 非常容易找到 $\epsilon-\delta$.


17.7.2.zy240514.5, 接着定理 17.7.2, 证明 $f^{-1}$ 在 V 上是可微的.

证明: 由 17.7.2.zy240514.3 可知, $\exists r’, \forall x \in B(x_0, r’), det(f’(x)) \ne 0$. 之后我们将原文证明提到的 r 替换为 $min(r, r’)$. 继续接着原文证明可以找到 $f^{-1}: V \to U$, 此时 f 在 U 中任意点都可微且可逆, 利用我们在习题 17.7.3 所开的窍再次在 U 上任意点应用反函数定理可得 $f^{-1}$ 在 V 每一点都可微.


17.7.2.zy240514.6, 接着定理 17.7.2, 证明 $f^{-1}$ 在 V 上是连续可微的.

证明: 由 17.7.2.zy240514.5 可知 $f^{-1}$ 在 V 上每一点都可微, 且 $(f^{-1})’(y) = (f’(f^{-1}(y)))^{-1}$. 这里 $(f^{-1})’(y)$ 为 $R^n$ 到 $M_{nn}$ 的映射. 可以看到 $(f^{-1})’(y)$ 是如下三个函数的复合:

  • 逆矩阵函数 $inverse(M_{nn}) \to M_{nn}$, 由 17.7.2.zy240514.1 可知是连续的.

  • $f^{-1}(y), R^n \to R^n$, 由 17.7.2.zy240514.4 可知其是连续的.

  • f’(x), 由 17.7.2.zy240514.2 可知其是连续的.

根据复合函数连续性可知 $(f^{-1})’(y)$ 是连续的, 由 17.7.2.zy240514.2 可知 $f^{-1}$ 是连续可微的.


根据上面信息就很容易看出 g 连续性, 因为 g 算是 $F^{-1}$ 的一个分量, 而 $F^{-1}$ 根据反函数定理可知连续可微. g 自然也具有这些特性了.