这一篇文章介绍陶哲轩 analysis ii, 6.1 线性变换; 6.2 多元微积分中的导数; 6.3 偏导数与方向导数读书笔记.
例 17.1.12, $(L_Ax)^T = A(x^T)$ 的解释, 这里 $L_A: R^n \to R^m$ 是线性变化, $L_Ax$ 即 $L_A(x), x \in R^n$. 本章内容习惯将线性变换函数调用使用矩阵乘法表示, 我初看时有点不习惯, 经常需要显式将矩阵乘法再转换为线性变换函数调用来理解==. 比如引理 17.1.16, 这里准确的写法是 $(L_A \circ L_B)(x) = L_{AB}(x)$.
习题 17.1.4, 习题 6.1.4; 对原文证明过程中补充
- 如下不等式的证明.
证明: 令:
\[\begin{align} x_1 &= (a_{11}x_1, a_{21}x_1, \cdots, a_{n1}x_1) \\ x_2 &= (a_{12}x_2, a_{22}x_2, \cdots, a_{n2}x_2) \\ x_n &= (a_{1n}x_n, a_{2n}x_n, \cdots, a_{nn}x_n) \end{align}\]则不等式左端等同于 $\lVert x_1 + x_2 + \cdots + x_n \rVert$, 不等式右端为 $\lVert x_1 \rVert + \lVert x_2 \rVert + \cdots \lVert x_n \rVert$. 利用三角不等式得证.
- 如下不等式的证明.
证明: 想想 Cauchy-Schwarz 不等式的如下形式,
\[|\sum_{j=1}^nA_jB_j| \le \sqrt{\sum_{j=1}^n A_j^2}\sqrt{\sum_{j=1}^n B_j^2}\]是否有点眼熟? 再令:
\[\begin{align} A &= (|x_1|, \cdots, |x_n|) \\ B &= ((\sum_{i=1}^m a_{i1}^2)^{\frac{1}{2}}, (\sum_{i=1}^m a_{i2}^2)^{\frac{1}{2}}, \cdots, (\sum_{i=1}^m a_{in}^2)^{\frac{1}{2}}) \end{align}\]- 从原文证明过程可以看出, T 不光连续, 也是一致连续的.
引理 17.2.4, 额外补充:
- $x_0 \in E$ 是 E 的内点, 这一条件非常重要!
已知 $\lim_{x\to x_0} F(x) = 0, F(x) = \frac{\lVert f(x) - f(x_0) - L(x-x_0) \rVert}{\lVert x - x_0 \rVert}$, 结合 $x_0 \in E$ 是 E 的内点, 即 $\forall \epsilon_1, \exists \delta_1, \forall x \in B(x_0, \delta_1), F(x) \lt \epsilon_1$. 现论证 $\lim_{t \to 0} g(t) = 0, g(t) = \frac{\lVert f(x_0 + tv) - f(x_0) - L(tv) \rVert}{\lVert tv \rVert}$, 此时 $\forall \epsilon$, 令 $\epsilon_1 = \epsilon$, 则对于 g(t) 意味着 $\exists \delta, 0 < |t| < \delta$ 有 $x_0 + tv \in B(x_0, \delta_1)$, 则此时 $g(t) = F(x) \lt \epsilon_1$.
若 $x_0 \in E$ 不是 E 的内点, 则可能 $\exists v, \forall t, x_0 + tv \notin E$.
- $\frac{\lVert L_1(tv) - L_2(tv) \rVert}{\lVert tv \rVert} \le \frac{\lVert f(x_0 + tv) - f(x_0) - L_1(tv) \rVert}{\lVert tv \rVert} + \frac{\lVert f(x_0 + tv) - f(x_0) - L_2(tv) \rVert} {\lVert tv \rVert}$ 的证明.
证明: 令 $A = f(x_0 + tv) - f(x_0) - L_1(tv), B=f(x_0 + tv) - f(x_0) - L_2(tv)$, 则 $L_1(tv) - L_2(tv) = B - A$, 结合 $\lVert B - A \rVert = \lVert B + (-A) \rVert \le \lVert B \rVert + \lVert A \rVert$ 可证.
定义 17.3.1, 这里 $\frac{f(x_0 + tv) - f(x_0)}{t}$ 是 $R \to R^n$ 的函数, 其极限定义见定义 14.1.1. 结合命题 12.1.18(d) 点列收敛等同于各个分量收敛, 便可以将问题转向我们已经熟悉的 $R \to R$ 收敛问题.
定义 17.3.7, 若干补充:
- $\lim_{t \to 0}\frac{f(x_0 + te_j) - f(x_0)}{t} = \frac{d}{dt}f(x_0 + te_j)(0)$ 的推导
首先看引理 17.2.1.zy2 了解 $\frac{d}{dt}g(t), g(t) = f(x_0 + te_j), R \to R^n$ 的定义. 则:
\[\frac{dg(t)}{dt}(0) = \lim_{t \to 0}\frac{g(t) - g(0)}{t} = \lim_{t \to 0}\frac{f(x_0 + te_j) - f(x_0)}{t}\]-
从这个定义也能看出 $\frac{\partial f}{\partial x_j}(x_0) = D_{e_j}f(x_0)$.
-
偏导数存在等同于各分量偏导数存在.
L1 来源是点列收敛等同于各个分量收敛
17.2.2.zy3, $\lVert A-B \rVert \ge \lVert A \rVert - \lVert B \rVert$
证明: 已知 $\lVert A - B + B \rVert \le \lVert A - B \rVert + \lVert B \rVert$ 得证明.
17.2.2.zy2, 若 f 在 $x_0$ 点可微, 则 f 在 $x_0$ 点连续.
证明: 已知 $\forall \epsilon_1, \exists \delta_1, \lVert x - x_0 \rVert \le \delta_1$ 时有 $\lVert f(x) - f(x_0) - L(x - x_0)\rVert \le \epsilon_1 \lVert x - x_0 \rVert$, 即 $\lVert f(x) - f(x_0)\rVert \le (\epsilon_1 + L) \lVert x - x_0 \rVert$. 令 $\epsilon_1 = 1$, 此时 $\exists \delta, \lVert x - x_0 \rVert \le \delta, \lVert f(x) - f(x_0)\rVert \le (1 + L) \lVert x - x_0 \rVert$, 这很自然可以推出在 $x_0$ 点连续.
17.2.2.zy4, 已知 $f: R^n \to R$ 在 [x, x+h] 连续, 在 (x, x+h) 可微, 则 $\exists \epsilon \in (x, x+h), f’(\epsilon)\lVert h \rVert = f(x+h) - f(x)$. 这里
\[\begin{align} & x = (x_1, \cdots, x_n), \\ & h = (h_1, \cdots, h_n); \\ & [x, x+h] = \{(t_1, \cdots, t_n), t_i \in [x_i, x_i + h_i]\} \\ & (x, x+h) = \{(t_1, \cdots, t_n), t_i \in (x_i, x_i + h_i)\} \end{align}\]证明: 这里易证 [x, x+h] 是一个闭区间, 设想 $x^{(k)}, \lim_{k \to \infty}x^{(k)} = X$ 是该区间内收敛点列, 则根据点列收敛等同于各个分量收敛可知 $\lim_{k \to \infty}x_i^{(k)} = X_i$, 这里 $x_i^{(k)} \in [x_i, x_i + h_i]$, $[x_i, x_i + h_i]$ 是一个闭区间, 所以 $X_i \in [x_i, x_i + h_i]$, 所以有 $X \in [x, x+h]$.
令 $F(t) = f(x + th), R \to R$, 此时易证 F 是个在 [0, 1] 连续, $\forall t_0 \in [0, 1], x_0 = x + t_0h$, 此时已知 $\forall \epsilon_2, \exists \delta_2, \lVert x - x_0\rVert \lt \delta_2, \lVert f(x) - f(x_0)\rVert \lt \epsilon$; 欲证 $\forall \epsilon, \exists \delta, |t-t_0| \lt \delta, |F(t) - F(t_0) \lt \epsilon|$, 只需要令 $\epsilon_2 = \epsilon$, 令 $\delta$ 为 $\frac{1}{\lVert h \rVert}\delta_2$ 即可. 哦, 等等, 这里 F 可以看作 f 与 x+th 的复合函数呀, 利用复合函数连续性也能证明.
且 F(t) 在 (0, 1) 可微, 并且 $F’(t_0) = f’(x_0) \lVert h \rVert$. 根据引理 17.2.1, 此时我们只要证出:
\[\lim_{t \to t_0}\frac{|F(t) - F(t_0) - (f'(x_0) \lVert h \rVert)(t-t_0)|}{|t-t_0|} = 0\]此时我们已知 f 在 $x_0$ 处可微, 即:
\[\lim_{x \to x_0}\frac{\lVert f(x) - f(x_0) - f'(x_0)(x-x_0) \rVert}{\lVert x-x_0 \rVert} = 0\]这很容易完成证明的吧.
所以 $\exists \epsilon, F’(\epsilon) = F(1) - F(0)$, 所以可证
17.3.1.zy1, 接着定义 17.3.1, 我们有个猜想, 若 f 在 $x_0$ 点沿着方向 v 可微, 则令 $E={x, x = x_0+tv, t>=0}$, 令 $f_E$ 表示定义在 E 上的函数 f, 则此时 $f_E$ 在 $x_0$ 中连续.
证明: 欲证 $f_E$ 在 $x_0$ 上连续, 只需要证 \(\forall \epsilon_1 > 0, \exists \delta_1 > 0, \lVert x-x_0 \rVert \le \delta_1, x \in E, \lVert f(x) - f(x_0) \rVert \le \epsilon_1\) 此时已知 $\forall \epsilon_2 > 0, \exists \delta_2, |t| \lt \delta_2, \lVert \frac{f(x_0 + tv) - f(x_0)}{t} - D_v f(x_0) \rVert \le \epsilon_2$. 即 \(\lVert \frac{f(x_0 + tv) - f(x_0)}{t} \rVert - \lVert D_v f(x_0) \rVert \le \epsilon_2\)
\[\lVert f(x_0 + tv) - f(x_0) \rVert \le (\epsilon_2 + \lVert D_v f(x_0) \rVert)|t|\]令 $\epsilon_2$ 取固定值 1, 则对于 $\forall \epsilon_1$, 令 $\delta_1 = \frac{\epsilon_1}{1 + \lVert D_v f(x_0) \rVert} \lVert v \rVert$, 则此时可知 $|t| = \frac{\lVert x-x0 \rVert}{\lVert v \rVert} \le \frac{\epsilon_1}{1 + \lVert D_v f(x_0) \rVert}$, 从而 $\lVert f(x_0 + tv) - f(x_0) \rVert \le \epsilon_1$.
17.3.1.zy2, 接着 17.3.1.zy1, 自然有个猜想: 对于 $x_0$, 方向 v, 令 $E={x, x = x_0+tv, t>=0}$, 若 $\forall x \in E$, f 在 x 点沿着方向 v 可微, 则 f 在 E 上连续.
这个猜想我一开始证明如下: 对于 $\forall x_1 \in E$, 由 17.3.1.zy1 已知, f 在 ${x = x_1 + tv, t >= 0}$ 区域内连续, 接下来只要证明 f 也在 ${x = x_1 - tv, t >= 0}$ 上也连续即可. 这很简单, 已知对于 $\forall \delta_1, \exists x_3, \lVert x_1 - x_3 \rVert \le \delta_1$, f 在 ${x = x_3 + tv, t >= 0}$ 上连续, 即对于 $\forall \epsilon_1, \exists \delta_2, \forall x \in E_3 = {\lVert x - x_3 \rVert \le \delta_2}, \lVert f(x) - f(x_3) \rVert \le \epsilon_1$, 所以只要 $\delta_1 \le \delta_2$ 即可.
但其实这里证明是完全错误的, 因为对于 $\forall \delta_1$, 我们找到的 $\delta_2$ 可能总是 $\lt \delta_1$ 的! 即此时并不能确保 $x_1$ 总是位于 $E_3$ 中! 其实如果这个猜想是正确的, 就会得到如下离谱的结论: 若 f 在区间 [a, b] 上每一点都右连续, 则 f 在 [a, b] 上连续. 而这一结论明显是错误的.
定义 17.3.7, 偏导数与方向导数, 注意偏导数定义是:
\[\frac{\partial f(x)}{\partial x_j}(x_0) = \lim_{t \to 0, t \ne 0, x_0 + te_j \in E}\frac{f(x_0 + tej) - f(x_0)}{t}\]与方向导数要求 $t\gt0$ 不同, 这里要求 $t\gt0, t\lt0$ 时都要收敛.
17.3.7.zy1, 若 f 在 $x_0$ 处关于变量 $x_j$ 的偏导数存在, 则 $\exists t > 0, E={x, x = x_0+te_j, x = x_0 - te_j}$, 令 $f_E$ 表示定义在 E 上的函数 f, 则此时 $f_E$ 在 $x_0$ 中连续.
证明: 同 17.3.1.zy1.
17.3.7.zy2, 若 $f: R^n \to R$ 在 $E = {x, x = x_0 + tej, 0 \le t \le h}$, 简写为 $[x_0, x_0 + he_j]$ 上连续, $\frac{\partial f}{\partial x_j}$ 在 $(x_0, x_0 + he_j)$ 存在. 那么 $\exists \epsilon \in (0, h), \frac{\partial f}{\partial x_j}(x_0 + \epsilon e_j) h = f(x_0 + te_j) - f(x_0)$.
证明: 令 $F(t) = f(x_0 + tej), R \to R$, 则此时 F 在 [0, h] 上连续, 在 (0, h) 上可导, 且 $F’(t) = \frac{\partial f}{\partial x_j}(x_0 + te_j)$. 由平均值定理, 可知 $\exists \epsilon, F’(\epsilon) h = F(h) - F(0)$, QED.
证明 F 连续: 欲证 F 在 $\forall t_1 \in [0, h]$ 上连续, 即 $\forall \epsilon_1, \exists \delta_1, |t - t_1| \lt \delta_1, |F(t) - F(t_1)|\lt \epsilon_1$. 已知 f 在 $x_1 = x_0 + t_1 e_j$ 连续, 即 $\forall \epsilon_2, \exists \delta_2, \lVert x - x_1 \rVert \lt \delta_2, \lVert f(x) - f(x_1) \rVert \lt \epsilon_2$, 考虑到 $\lVert x - x_1 \rVert = |t - t_1|, \lVert f(x) - f(x_1) \rVert = |F(t) - F(t_1)|$ 易证得结论.
证明 F 可导. 欲证 F 在 $t_1$ 可导, 根据引理 17.2.1 即证:
\[\lim_{t \to t_1, t \ne t1}\frac{|F(t) - (F(t_1) + L(t - t_1))|}{|t - t_1|} = 0\]已知:
\[L = \frac{\partial f}{\partial x_j}(x_1) = \lim_{y \to 0, y \ne 0}\frac{f(x_1 + ye_j) - f(x_1)}{y}\]即 $\forall \epsilon_2, \exists \delta_2, |y| \lt \delta_2$, 有: \(\lVert \frac{f(x_1 + ye_j) - (f(x_1) + Ly)}{y} \rVert \lt \epsilon_2\)
令 $y = |t - t_1| \lt \delta_2$, 则:
\[\frac{|F(t) - (F(t_1) + L(t - t_1))|}{|t - t_1|} = \lVert \frac{f(x_1 + ye_j) - (f(x_1) + Ly)}{y} \rVert \lt \epsilon_2\]P.S. 这里其实 $f: R^n \to R^m$ 时也成立, 但此时 $F: R \to R^m$, 我们尚未定义过这种 F 的导数.
定理 17.3.8, 关于如下公式的进一步说明:
\[\lVert f(x_0 + v_1e_1 + v_2e_2) - f(x_0 + v_1e_1) - \frac{\partial f}{\partial x_2}(x_0) \rVert \le \frac{\epsilon \lVert x - x_0 \rVert}{n}\]考虑函数 $f_i$ 在 $[x_0 + v_1e_1, x_0 + v_1e_1 + v_2e_2]$ 区间连续, 且其关于 $x_2$ 偏导数存在, 符合 17.3.7.zy2 条件, 即 $\exists t_i, t_i \in [0, v_2]$:
\[\frac{\partial f_i}{\partial x_2}(x_0 + v_1e_1 + t_ie_2) = \frac{f_i( x_0 + v_1e_1 + v_2e_2) - f_i(x_0 + v_1e_1)}{v_2}\]这里 $\lVert x_0 + v_1e_1 + t_ie_2 - x_0 \rVert = \sqrt{v_1^2 + t_i^2} \le \sqrt{v_1^2 + v_2^2} \le \lVert x - x_0 \rVert \le \delta$, 所以有:
\[|\frac{\partial f_i}{\partial x_j}(x_0 + v_1e_1 + t_ie_2) - \frac{\partial f_i}{\partial x_j}(x_0)| \le \frac{\epsilon}{nm}\]即得
\[|f_i( x_0 + v_1e_1 + v_2e_2) - f_i(x_0 + v_1e_1) - v_2 \frac{\partial f_i}{\partial x_2}(x_0)| \le \frac{\epsilon |v_2|}{nm}\]汇总一下得证.
习题 17.3.3, 原文证明有点问题.
对于任意 v != (0, 0), 此时 $D_vf((0,0)) = \frac{v_1^3}{v_1^2 + v_2^2}$, 这里计算很简单代入定义计算即可, 原文这里计算的不对. 所以 $D_{e_1}(f(0,0)) = 1, D_{-e_1}f((0,0)) = -1$. 由习题 17.3.2 可知, 此时 $\frac{\partial f}{\partial x} (0,0) = 1$. 同理 $\frac{\partial f}{\partial y} (0,0) = 0$
假设 f 在 (0, 0) 可微, 则由公式 $D_vf(x_0) = \sum_{j} v_j\frac{\partial f}{\partial x_j}(x_0)$ 可知当 v = (1, 1) 时, $D_vf(0,0) = 1$. 与 $D_vf((0,0)) = \frac{v_1^3}{v_1^2 + v_2^2} = \frac{1}{2}$ 计算不符.