系列导言, 本文是作者在学习 Peter D. Lax 线性代数及其应用的读书笔记, 侧重于记录我当时没有看懂的部分, 以及对书中部分知识点的一些扩展. 非常零散, 不成系统. 对本系列的使用最好是读者也在学习 Peter D. Lax 线代并且恰好有某处不太明白, 可以参考着本系列说不定这里就有答案. 本系列文章在写作时参考了互联网上零零散散非常多的资料在此表示感谢!
本章介绍了史济怀老师数学分析教程上册第 9 章多元微积分的学习笔记, 主要是之前应该学习过本书前 8 章, 最后一章第 9 章的学习也算是一次收尾了. 其次是 Lax 老师线代第 8 章公式 (45)’ 要求了解多元微积分的泰勒定理, Tao analysis ii 在介绍多元微积分时没有讲过这个. 学完这章之后才发现多元微积分对线代是有前置要求的, 尤其是 Lax 线代第 8 章自伴随矩阵这些.
方向导数. 这里与 Tao analysis ii 定义很不一样, Tao 的定义是 $\lim_{t \gt 0, t \to 0}$, 而史这里则是 $\lim_{t \to 0}$ 没有 $t \gt 0$ 的要求, 我个人觉得 Tao 老师比较合理, 毕竟负数乘以方向就改变了方向了呀. 不过这两个定义没有导出矛盾的结论. 所以凑合着用吧.
例 3, 由 Tao 方向导数定义可知此时 f 在 x = 0 处沿着任何方向导数都存在且为 1. 由 Tao 习题 17.3.2 $\frac{\partial f}{\partial x_j}(x_0)$ 存在当且仅当 $D_{e_j} f(x_0) = - D_{-e_j} f(x_0)$, 所以此时 f 在 x = 0 处偏导数均不存在. 即结论同史一样.
P.S. 感觉方向导数的定义只是偏导数的过渡, 最终我们关心的是偏导数. 虽然史与 Tao 在方向导数定义不一致, 但他俩在偏导数上定义是一致的.
9.3 习题 3, 我是利用 Tao 例 17.4.2 相关结论解决的. 以 $J(cf) = c J f$ 为例. 这里 $\nabla (cf_i) = f_i \nabla c + c \nabla f_i, \nabla c = 0$ 所以 $\nabla (cf_i) = c \nabla f_i$.
\[J(cf) = \begin{pmatrix} \nabla (cf_1) \\ \nabla (cf_2) \\ \vdots \\ \nabla (cf_n) \end{pmatrix} = c \begin{pmatrix} \nabla (f_1) \\ \nabla (f_2) \\ \vdots \\ \nabla (f_n) \end{pmatrix} = cJf\]定义 9.3.1 可微的定义, 以及微分. Tao 中没有怎么介绍过可微, 或许 Tao 老师默认可微, 可导一回事了吧. f 在 $x_0$ 处的微分 $df(x_0) = Jf(x_0) h$, 这里 h 是改变量, 其语义在定义 4.1.1 上已经介绍过了.
\[df(x_0) = \begin{pmatrix} \sum_{j=1}^n \frac{\partial f_1}{\partial x_j}(x_0) d x_j \\ \vdots \\ \sum_{j=1}^n \frac{\partial f_i}{\partial x_j}(x_0) d x_j \\ \vdots \\ \sum_{j=1}^n \frac{\partial f_n}{\partial x_j}(x_0) d x_j \end{pmatrix}\]P.S. 书上喜欢把 $df(x_0) = \sum_{j=1}^n \frac{\partial f}{\partial x_j}(x_0) d x_j$ 缩写为 $df = \sum_{j=1}^n \frac{\partial f}{\partial x_j} d x_j$. 还是要注意纯粹的 $\frac{\partial f}{\partial x_j} d x_j$ 是没有意义的, 还是要带上 $x_0$ 才有意义. 尤其是 (12) 公式推导, 原文省略了 $x_0$ 这些, 读者推导时要自己带上加深理解.
9.4 公式 (8)/(9). 关于 Jacobi 矩阵 Jg 我一直认为这玩意就是个套着矩阵形式的空壳子, 它不是矩阵.
\[\begin{align} Jg = \begin{pmatrix} \frac{\partial g_1}{\partial x_1} & \cdots & \frac{\partial g_1}{\partial x_n} \\ \vdots & \ddots & \vdots \\ \frac{\partial g_m}{\partial x_1} & \cdots & \frac{\partial g_m}{\partial x_n} \\ \end{pmatrix} & Jg(x_0) = \begin{pmatrix} \frac{\partial g_1}{\partial x_1}(x_0) & \cdots & \frac{\partial g_1}{\partial x_n}(x_0) \\ \vdots & \ddots & \vdots \\ \frac{\partial g_m}{\partial x_1}(x_0) & \cdots & \frac{\partial g_m}{\partial x_n}(x_0) \\ \end{pmatrix} \\ Jf = \begin{pmatrix} \frac{\partial f_1}{\partial x_1} & \cdots & \frac{\partial f_1}{\partial x_m} \\ \vdots & \ddots & \vdots \\ \frac{\partial f_l}{\partial x_1} & \cdots & \frac{\partial f_l}{\partial x_m} \\ \end{pmatrix} & Jf(g(x_0)) = \begin{pmatrix} \frac{\partial f_1}{\partial x_1}(g(x_0)) & \cdots & \frac{\partial f_1}{\partial x_m}(g(x_0)) \\ \vdots & \ddots & \vdots \\ \frac{\partial f_l}{\partial x_1}(g(x_0)) & \cdots & \frac{\partial f_l}{\partial x_m}(g(x_0)) \\ \end{pmatrix} \\ Jh = \begin{pmatrix} \frac{\partial h_1}{\partial x_1} & \cdots & \frac{\partial h_1}{\partial x_n} \\ \vdots & \ddots & \vdots \\ \frac{\partial h_l}{\partial x_1} & \cdots & \frac{\partial h_l}{\partial x_n} \\ \end{pmatrix} & Jh(x_0) = \begin{pmatrix} \frac{\partial h_1}{\partial x_1}(x_0) & \cdots & \frac{\partial h_1}{\partial x_n}(x_0) \\ \vdots & \ddots & \vdots \\ \frac{\partial h_l}{\partial x_1}(x_0) & \cdots & \frac{\partial h_l}{\partial x_n}(x_0) \\ \end{pmatrix} \end{align}\]毕竟 Jg 中每一个元素都是 $\mathbb{R}^n \to \mathbb{R}$ 的映射, 只有代入一个具体的值之后 $Jg(x_0)$ 才是一个正经的矩阵. 如果强行把 $Jg, Jf$ 认为是矩阵, 那么这俩矩阵乘积中元素 $\frac{\partial f_1}{\partial x_1} \cdot \frac{\partial g_1}{\partial x_1}$ 这种运算也没啥意义啊, 一个是 $\mathbb{R}^m \to \mathbb{R}$ 的映射, 一个是 $\mathbb{R}^n \to \mathbb{R}$ 的映射.
复合求导法则讲的是 $Jh(x_0) = Jf(g(x_0)) Jg(x_0)$.
P.S. 9.5 节我没看, 瞅着是几何的内容, 暂时没时间看.