线性代数(5): 行列式与迹

Posted by w@hidva.com on July 14, 2024

系列导言, 本文是作者在学习 Peter D. Lax 线性代数及其应用的读书笔记, 侧重于记录我当时没有看懂的部分, 以及对书中部分知识点的一些扩展. 非常零散, 不成系统. 对本系列的使用最好是读者也在学习 Peter D. Lax 线代并且恰好有某处不太明白, 可以参考着本系列说不定这里就有答案. 本系列文章在写作时参考了互联网上零零散散非常多的资料在此表示感谢!

行列式, 关于行列式的引入, 我想换一种与原文不一样的方式. 先从性质(公理) (i),(ii),(iii) 开始推导出行列式, 这期间我们证明了遵循 (i),(ii),(iii) 的函数只能有 1 个定义, 就是我们推导出的行列式. 之后再从几何角度我们定义 $D(a_1, \cdots, a_n) = n! \sum (S)$, 并从几何角度证明了 D 遵循性质 (i),(ii),(iii), 考虑到遵循 (i),(ii),(iii) 的函数只能有 1 个定义, 我们论证了这里的 D 恰好就是我们刚推导出的行列式, 这也给我们推导出的行列式带来一点实际意义. 这样即使没有任何几何背景也不影响对行列式的理解.


置换相关知识参考 代数学基础: 置换群.

行列式函数 $D: R^n \times \cdots \times R^n \to R$, 并且其满足原文性质 (i),(ii),(iii). 利用这三条性质推导出 $D(a_1, \cdots, a_n) = \sum_f a_{f(1)1} a_{f(2)2} \cdots a_{f(n)n} D(e_{f(1)}, \cdots, e_{f(n)})$. 这里 f 取值范围是所有 $1, \cdots, n \to 1, \cdots, n$ 的映射, f 并不一定是双射. 手动推导几步可以看到有一个 f 是 $f(x) = 1, \forall x = 1, 2, \cdots, n$. 这个推导过程也证明了满足性质 (i),(ii),(iii) 的函数只能有这 1 个定义, 这个定义就是行列式.

定理 2, 这里对 $\det B = 0$ 情况略作补充. 这里用到了一些分析知识, 可以参考陶哲轩 analysis. 定义 B(t) = B + tI, 话说我们好像还没有定义过矩阵的数乘? 则易证 D(B(t)) 是个关于 t 的多项式, 由多项式知识可知 D(B(t)) 最多有 n 个解, 即存在 0 附近的一个邻域 $\forall t’ \ne 0, \vert t’ - 0 \vert \lt \epsilon, D(B(t’)) \ne 0$ 且有 D(B(t)) 连续知 $\lim_{t’ \to 0} D(B(t’)) = D(B(0)) = 0$.

易证 $D(B(t)A)$ 也是一个关于 t 的多项式函数, 即其关于 t 是连续的, 且 $D(BA) = D(B(0)A) = \lim_{t \to 0, t \ne 0} D(B(t)A) = D(A) \lim_{t \to 0, t \ne 0} D(B(t)) = 0$.

引理 4, 重新整理下. 首先根据性质 i, ii 可知:

\[\det \begin{pmatrix} 1 & x & \cdots & x \\ 0 & & & \\ \vdots & & A_{11} & \\ 0 & & & \\ \end{pmatrix} = \det \begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & & & \\ \vdots & & A_{11} & \\ 0 & & & \\ \end{pmatrix}\]

所以接下来只需证 $\det A = \det \begin{pmatrix} 1 & 0 \ 0 & A_{11}\end{pmatrix} = C(a_1, \cdots, a_{n-1})$ 即可, 这里 $a_i$ 为 $A_{11}$ 列向量. 易证 $C(a_1, \cdots, a_{n-1})$ 满足性质 i,ii,iii 由定理 1 可知 $C(a_1, \cdots, a_{n-1}) = D(a_1, \cdots, a_{n-1})=D(A_{11})$. 即 $\det A = \det A_{11}$.

练习 8, $\det A = \det A^T$. 这里先把练习 8 提上来, 后面一些推论会依赖这里结论.

由置换群 7.15.zy1 可知 $\sigma(p) = \sigma(p^{-1})$, 令 $b_{ij}$ 表示 $A^T$ 第 i 行第 j 列的元素 $b_{ij} = a_{ji}$.

\[\begin{align} \det A^T &= \sum_{\sigma} \sigma(p) b_{p_1 1} \cdots b_{p_n n} \\ &= \sum_{\sigma} \sigma(p) a_{1 p_1} \cdots a_{n p_n} \\ &= \sum_{\sigma} \sigma(p^{-1}) a_{(p^{-1} \circ p)_1 p_1} \cdots a_{(p^{-1} \circ p)_n p_n} \\ &= \sum_{\sigma} \sigma(p^{-1}) a_{p^{-1}(p_1) p_1} \cdots a_{p^{-1}(p_n) p_n} \\ &= \sum_{\sigma} \sigma(p^{-1}) a_{p^{-1}(1) 1} \cdots a_{p^{-1}(n) n} \\ &= \det A. \end{align}\]

这里 $a_{p^{-1}(p_1) p_1} \cdots a_{p^{-1}(p_n) p_n} = a_{p^{-1}(1) 1} \cdots a_{p^{-1}(n) n}$ 是因为 $p: 1, \cdots, n \leftrightarrow 1, \cdots, n$. 等号右边相当于对左边进行了一次重排序.

推论 5 证明: 将矩阵 A 第 i 行通过对换操作移动到第 1 行生成的新矩阵 A’, 则 $(A’)^T$ 等同于将 $A^T$ 第 i 列通过对换操作移动到第 1 列, 此时 $\det (A’)^T = (-1)^i \det A^T, \det A’ = (-1)^i \det A$.

将推论 5 中的矩阵 A 第 j 列通过对换操作移动到第 1 列, 第 i 行通过对换操作移动到第 1 行得到的新矩阵 $A’$, 此时 $\det A = (-1)^{i+j} \det A’$, 这里 $A’$ 即形如引理 4 中的矩阵 A, 此时 $\det A’ = \det A_{ij}$.

P.S. 行列式的多线性性质不要用错了. 我曾经推导出 $\det(a_1 + c_1, a_2 + c_2) = \det(c_1, c_2) + \det(a_1, a_2)$ 得出了矩阵和的行列式等于行列式的和这种离谱结论.


定理 7, 这里整理下原文的证明思路, A 可逆意味着 Ax = u 有唯一解 x, 我们按照公式 (29) 求解出 x. 之后使用公式 (30) 验证了 $A^{-1} u$ 确实是我们根据公式 (29) 求解出的 x. 这意味着公式 30 是正确的.

我的证明思路, 设 $A^{-1} = (b_1, \cdots, b_n), A b_k = e_k$, 然后按照公式 29 克拉默 Cramer 法则求出 $b_k$.


练习 9, 这里把我害惨了..现在正好是夜里, 我本来想一鼓作气把第 5 章扫完得了, 被这题卡了一下. $p \circ q$ 对应的置换矩阵应该是 $QP$! 而不是 $PQ$. 我这里使用了 $p(1,2,3) = (3,2,1); q(1,2,3) = (2,3,1); pq(1,2,3)=(2,1,3)$ 验证了一下:

\[P = \begin{pmatrix} 0 & 0 & 1 \\ 0 & 1 & 0 \\ 1 & 0 & 0 \\ \end{pmatrix} \quad Q = \begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 1 & 0 & 0 \\ \end{pmatrix} \quad QP =\begin{pmatrix} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \\ \end{pmatrix}\] \[Px = \begin{pmatrix} 0 & 0 & 1 \\ 0 & 1 & 0 \\ 1 & 0 & 0 \\ \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} = \begin{pmatrix} x_3 \\ x_2 \\ x_1 \end{pmatrix}\]

结合 维基 可以看到确实如此. 但看了下英文版维基, 确实有原文这种写法, 是什么 column-based permutation matrices 以及 row-based matrices? 暂且不管了. 这里令:

\[\begin{align} e_r(i) &= (0, \cdots, 0, \underbrace{1}_{\text{i th}}, 0, \cdots, 0) \quad e_c(i) = \begin{pmatrix} 0 \\ \vdots \\ 0 \\ 1 \mbox{ i th} \\ 0 \\ \vdots \\ 0 \end{pmatrix} \\ Q &= \begin{pmatrix} e_r(q(1)) \\ e_r(q(2)) \\ \vdots \\ e_r(q(n)) \\ \end{pmatrix} \quad P = \begin{pmatrix} e_c(p^{-1}(1)) & e_c(p^{-1}(2)) & \cdots & e_c(p^{-1}(n)) \end{pmatrix} \end{align}\]

此时 $(QP)_{ij} = e_r(q(i)) e_c(p^{-1}(j))$, 记 $k_1 = q(i), k_2 = p^{-1}(j), p(k_2) = j$, 此时 $(QP)_{ij} = c_{k_1} r_{k_1} + c_{k_2} r_{k_1} = 1 \quad \text{if} \quad q(i) = p^{-1}(j); 0 \quad \text{otherwise}$. 考虑 $(pq)$ 对应置换矩阵第 i 行第 j 列为 1 当且仅当 $p(q(i)) = j, q(i) = p^{-1}(j)$. 即 $(QP)_{ij} = (pq)_{ij}$.

这里额外补充一点: $q^{-1}$ 的置换矩阵是 $Q^T$. 由上可得:

\[Q^T = \begin{pmatrix} e_c(q(1)) & e_c(q(2)) & \cdots & e_c(q(n)) \end{pmatrix}\]

参考 P 写出 $q^{-1}$ 的置换矩阵:

\[q^{-1} = \begin{pmatrix} e_c(q(1)) & e_c(q(2)) & \cdots & e_c(q(n)) \end{pmatrix} = Q^T\]

所以有 $Q Q^T = I = Q^T Q$. Q 还是个正交矩阵咧.


$n \times n$矩阵形成的集合, 易证其是个线性空间 M; 也是个环. 迹属于 $M’$, 即 M 对偶空间中的元素. 但行列式不是, $\det (A+B) \ne \det A + \det B$.

相似矩阵; 由第 3 章 Page25 讨论可知, 相似变换对应的矩阵表示是相似的. 由 Page33 讨论可知, 同一个变换在不同基下对应的矩阵表示是相似的.