閱讀翻譯Mathematics for Machine Learning之2.8 Affine Subspaces
關於:
- 首次發表日期:2024-07-24
- Mathematics for Machine Learning官方連結: https://mml-book.com
- ChatGPT和KIMI機翻,人工潤色
- 非數學專業,如有錯誤,請不吝指出
2.8 仿射空間
接下來,我們將更詳細地考察從原點偏移的空間,即不再是向量子空間的空間。此外,我們還將簡要討論這些仿射空間之間對映的性質,這些對映類似於線性對映。
備註。在機器學習文獻中,線性和仿射之間的區別有時並不明確,以至於我們可以發現將仿射空間/對映稱為線性空間/對映的參考文獻。
2.8.1 仿射空間
定義 2.25(仿射子空間)。設 \(V\) 為一個向量空間,\(\boldsymbol{x}_0 \in V\),\(U \subseteq V\) 為一個子空間。那麼子集
稱為 \(V\) 的仿射子空間或線性流形(linear manifold)。\(U\) 稱為方向或方向空間(direction space),\(\boldsymbol{x}_0\) 稱為支點(support point)。在第12章中,我們將這種子空間稱為超平面。
注意,如果 \(\boldsymbol{x}_0 \notin U\),則仿射子空間的定義排除了 \(\mathbf{0}\)。因此,對於 \(\boldsymbol{x}_0 \notin U\),仿射子空間不是 \(V\) 的(線性)子空間(向量子空間)。
仿射子空間的例子有 \(\mathbb{R}^3\) 中的點、線和平面,這些點、線和平面不(一定)透過原點。
備註。考慮向量空間 \(V\) 的兩個仿射子空間 \(L = \boldsymbol{x}_0 + U\) 和 \(\tilde{L} = \tilde{\boldsymbol{x}}_0 + \tilde{U}\)。當且僅當 \(U \subseteq \tilde{U}\) 且 \(x_0 - \tilde{x}_0 \in \tilde{U}\) 時,\(L \subseteq \tilde{L}\)。
仿射子空間通常由引數描述:考慮一個 \(V\) 的 \(k\) 維仿射空間 \(L = \boldsymbol{x}_0 + U\)。如果 \(\left(\boldsymbol{b}_1, \ldots, \boldsymbol{b}_k\right)\) 是 \(U\) 的一個有序基,那麼每個元素 \(\boldsymbol{x} \in L\) 都可以唯一地描述為
其中 \(\lambda_1, \ldots, \lambda_k \in \mathbb{R}\)。這種表示稱為具有方向向量 \(\boldsymbol{b}_1, \ldots, \boldsymbol{b}_k\) 和引數 \(\lambda_1, \ldots, \lambda_k\) 的 \(L\) 的引數方程。
**例 2.26(仿射子空間)**
- 一維仿射子空間稱為直線,可以寫作 \(\boldsymbol{y}=\boldsymbol{x}_0+\lambda \boldsymbol{b}_1\),其中 \(\lambda \in \mathbb{R}\),\(U=\operatorname{span}\left[\boldsymbol{b}_1\right] \subseteq \mathbb{R}^n\) 是 \(\mathbb{R}^n\) 的一維子空間。這意味著直線由一個支點 \(\boldsymbol{x}_0\) 和一個定義方向的向量 \(\boldsymbol{b}_1\) 定義。參見圖 2.13 瞭解示意圖。
- \(\mathbb{R}^n\) 的二維仿射子空間稱為平面。平面的引數方程為 \(\boldsymbol{y}=\boldsymbol{x}_0+\lambda_1 \boldsymbol{b}_1+\lambda_2 \boldsymbol{b}_2\),其中 \(\lambda_1, \lambda_2 \in \mathbb{R}\),\(U=\operatorname{span}\left[\boldsymbol{b}_1, \boldsymbol{b}_2\right] \subseteq \mathbb{R}^n\)。這意味著平面由一個支點 \(\boldsymbol{x}_0\) 和兩個線性獨立的向量 \(\boldsymbol{b}_1, \boldsymbol{b}_2\) 定義,這兩個向量張成方向空間(span the direction space)。
- 在 \(\mathbb{R}^n\) 中,\((n-1)\) 維仿射子空間被稱為超平面,相應的引數方程為 \(\boldsymbol{y}=\boldsymbol{x}_0+\sum_{i=1}^{n-1} \lambda_i \boldsymbol{b}_i\),其中 \(\boldsymbol{b}_1, \ldots, \boldsymbol{b}_{n-1}\) 構成 \(\mathbb{R}^n\) 的一個 \((n-1)\) 維子空間 \(U\) 的基。這意味著超平面由一個支點 \(\boldsymbol{x}_0\) 和 \((n-1)\) 個線性獨立的向量 \(\boldsymbol{b}_1, \ldots, \boldsymbol{b}_{n-1}\) 定義,這些向量張成方向空間。在 \(\mathbb{R}^2\) 中,直線也是超平面。在 \(\mathbb{R}^3\) 中,平面也是超平面。
備註(非齊次線性方程組和仿射子空間)。對於 \(\boldsymbol{A} \in \mathbb{R}^{m \times n}\) 和 \(\boldsymbol{x} \in \mathbb{R}^m\),線性方程組 \(\boldsymbol{A} \boldsymbol{\lambda}=\boldsymbol{x}\) 的解要麼是空集,要麼是 \(\mathbb{R}^n\) 中維度為 \(n-\operatorname{rk}(\boldsymbol{A})\) 的仿射子空間。特別地,當 \(\left(\lambda_1, \ldots, \lambda_n\right) \neq (0, \ldots, 0)\) 時,線性方程 \(\lambda_1 \boldsymbol{b}_1 + \ldots + \lambda_n \boldsymbol{b}_n = \boldsymbol{x}\) 的解是 \(\mathbb{R}^n\) 中的一個超平面。
在 \(\mathbb{R}^n\) 中,每個 \(k\) 維仿射子空間都是非齊次線性方程組 \(\boldsymbol{A x}=\boldsymbol{b}\) 的解,其中 \(\boldsymbol{A} \in \mathbb{R}^{m \times n}\),\(\boldsymbol{b} \in \mathbb{R}^m\) 並且 \(\operatorname{rk}(\boldsymbol{A})=n-k\)。回想一下,對於齊次方程組 \(\boldsymbol{A x}=\mathbf{0}\),解是一個向量子空間,我們也可以將其視為一個特殊的仿射空間,其支點為 \(\boldsymbol{x}_0=\mathbf{0}\)。
2.8.2 仿射對映
類似於我們在 2.7 節討論的向量空間之間的線性對映,我們可以在兩個仿射空間之間定義仿射對映。線性對映和仿射對映密切相關。因此,我們從線性對映中已經知道的許多性質,例如線性對映的複合(composition)是一個線性對映,也適用於仿射對映。
定義 2.26(仿射對映)。對於兩個向量空間 \(V, W\),一個線性對映 \(\Phi: V \rightarrow W\),以及 \(\boldsymbol{a} \in W\),對映
是從 \(V\) 到 \(W\) 的仿射對映。向量 \(\boldsymbol{a}\) 被稱為 \(\phi\) 的平移向量。
- 每一個仿射對映 \(\phi: V \rightarrow W\) 也是線性對映 \(\Phi: V \rightarrow W\) 和 \(W\) 中的平移 \(\tau: W \rightarrow W\) 的複合,使得 \(\phi = \tau \circ \Phi\)。對映 \(\Phi\) 和 \(\tau\) 是唯一確定的(uniquely determined)。
- 仿射對映 \(\phi: V \rightarrow W, \phi^{\prime}: W \rightarrow X\) 的複合 \(\phi^{\prime} \circ \phi\) 是仿射的。
- 如果 \(\phi\) 是雙射的,仿射對映保持幾何結構不變。它們還保留維度和平行性。