嵌入子流形
嵌入子流形的定义
由于在流形优化中,一般考虑在有限维线性空间上的流形,因此如未加特殊申明,以下所考虑的流形都是指有限维线性空间 \(\mathbb{R}^n\) 的流形,且是光滑流形。
这一节考虑嵌入子流形,这里嵌入子流形比子流形要求更高,它不仅是子流形,而且需要子流形上的拓扑结构是继承于大流形的拓扑,换句话说嵌入子流形上的开集都可以表示成大流形上的开集与子流形的交。
定义:有限维线性空间嵌入子流形
设 \(\mathcal{E}\) 是一个维数为 \(d\) 的线性空间。\(\mathcal{E}\) 的一个非空子集 \(\mathcal{M}\) 是 \(\mathcal{E}\) 的一个(光滑)嵌入子流形,维数为 \(n\),如果满足以下两种情况之一:
- \(n = d\) 且 \(\mathcal{M}\) 在 \(\mathcal{E}\) 中是开集——我们也将其称为开子流形;或者
- 存在某个 \(k \geq 1\),使得 \(n = d - k\),并且对于每个 \(x \in \mathcal{M}\),存在 \(x\) 在 \(\mathcal{E}\) 中的一个邻域 \(U\) 以及一个光滑函数 \(h: U \to \mathbb{R}^k\),满足:
- (a) 若 \(y\) 在 \(U\) 中,则 \(h(y) = 0\) 当且仅当 \(y \in \mathcal{M}\);
- (b) \(\mathrm{rank}\,\mathrm{D}h(x) = k\)。
这样的函数 \(h\) 被称为 \(\mathcal{M}\) 在 \(x\) 处的局部定义函数。
定理:嵌入子流形等价定义
设 \(\mathcal{E}\) 是一个维度为 \(d\) 的线性空间。\(\mathcal{E}\) 的一个子集 \(\mathcal{M}\) 是 \(\mathcal{E}\) 的一个维度为 \(n = d - k\) 的嵌入子流形,当且仅当:
对于每个 \(x \in \mathcal{M}\),存在 \(\mathcal{E}\) 中 \(x\) 的一个邻域 \(U\)、\(\mathbb{R}^d\) 中的一个开集 \(V\) 以及一个微分同胚 \(F: U \to V\),使得 \(F(\mathcal{M} \cap U) = E \cap V\),其中 \(E = \{ y \in \mathbb{R}^d: y_{n + 1} = \cdots = y_d = 0 \}\) 是 \(\mathbb{R}^d\) 的一个线性子空间。
注记
其实个人感觉,上述等价定义更适合作为嵌入子流形的定义;可以这样理解:
- 如果 \(\mathcal{E}\) 的一个子集 \(\mathcal{M}\) 本身是一个开集,那么很明显 \(\mathcal{M}\) 继承 \(\mathcal{E}\) 的限制拓扑(也称相对拓扑),这时 \(\mathcal{M}\) 上的开集仍是 \(\mathcal{E}\) 的开集,因此 \(\mathcal{M}\) 某点的坐标卡可直接继承 \(\mathcal{E}\) 的坐标卡。例如:对于 \(x \in \mathcal{M}\),由于 \(x \in \mathcal{E}\),存在坐标卡 \((U,F)\) 使得 \(F(U)\) 是 \(\mathbb{R}^d\) 的开集,那么 \((U \cap \mathcal{M},F)\) 可作为 \(x\) 在 \(\mathcal{M}\) 的坐标卡,且 \(F(U \cap \mathcal{M})\) 仍为开集(因 \(U \cap \mathcal{M}\) 是开集,且同胚映射保持开集性质)。这样就找到了 \(\mathcal{M}\) 作为 \(\mathcal{E}\) 嵌入子流形的流形结构,其邻域的微分同胚直接继承于被嵌入流形。
- 如果 \(\mathcal{M}\) 不是开集,尽管 \(\mathcal{M}\) 也可继承 \(\mathcal{E}\) 的相对拓扑,但上述坐标卡继承性会失效——因 \(U \cap \mathcal{M}\) 可能不是开集,导致 \(F(U \cap \mathcal{M})\) 不一定是开集。此时只需找到满足等价定义的 \(F\) 即可,这里 \(F(U \cap \mathcal{M})\) 相当于 \(\mathbb{R}^d\) 某线性子空间的相对开集。嵌入子流形是维数更小的流形,丢失的维数隐藏在之前定义中“局部定义函数的导数核空间”内。
下面是一般拓扑空间上的嵌入子流形定义。
定义:嵌入子流形(一般拓扑空间)
设 \(\mathcal{E}\) 是一个维数为 \(d\) 的流形。\(\mathcal{E}\) 的一个非空子集 \(\mathcal{M}\) 是 \(\mathcal{E}\) 的一个(光滑)嵌入子流形,维数为 \(n\),如果满足以下两种情况之一:
- \(n = d\) 且 \(\mathcal{M}\) 在 \(\mathcal{E}\) 中是开集——即开子流形;或者
- 存在某个 \(k \geq 1\),使得 \(n = d - k\),并且对于每个 \(x \in \mathcal{M}\),存在 \(x\) 在 \(\mathcal{E}\) 中的一个坐标卡 \((U,\phi)\) 以及一个光滑函数 \(h: U \to \mathbb{R}^k\),满足:
- (a) 若 \(y\) 在 \(U\) 中,则 \(h(y) = 0\) 当且仅当 \(y \in \mathcal{M}\);
- (b) \(\text{rank}\,\mathrm{D}(h \circ \phi^{-1})(\phi(x)) = k\)。
这样的函数 \(h\) 被称为 \(\mathcal{M}\) 在 \(x\) 处的局部定义函数。
定理
设 \(\mathcal{E}\) 是一个维数为 \(d\) 的流形。\(\mathcal{E}\) 的一个子集 \(\mathcal{M}\) 是 \(\mathcal{E}\) 的一个维度为 \(n = d - k\) 的嵌入子流形,当且仅当:
对于每个 \(x \in \mathcal{M}\),存在 \(\mathcal{E}\) 中 \(x\) 的一个邻域 \(U\)、\(\mathbb{R}^d\) 中的一个开集 \(V\) 以及一个微分同胚 \(F: U \to V\),使得 \(F(\mathcal{M} \cap U) = E \cap V\),其中 \(E = \{ y \in \mathbb{R}^d: y_{n + 1} = \cdots = y_d = 0 \}\) 是 \(\mathbb{R}^d\) 的一个线性子空间。
嵌入子流形间的映射
当考虑两个嵌入子流形之间的光滑映射时,或许会想:嵌入子流形也是流形,直接用流形间的光滑映射定义即可?但这里需强调“嵌入”特性,因此要求映射与被嵌入流形相关联,定义如下:
定义
设 \(\mathcal{M}\) 和 \(\mathcal{M}'\) 分别是 \(\mathcal{E}\) 和 \(\mathcal{E}'\) 的嵌入子流形。映射 \(F:\mathcal{M} \to \mathcal{M}'\) 在 \(x \in \mathcal{M}\) 处是光滑的,如果存在函数 \(\bar{F}:U \to \mathcal{E}'\),它在 \(\mathcal{E}\) 中 \(x\) 的邻域 \(U\) 上光滑,且在 \(\mathcal{M} \cap U\) 上与 \(F\) 重合(即对所有 \(y \in \mathcal{M} \cap U\),\(F(y) = \bar{F}(y)\))。称 \(\bar{F}\) 是 \(F\) 在 \(x\) 附近的(局部)光滑延拓。若 \(F\) 在所有 \(x \in \mathcal{M}\) 处都光滑,则称 \(F\) 是光滑映射。
注记
上述定义的前提是:被嵌入流形间的光滑映射已定义,以此为基础定义嵌入子流形间的光滑映射。
下面的命题是显然的。
命题
设 \(\mathcal{M}\) 和 \(\mathcal{M}'\) 分别是 \(\mathcal{E}\) 和 \(\mathcal{E}'\) 的嵌入子流形。映射 \(F:\mathcal{M} \to \mathcal{M}'\) 是光滑的,当且仅当 \(F = \bar{F}|_{\mathcal{M}}\),其中 \(\bar{F}\) 是从 \(\mathcal{E}\) 中 \(\mathcal{M}\) 的某邻域到 \(\mathcal{E}'\) 的光滑映射(\(\bar{F}|_{\mathcal{M}}\) 表示 \(\bar{F}\) 在 \(\mathcal{M}\) 上的限制)。
嵌入子流形之间光滑映射的微分
下面考虑嵌入子流形之间光滑映射的微分,再次强调:仅考虑线性空间中的流形。
设 \(\bar{F}: U \subseteq \mathcal{E} \to \mathcal{E}'\) 是两个线性空间之间的光滑函数(可能限制在开集 \(U\) 上)。\(\bar{F}\) 在 \(x \in U\) 处的微分是线性映射 \(\mathrm{D}\bar{F}(x): \mathcal{E} \to \mathcal{E}'\),定义为:
这描述了沿 \(v\) 方向移动 \(x\) 时,\(\bar{F}(x)\) 的变化规律。但将此定义应用到嵌入子流形间的光滑映射 \(F: \mathcal{M} \to \mathcal{M}'\) 时会出现问题:即使 \(t\) 很小,\(x + tv\) 通常不属于 \(\mathcal{M}\),导致 \(F\) 在该点无定义。
可通过以下两种等价方法解决:
- (1) 曲线替换:\(t \mapsto x + tv\) 是 \(\mathcal{E}\) 中过 \(x\)、速度为 \(v\) 的曲线,可改用 \(\mathcal{M}\) 上过 \(x\) 的曲线。
- (2) 光滑延拓:对 \(F\) 做光滑延拓,再对延拓后的函数求微分。
第一种方法更具几何意义,体现一般流形的特性;第二种方法更便于计算。
对任意切向量 \(v \in T_x\mathcal{M}\),存在 \(\mathcal{M}\) 上的光滑曲线 \(c\)(\(t=0\) 时过 \(x\),速度为 \(v\))。此时 \(t \mapsto F(c(t))\) 是 \(\mathcal{M}'\) 上过 \(F(x)\) 的光滑曲线,其在 \(F(x)\) 处的速度即为 \(F\) 在 \(x\) 处沿 \(v\) 的微分,记为 \(\mathrm{D}F(x)[v]\)。
定义:微分
设 \(F: \mathcal{M} \to \mathcal{M}'\) 是映射,\(x \in \mathcal{M}\)。\(F\) 在 \(x\) 处的微分是线性映射 \(\mathrm{D}F(x): T_x\mathcal{M} \to T_{F(x)}\mathcal{M}'\),定义为:
其中 \(c\) 是 \(\mathcal{M}\) 上的光滑曲线,满足 \(c(0) = x\) 且 \(c'(0) = v\)(即 \(t=0\) 时过 \(x\)、速度为 \(v\))。
需说明两点:
- 该定义与曲线 \(c\) 的选择无关(满足条件的曲线不唯一,但结果一致);
- \(\mathrm{D}F(x)\) 是线性映射,可通过第二种方法(光滑延拓)验证。
设 \(\mathcal{M}\) 和 \(\mathcal{M}'\) 分别是 \(\mathcal{E}\) 和 \(\mathcal{E}'\) 的嵌入子流形,光滑映射 \(F: \mathcal{M} \to \mathcal{M}'\) 存在光滑延拓 \(\bar{F}: U \to \mathcal{E}'\)(\(U\) 是 \(\mathcal{M}\) 在 \(\mathcal{E}\) 中的邻域,且 \(F = \bar{F}|_{\mathcal{M}}\))。由于 \(F \circ c = \bar{F} \circ c\),而 \(\bar{F} \circ c\) 是线性空间开子集间的函数复合,满足链式法则:
该等式对所有 \(v \in T_x\mathcal{M}\) 成立,总结为以下定理:
定理:微分与延拓的关系
在上述记号下,\(\mathrm{D}F(x) = \mathrm{D}\bar{F}(x)|_{T_x\mathcal{M}}\)(即 \(F\) 的微分是延拓函数 \(\bar{F}\) 的微分在 \(T_x\mathcal{M}\) 上的限制)。
例1:瑞利商函数的微分
给定实对称矩阵 \(A \in \mathrm{Sym}(d)\),非零向量 \(x \in \mathbb{R}^d\) 的瑞利商为 \(\frac{x^\top A x}{x^\top x}\)。由此定义球面上的函数:
函数 \(f\) 可通过 \(\bar{f}(x) = x^\top A x\) 光滑延拓到 \(\mathbb{R}^d\),因此 \(f\) 是光滑的。其延拓函数的微分表达式为(对所有 \(v \in \mathbb{R}^d\)):
由“微分与延拓的关系”定理,\(f\) 的微分为:
其中 \(v \in \mathrm{T}_x \mathbb{S}^{d-1} = \{ v \in \mathbb{R}^d : x^\top v = 0 \}\)(球面在 \(x\) 处的切空间)。注意:\(\mathrm{D}\bar{f}(x)\) 定义在整个 \(\mathbb{R}^d\) 上,而 \(\mathrm{D}f(x)\) 仅定义在切空间 \(\mathrm{T}_x \mathbb{S}^{d-1}\) 上。
例2:微分的线性性
设 \(F_1, F_2: \mathcal{M} \to \mathcal{E}'\) 是光滑映射,\(a_1, a_2 \in \mathbb{R}\)。定义 \(F: x \mapsto a_1 F_1(x) + a_2 F_2(x)\),则 \(F\) 是光滑的,且其微分满足线性性:
例3:微分的乘积法则
设 \(f: \mathcal{M} \to \mathbb{R}\)(光滑实值函数)和 \(G: \mathcal{M} \to \mathcal{E}'\)(光滑映射)。定义 \(fG: x \mapsto f(x) \cdot G(x)\)(数乘映射),则 \(fG\) 是从 \(\mathcal{M}\) 到 \(\mathcal{E}'\) 的光滑映射,且微分满足乘积法则:
例4:微分的链式法则
设 \(F: \mathcal{M} \to \mathcal{M}'\) 和 \(G: \mathcal{M}' \to \mathcal{M}''\) 是光滑映射(\(\mathcal{M}, \mathcal{M}' , \mathcal{M}''\) 分别是 \(\mathcal{E}, \mathcal{E}' , \mathcal{E}''\) 的嵌入子流形)。则复合映射 \(G \circ F: x \mapsto G(F(x))\) 是光滑的,且微分满足链式法则:
