# Banach Space - Inverse Function Theorem :::danger **Thn (Inverse Function Theorem)** $E, F$ 是一個 *Banach space*,$u \subseteq E$ 是一個開集,$f : E \to F \in C^1(u)$。 若在 $x_0 \in E$,以及一個開集 $U_0$,使得: $$ Df(x_0)\ \mathbf{bijective} \text{ on }U_0 $$ 則存在 $x_0$ 的鄰域 $U \subseteq E$,使得 $f$ 在 $U$ 上的 *restriction* 是 $C^1$*-isomorphism*,即 *1-1 onto* 且 $f$ 與 $f^{-1}$ 均為 $C^1$ $$ \begin{align} f_U : U \to f(U)\ \mathbf{\ C^1\ isomorphism} \end{align} $$ 更進一步,對於任意 $x \in U$,有: $$ \left[D\left(f_U^{-1}\right)(x)\right] = \left[[Df_U(x)]^{-1}\right] $$ ::: ### Step 1:問題轉化 因為已經知道 $Df(x_0) \in \mathbb L(E, F)$ 了,又加上前提知道是 *bijective*,這兩個條件加起來也就是在說:==$Df(x_0)$ 是個 $C^0$*-isomorphism*== 。所以如果把操縱對象從 $f$ 改成 $$ \tilde f = \left([Df(x_0)]^{-1} \circ f\right) $$ 並不會影響局部的微分性。這是因為 $\mathbb L(E, A)$ 對某個點的微分不管微分幾次都是自己,所以合成之後可不可微分,取決於 $f$ 可不可微分。而且操作的範圍就變成一個: $$ \tilde f : E \to E $$ 的函數了。 順帶一提,之所以會「$\mathbb L(E, A)$ 對某個點的微分不管微分幾次都是自己」,這是因為對於任意 $T \in \mathbb L(E, F)$,所以 $T$ 線性,因此: $$ T(x + h) - T(x) = T(h) $$ 所以,把自己帶進微分定義中: $$ \frac {\|T(x + h) - T(x) - T(h)\|_F}{\|h\|_E} = 0 $$ 取極限前都是 $0$ 了,取極限之後就更不用說。所以 $T$ 自己就是滿足微分定義那個 $\mathbb L(E, F)$,因此自己就是自己的微分。 > 這樣看起來似乎 > > 1. 線性就可以微分 > 2. 可微分又表示連續 > > 那似乎就避開了 *bounded* 的限制嗎?其實沒有。這是因為: > > 1. 微分定義中,「在某點微分結果是個 *bounded* 函數」。如果 $T$ 不 *bounded linear*,那就不是滿足微分定義的微分了。 > 2. 可微分推到連續的步驟,也要用到微分結果是 *bounded* 的性質。 這樣的轉換,除了不影響 $f$ 的微分性,以及 $E = F$ 之外,另外一個好事是: $$ D\tilde f(x_0) = I $$ 這可以用微分 *chain rule* 看: $$ \begin{align} [D\tilde f(x_0)] &= D\bigg([Df(x_0)]^{-1}f(x)\bigg)\bigg|_{x = x_0} \newline &= [Df(x_0)]^{-1}\bigg(Df(x)\bigg)\bigg|_{x = x_0} \newline &= [Df(x_0)]^{-1}[Df(x_0)] \newline&= I \end{align} $$ 或是直接用定義。因為 $f$ 在 $x_0$ 可微分,所以有: $$ \begin{align} Df(x_0)^{-1}\bigg(f(x_0 + h) - f(x_0)\bigg) &= Df(x_0)^{-1}\bigg([Df(x_0)](h) + \phi(h)\bigg) \newline &= h + Df(x_0)^{-1}(\phi(h)) \newline &= I(h) + \tilde \phi(h) \end{align} $$ 其中: $$ \lim_{\|h\|_E \to 0} \frac {\|\phi(h)\|_F}{\|h\|_E} = 0 $$ 可以證明:若 $T \in \mathbb L(E, F)$,且 $T$ 可逆,那麼 $T^{-1} \in \mathbb L(E, F)$。首先,線性轉換若可逆,則其逆轉換也是線性的。更進一步,這個逆轉換 $T^{-1}$ 也有界。因為: $$ \frac {\|T(x)\|_F}{\|x\|_E} < c \Rightarrow \frac {\|x\|_E}{\|T(x)\|_F} = \frac {\|T^{-1}(y)\|_E}{\|y\|_F} < \frac {1}{c} $$ 綜合以上的結論,可以進一步宣稱: $$ \lim_{\|h\|_E \to 0} \frac {\tilde \phi(h)}{\|h\|_E} = 0 $$ 這是因為: $$ \begin{align} \lim_{\|h\|_E \to 0} \frac {\tilde \phi(h)}{\|h\|_E} &= \lim_{\|h\|_E \to 0} \frac {Df(x_0)^{-1}(\|h\|_E\phi(h))}{\|h\|_E} \newline &= Df(x_0)^{-1}\bigg(\lim_{\|h\|_E \to 0}\frac {\phi(h)}{\|h\|_E}\bigg) \newline &= Df(x_0)^{-1}(0) \newline &= 0 \end{align} $$ 因此,他的微分就是 $I$。 除此之外,還可以把這個函數從 $x_0$ 平移回原點。所以就更近一步簡化成:只要會做「==$f : E \to E$, $f(0) = 0$, $Df(0) = I$, $x_0 = 0$==」 的狀況,那麼就會做原來命題的狀況。 ### Step 2:造 Contraction Map ==用 *MVT inequaity* 造 *contraction map*。== 考慮: $$ g(x) = x - f(x) $$ 這樣一來,$g'(0) = 0$,且 $Dg(0) = 0$。既然 $Df \in C^0$,$Dg = Df + \mathbb I$ 也是 $C^0$,所以也在 $0$ 連續。因此==存在 $r > 0$,使得微分的 *norm* 變成一個比 1 小的數,比如說 $1/2$==: $$ \begin{align} \exists &r > 0.\forall x \in B(0, r). \newline &\|Dg(x) - Dg(0)\|_L = \|Dg(x)\|_L \leq \frac {1}{2} \end{align} $$ 這樣就可以用 *MVT* 造出一個局部的 *contraction map*。因為只要取原點為圓心,比上面的 $r$ 更小的半徑,比如半徑 $r/2$ 的球。那麼在這個比較小的球裡面,就有: $$ \|g(x) - \underbrace{g(0)}_{0}\| \leq \underbrace{\left(\sup_{x\in \overline{ox}} \|Dg(x)\|_L\right)}_{<1/2}\underbrace{\|x\|}_{\leq r/2} $$ 因為 $g(0) = 0$,$\|Dg(x)\|_L < 1/2$,故對於任意 $\|x\| \leq r/2$,有: $$ \|g(x)\| \leq \frac {1}{2} \|x\| \leq \frac {r}{4} $$ 也就是說: $$ g \left({\bar{B}\left(0, \frac {r}{2}\right)}\right) \subseteq {\bar{B}\left(0, \frac {r}{4}\right)} $$ 既然會把半徑是 $r/2$ 的球射進半徑 $r/4$ 的球裡面,這樣造出來的 $g$ 就是一個 *contraction map*。除此之外,上面還有推導出在這個半徑 $r/2$ 上面,有: $$ \|Dg(x)\|_L \leq \frac {1}{2} $$ ### Step 3:Banach Contraction Theorem 宣稱: $$ \forall y \in \bar B\left(0, \frac {r}{4}\right).\exists !x \in \bar B\left(0, \frac {r}{2}\right).f(x) = y $$ 這是因為:對於任意這樣的 $y$,考慮: $$ \begin{align} g_y &= g(x) + y \newline &= \bigg(x - f(x)\bigg) + y \end{align} $$ 首先,任何一個這樣造出來的 $g_y$ 都是一個 *contraction map*。因為 $$ \begin{align} \|g_y(x_1) - g_y(x_2)\| &= \|(g(x_1) + y) - (g(x_2) + y)\| \newline &= \|g(x_1) - g(x_2)\| \newline &\leq \|Dg(0)\|_L\|x_1 - x_2\| \newline &\leq \frac {1}{2}\|x_1 - x_2\| \end{align} $$ 除了這之外,還要確認這件事情成立的範圍。因為 ==現在的 *contraction* 性質只在一個局部範圍內出現,而不是整個空間。所以要進一步確認 *contract* 的結果會不會往外飄。== 稍微統整一下上面 $x$ 跟 $y$ 的條件: 1. $y$ 在半徑 $r/4$ 的球裡,所以 $$ \|y\| < r/4 $$ 2. 在 $\|x\| < r/2$ 的狀況下,有 $$ \|g(x)\| \leq r/4 $$ 所以,對於任意 $\|x\| < r/2$ 的 $x$,有: $$ \|g_y(x)\| \leq \|g(x)\| + \|y\| \leq \frac {r}{4} + \frac {r}{4} = \frac {r}{2} $$ 也就是說: $$ g_y\left(\bar B\left(0, \frac {r}{2}\right)\right) \subset \bar B\left(0, \frac {r}{2}\right) $$ 所以,上述 *contraction* 成立的範圍,是在半徑 $r/2$ 的「閉」球上。因此,若將 $g_y$ 定義在 $\bar B(0, r/2)$ 這個閉球上: $$ g_y : \bar B\left(0, \frac {r}{2}\right) \to \bar B\left(0, \frac {r}{2}\right) $$ 在這個狀況下,$g_y$ 仍然定義在一個完備的集合上,因為完備空間的閉集仍然是完備的。所以這樣一來就湊齊了 *Banach Contraction Theorem* 的條件:$\bar B(0, r/2)$ 完備、$g_y$ 是 *contraction map*。因此就存在唯一的 $x_0$,使得: $$ \begin{align} g_y(x_0) = x_0 &\Rightarrow x_0 - f(x_0) + y = x_0 \newline &\Rightarrow f(x_0) = y \end{align} $$ ### Step 4:構造反函數 上面證明出了這樣的命題: $$ \forall y \in \bar B\left(0, \frac {r}{4}\right).\exists !x \in \bar B\left(0, \frac {r}{2}\right).f(x) = y $$ 言下之意, ==任何 $y \in \bar B(0, r/4)$ 當中,都存在唯一的 $x \in \bar B(0, r/2)$,使得 $f(x) = y$==。因此,把這樣的 $x$ 都收集起來,假定形成的集合叫做 $X$。由上面結果知道,$X \subset \bar B(0, r/2)$。所以就令: $$ \begin{align} U &= X \cap \bar B\left(0, \frac {r}{2}\right) \newline V &= \bar B\left(0, \frac {r}{4}\right) \end{align} $$ 這樣一來: $$ f_{U} : U \to V $$ 就會是一個 *1-1 onto* 的函數了。 ### Step 5:局部反函數連續 更進一步宣稱:這樣夠造出來的 $f_U$ 是連續的: $$ \left(f_U\right)^{-1}\mathbf {\ continuous} $$ 因為 $U$ 在 $\bar B(0, r/2)$ 中。由==Step 2== 的步驟知道:在 $\bar B(0, r/2)$ 中,有: $$ \|Dg(x)\|_L \leq \frac {1}{2} $$ 對於任意 $y_1, y_2 \in U$,假定 $x_1, x_2$ 是 $U$ 中使得 $f(x_1) = y_1$ 及 $f(x_2) = y_2$ 的唯一元素。套用 *MVT*,有: $$ \begin{align} \|g(x_1) - g(x_2)\| &\leq \|Dg(0)\|_L\|x_1 - x_2\| \newline &\leq \frac {1}{2}\|x_1 - x_2\| \end{align} $$ 所以,計算 $\|f^{-1}(y_1) - f^{-1}(y_2)\|$: $$ \begin{align} &\|f^{-1}(y_1) - f^{-1}(y_2)\| \newline &= \|x_1 - x_2\| \newline &= \|(\underbrace{x_1 - f(x_1)}_{g(x_1)} + f(x_2)) - (\underbrace{x_2 - f(x_2)}_{g(x_2)} + f(x_2))\| \newline &= \|g(x_1) - g(x_2) + f(x_1) - f(x_2))\| \newline &\leq \|g(x_1) - g(x_2)\| + \|f(x_1) - f(x_2)\| \newline &\leq \frac {1}{2}\|x_1 - x_2\| + \|y_1 - y_2\| \end{align} $$ 把最下面的 $(1/2)\|x_1 - x_2\|$ 往左移項,就會有: $$ \frac {1}{2}\|x_1 - x_2\| = \frac {1}{2}\|f^{-1}(y_1) - f^{-1}(y_2)\| \leq \|y_1 - y_2\| $$ 換句話說,$f^{-1}$ 在 $U$ 的範圍內 *Lipschitz*。因為上面那坨東西就是: $$ \|f^{-1}(y_1) - f^{-1}(y_2)\| \leq 2 \|y_1 - y_2\| $$ 由此得證 $f^{-1}$ 在 $U$ 上連續。 ### Step 6:微分的局部反函數存在 宣稱:在 $U$ 上面的任意 $x$,有: $$ [Df(x)]^{-1}\ \mathbf{exists} \text{ and }\mathbf{bonded} $$ 首先考慮 $g$ 的可微分性。$Dg(x_0) \in \mathbb L(E, E)$,而 $\mathbb L(E, E)$ 搭配 $\|\cdot\|_L$ 之後,是一個有單位元 $I$ 的 *Banach space*。因此: $$ Df : E \to \mathbb L(E, F) $$ 以及: $$ Dg : E \to \mathbb L(E, F) $$ 也是 *Banach space* 之間的轉換。而更進一步,對於 $x \in U$,有: $$ Df(x) = I - Dg(x) $$ 其中: $$ \|Dg(x)\|_L \leq \frac {1}{2} $$ 而在介紹 *Banach space* 提到:若有一個元素具備 $\mathbb 1 - a$ 的形式,其中 $\|a\| < 1$,那麼這個元素就可逆。因此,$Df(x)$ 作為一個在 $\mathbb L(E, E)$ 中的元素也是可逆的。也就是: $$ \forall x \in U.[Df]^{-1} \ \mathbf {exists} $$ 更進一步,如果這樣形式的元素存在,$[Df(x)]^{-1}$ 有以下形式: $$ \begin{align} &(\mathbb 1 - a)^{-1} = \sum_{i = 0}^{\infty}a^i \newline &\Rightarrow [Df(x)]^{-1} = [I - Dg(x)]^{-1} = \sum_{i = 1}^{\infty}[Dg(x)]^i \end{align} $$ 由上面這個形式又可以觀察到:只要 $x \in U$,那麼被 $Df$ 生出來的 $Df(x)$ ,他的反元素 $[Df(x)]^{-1}$ 都還是 *bounded* 的。因為: $$ \begin{align} \|[Df(x)]^{-1}\|_L &\leq \sum_{i = 0}^{\infty}\left(\|[Dg(x)]\|_L\right)^i \newline &\leq \sum_{i = 0}^{\infty} \left(\frac {1}{2}\right)^i \newline &= 2 \end{align} $$ 除了 *bounded* 之外,還是線性的。這是因為 $Df(x) \in \mathbb L(E, E)$,所以是線性的。而線性轉換的逆轉換也是線性的。 ### Step 7:微分的局部反函數 = 反函數局部的微分 最後要證明的命題是: $$ \forall x \in U.[Df^{-1}(x)] = [Df(x)]^{-1} $$ 直接把 $[Df(x)]^{-1}$ 塞進去定義說他滿足微分定義。任選 $y \in V$,考慮: $$ \begin{align} &\left(f^{-1}(y') - f^{-1}(y)\right) - [Df(x)]^{-1}(y' - y) \newline &= (x' - x) - \underbrace{[Df(x)]^{-1}(f(x') - f(x))}_{對這串動手} \end{align} $$ 利用 $f$ 可微分,能夠把 $f(y') - f(y)$ 寫成: $$ \begin{align} f(x') - f(x) &= [Df(x)](x' - x) + \|x'- x\|\phi(x' - x) \newline [Df(x)]^{-1}(f(x') - f(x)) &= \underbrace{(x' - x)}_{帶回去會被消掉} + [Df(x)]^{-1}\|x' - x\|\phi(x' - x) \end{align} $$ 其中: $$ \phi(x' - x) \to 0 \text{ as }\|x' - x\| \to 0 $$ 帶回原式,得到: $$ \begin{align} &\left(f^{-1}(y') - f^{-1}(y)\right) - [Df(x)]^{-1}(y' - y) \newline &=[Df(x)]^{-1}\bigg(\|x' - x\|\phi(x' - x)\bigg) \newline &\to [Df(x)]^{-1}(0) = 0 \text{ as }x' \to x \end{align} $$ 所以就證明了: $$ [Df(x)]^{-1} = \left[Df^{-1}(x)\right] $$