# 實用數學的直觀證明 Intuitive Proofs of Tools - 每次用到這些公式,都TM忘記原因,重查、重想證明好幾次了,真受夠了! - 所以整理一下我所知道最直觀、好懂(、可能不嚴謹)的證明 [TOC] ## 畢氏定理 Pythagorean theorem $$a^2 + b^2 = c^2$$ - 證明來源: http://pisa.math.ntnu.edu.tw/attachments/article/1852/Bog016.pdf - 真。來源: [達文西](https://zh.wikipedia.org/zh-tw/%E5%88%97%E5%A5%A5%E7%BA%B3%E5%A4%9A%C2%B7%E8%BE%BE%C2%B7%E8%8A%AC%E5%A5%87) 1. 上下兩個四邊形全等 ![image](https://hackmd.io/_uploads/HJ4d3RfD0.png) 2. 左右兩個四邊形也全等,與 1. 的四邊形都全等 ![image](https://hackmd.io/_uploads/SklD6RMPC.png) 3. 阿呀證完了: $a^2 + b^2 = c^2$ 4. 有 $a^2 + b^2 = c^2$ 推廣到 >= 3維就很容易,寫出來就知道了~ 不過,用**餘弦定理** reduce to 畢氏定理感覺更棒! ## 餘弦定理 Law of Cosines $$|\vec{a} - \vec{b}|^2 = |\vec{a}|^2 +|\vec{b}|^2 - 2|\vec{a}||\vec{b}|\cos\theta$$ - 證明來源: https://ejournal.stpi.narl.org.tw/sd/download?source=10003/10003-02.pdf&vlId=1887CAAA-10BF-471D-9A25-14B30EC429BB&nd=0&ds=0 - 真、來源: [歐幾里德](https://zh.wikipedia.org/zh-tw/%E6%AC%A7%E5%87%A0%E9%87%8C%E5%BE%97)[《幾何原本》](https://zh.wikipedia.org/wiki/%E5%87%A0%E4%BD%95%E5%8E%9F%E6%9C%AC) 1. 塗色面積相等喔 i.e. $DBFE = BGHI$, 右邊實灰色面積也相等 ![image](https://hackmd.io/_uploads/BJOFjtmwA.png) - 不太明顯? 注意 **全等三角形**($ABG$, $DBC$) $\Rightarrow$ **等底同高**的四邊形三角形 pair ![image](https://hackmd.io/_uploads/rkq96YQPC.png) - 等底同高,所以 $DBC$ 面積 = $DBFE$ 面積 $* \frac{1}{2}$ 2. 注意到 $ab\cos\theta$ 在哪裡: ![image](https://hackmd.io/_uploads/S1Tyb9QwC.png) - $c^2$ 比 $a^2 +b^2$ **少**的面積(左右空白部分相加),就是 $2 * ab\cos\theta$ 3. 所以 $c^2 = a^2 + b^2 - 2ab\cos\theta$ 得證 - $a, b, c$ 為三角形邊的"長度" 4. 兩個向量能決定一個 2D 平面,**所以在 $\vec{a}$ 與 $\vec{b}$ 決定的平面進行 1. - 3.,就能以 $|\vec{a}|, |\vec{b}|, |\vec{a} - \vec{b}|$ 作為三角形邊的"長度"**,在空間中證出: $$|\vec{a} - \vec{b}|^2 = |\vec{a}|^2 +|\vec{b}|^2 - 2|\vec{a}||\vec{b}|\cos\theta$$ 5. 那 $\theta > 90^\circ$ 怎麼辦? ![71489](https://hackmd.io/_uploads/B1oWX_UwR.jpg) - 斜線部分,$c^2$ 比 $a^2 + b^2$ **多**的面積,也是 $2 *|ab\cos\theta|$ - 因 $\theta > 90^\circ$,$b\cos\theta$ (或$a\cos\theta$) $<0$ (來自 $\cos\theta$ 定義) - 所以 $-2ab\cos\theta > 0$,可以把公式解讀成: $$c^2=a^2+b^2+(-2ab\cos\theta)$$ 把 $a^2+b^2$ 不足 $c^2$ 的面積加上去~ ## 點積 Dot Product $$\vec{a} \cdot \vec{b} = |\vec{a}||\vec{b}| \cos\theta = a_0b_0+a_1b_1+a_2b_2$$ - 證明來源: https://bridge.math.oregonstate.edu/papers/dot+cross.pdf 0. 目標: **證明** $|\vec{a}||\vec{b}| \cos\theta = a_0b_0+a_1b_1+a_2b_2$ - 先**定義** $\vec{a} \cdot \vec{b} = |\vec{a}||\vec{b}| \cos\theta$,字才可以寫少一點 1. $|\vec{a}||\vec{b}| \cos\theta$ 本質是 $|\vec{a}| * |\vec{b}$ 在 $\vec{a}$ 的 projection$|$ ![71522](https://hackmd.io/_uploads/rJc4jCEv0.jpg) - 可描述 "與 $\vec{a}$ 平行的 $\vec{b}$ 的量" 2. $|\vec{w}| * |\vec{u}+\vec{v}$ 在 $\vec{w}$ 的 projection$|$ $= |\vec{w}| * |\vec{u}$ 在 $\vec{w}$ 的 projection$|$ $+$ $|\vec{w}| * |\vec{v}$ 在 $\vec{w}$ 的 projection$|$ - 帶入定義: $$\vec{w} \cdot (\vec{u}+\vec{v}) =\vec{w} \cdot \vec{u} + \vec{w} \cdot \vec{v}$$ ![dot_product分配律](https://hackmd.io/_uploads/SkjvBA4DR.png) - 粉色向量是 $\vec{u}+\vec{v}$,此圖證明 **dot product 有分配律** 3. 向量能拆成單位向量組合: $$ \begin{flalign} & \vec{a}=a_0\hat{x}+a_1\hat{y}+a_2\hat{z} \\ & \vec{b}=b_0\hat{x}+b_1\hat{y}+b_2\hat{z} \end{flalign} $$ - 其中單位向量: $$ \begin{flalign} & \hat{x}=(1,0,0) \\ & \hat{y}=(0,1,0) \\ & \hat{z}=(0,0,1) \\ \end{flalign} $$ - 因為 $\hat{x}$, $\hat{y}$, $\hat{z}$ 互相垂直,所以互相 project 的結果都會是 $\vec{0}$ - dot product 就必 $=0$ 4. 最後推導: (請記得 $\vec{a} \cdot \vec{b} =|\vec{a}| * |\vec{b}$ 在 $\vec{a}$ 的 projection$|$) $$ \begin{flalign} & \vec{a} \cdot \vec{b} \\ & = (a_0\hat{x}+a_1\hat{y}+a_2\hat{z}) \cdot (b_0\hat{x}+b_1\hat{y}+b_2\hat{z})\\ & = a_0\hat{x} \cdot (b_0\hat{x}+b_1\hat{y}+b_2\hat{z}) + a_1\hat{y} \cdot (b_0\hat{x}+b_1\hat{y}+b_2\hat{z})+a_2\hat{z} \cdot (b_0\hat{x}+b_1\hat{y}+b_2\hat{z})\\ & = a_0b_0\hat{x} \cdot \hat{x} +a_1b_1\hat{y} \cdot \hat{y}+a_2b_2\hat{z} \cdot \hat{z}\\ & = a_0b_0*1+a_1b_1*1+a_2b_2*1\\ & = a_0b_0+a_1b_1+a_2b_2\\ \end{flalign} $$ - 附圖,幫助思考: ![71524](https://hackmd.io/_uploads/rJi581Sw0.jpg) - **直觀上:** 因為 projection 有分配律,我們能把 $\vec{a}$ 拆成 $a_0\hat{x}$, $a_1\hat{y}$, $a_2\hat{z}$ 個別與 $\vec{b}$ 做 projection, 相乘後再相加,但 $\vec{b}$ 也能拆成 $b_0\hat{x}$, $b_1\hat{y}$, $b_2\hat{z}$,所以 $a_0\hat{x}$ 只與 $b_0\hat{x}$ 有效,同理 $\hat{y}$, $\hat{z}$,再加上單位向量長度是$1$,自己乘自己(無須 project)也是$1$,因此只剩 $a_0b_0+a_1b_1+a_2b_2$ - 因此 dot product 變成 **"過濾到剩 x, y, z 座標相乘"** 的運算 5. $\vec{a} \cdot \vec{b} = |\vec{a}||\vec{b}| \cos\theta = a_0b_0+a_1b_1+a_2b_2$ 得證 ## 叉積值 Cross Product Value https://hackmd.io/@Zij-J/rycK3yWVZg ## 行列式是面積 Determint is Area 跟 Cross Product 概念一樣: https://hackmd.io/@Zij-J/rycK3yWVZg ## sin cos 角度加法 Angle Addition for Sine and Cosine $$ \begin{flalign} & \sin(\alpha+\beta) = \sin\alpha\cos\beta+\cos\alpha\sin\beta \\ & \cos(\alpha+\beta) = \cos\alpha\cos\beta-\sin\alpha\sin\beta \\ \end{flalign} $$ - 證明來源: https://math.stackexchange.com/questions/402487/intuition-of-addition-formula-for-sine-and-cosine - 圖解即可: ![sin_cos_adding](https://hackmd.io/_uploads/BkDaDXL_A.png) - 減法,除了**用三角函數負號的定義推導(+負的角度)**,也能**圖解**,用好理解的理解即可: $$ \begin{flalign} & \sin(\alpha-\beta) = \sin\alpha\cos\beta-\cos\alpha\sin\beta \\ & \cos(\alpha-\beta) = \cos\alpha\cos\beta+\sin\alpha\sin\beta \\ \end{flalign} $$ ![aRFRp](https://hackmd.io/_uploads/rJuM678uR.png) ## 四元數 Quaternions 點 $(a,b,c)$ 在指定 $(x,y,z)$ 軸依右手定則轉 $\theta$ 角,變成 $(a',b',c')$: $$ a'i+b'j+c'k = (\cos\frac{\theta}{2} +\sin\frac{\theta}{2}(xi+yj+zk)) \cdot (ai+bj+ck) \cdot (\cos\frac{\theta}{2} +\sin\frac{\theta}{2}(-xi-yj-zk)) $$ - 證明來源 (**極建議照順序先看!! 看不懂再回來**): 1. https://www.youtube.com/watch?v=mvmuCPvRoWQ 2. https://www.youtube.com/watch?v=d4EgbgTm0Bg 3. https://eater.net/quaternions - Stereographic Projection: - [2D -> 1D](https://eater.net/quaternions/video/stereo2d): ![image](https://hackmd.io/_uploads/r1IsAzrKA.png) - 3D -> 2D 或 4D -> 3D,我理解成: **由多個 2D -> 1D 的線 span 成的平面/空間** - 2D -> 1D 的線記錄了少的一維(實數)在其他維度(虛數)的位置 - 從 -1 project 效果: **實數愈大(Max 1),愈接近原點,實數愈小(min -1),離原點愈遠** - [3D -> 2D](https://eater.net/quaternions/video/stereo3d),乘 $i$ 時(轉 $j$ 軸),圓變大然後變直線? ![image](https://hackmd.io/_uploads/HkIjA7SKA.png) - 因為: $$ \begin{flalign} & i \rightarrow -1 \\ & -i \rightarrow 1 \\ \end{flalign} $$ - 最後所有 $i$ 項都消失,剩 $real$ 與 $j$,也就是直線 - 記得 -1 是 $\infty$,$i$ 項漸漸接近 -1 時,project 會變超大,有 $i$ 項的黃色右邊圓會放大,左邊黃色圓會縮小 - 斜對角的縮放,來自 $i, j$ 項一起縮放: ![image](https://hackmd.io/_uploads/rkkzSe8KA.png) - $real$ 使結果仍在 unit sphere,**愈多 $|i|,|j|$ 使 $real$ 愈小,然後正負號決定點接近 1(原點) 還是 -1($\infty$),因此表示"離原點距離"** - $i, j$ 也能說是: **表示"斜對角的位置(方向)"** - 用 $1+0i+0j$ (粉色點) 來想 project 結果,會好很多 - $real,i,j$ 與角度的關係: $$ c+ai+bj=\cos\theta+\sin\theta(a'i+b'j) $$ - $a',b'$ 是 $i,j$ 平面上單位圓的點,整個 3D 圓會往 $(a',b')$ 方向轉 $\theta$ 度 ![image](https://hackmd.io/_uploads/H1OhgrwF0.png) - **在 2D 長度 = 1 的線,當成新的軸,與多的 1D 形成新的長度 = 1 線 in 3D** - 所以能有其他解釋,如: $$ ai+c+bj=\cos\theta i+\sin\theta(a'+b'j) $$ ![image](https://hackmd.io/_uploads/BkT_MivY0.png) - 但原本的解釋,project 回 2D 會變成熟悉的: $\cos\theta+\sin\theta a'i$,從 1 開始旋轉的定義,為了一致性才解釋成 $\cos\theta+\sin\theta(a'i+b'j)$ - **乘法與"旋轉"的關係?** - 2D: ($i^2=-1$,乘 $i$ 轉 $90^\circ$) ![2D_rotate](https://hackmd.io/_uploads/BJOhDtOYR.png) - $c+di$ 的相似三角形,來達到轉 $c+di$ 代表的 **$0$ 度到 $\theta$ 度旋轉** - stereographicly project 後轉 $\theta$ 度變成 $i$ 軸上的平移 - 3D: - **數學上沒有定義** (我也想不到怎麼定義使"圓轉 $\theta$"與乘法有關) ![image](https://hackmd.io/_uploads/HJgfl0TKA.png) - 光是 $-j$ 轉 $\frac{\sqrt{3}}{2}i+\frac{1}{2}j$ 就很難解釋,$1$ 會被轉 $90^\circ$,但 $-j$ 轉的角度就很怪 - 從結果回推,為了維持垂直關係,$-j$ 轉完的 $i,j$ 是 $-\frac{1}{2}i-\frac{\sqrt{3}}{2}j$,要怎麼定義乘法讓 $-\frac{\sqrt{3}}{2}ij$ 變成那樣 for all 旋轉,好像很難、不漂亮、**不實用** - 只能確定 $j^2=-1$ 是一定要的: ($-j$ 轉完的 $real$ 是 $\frac{1}{2}$ 沒錯) ![image](https://hackmd.io/_uploads/S18_NRTK0.png) - 為了之後理解,如果自己定義: $i^2=j^2=-1$,$ij=j$,$ji=i$,乘 $i,j$ 各自轉 $90^\circ$,互不影響 ![3D_rotate](https://hackmd.io/_uploads/r1SdvK_KC.png) - 乘 $i$,可想成把 $a+bi+cj$ project 到垂直 $j$ 的平面,轉 $90^\circ$,再還原 project - **$i,j$ 決定旋轉目標向量 at $*i,*j$ 平面位置,以 $real$ 決定轉多少度** - **$real$ 增加會使 $i,j$ 減少**,才能維持目標向量方向不變、總長度 = 1 - $i,j$ 減少在 4D 會有其他影響,這裡沒事 - stereographicly project 後,一樣 $i,j$ 決定方向,只是轉 $\theta$ 度變成方向軸上的平移(與原點的距離) - 除了 $1$ 的其他點,在 3D 也會依照 $d+ei+fj$ 的方向轉 $\theta$ - 但**不是**[演示中](https://eater.net/quaternions/video/stereo3d)的轉 $\theta$ 就是了... - why 需 4D 形容 3D 旋轉? - [3D](https://eater.net/quaternions/video/stereo3d) 只能形容 north pole "位置"(座標 vector 在特定 2D 圓上的旋轉),不含 3D 圓的自轉,必須多一個 degree of freedom - 3D 的 $(real, i, j)$ 就是 unit sphere "north pole 位置" - **[Quaternions(4D)](https://eater.net/quaternions/video/quatmult) 乘法與"旋轉"關係**: - 代數: $$ \begin{flalign} & i^2=j^2=k^2=-1 \\ & ij = -ji = k \\ & jk = -kj = i \\ & ki = -ik = j \\ \end{flalign} $$ - 這樣的定義,使 $*i$ 不只是對 $a+bi$ 轉 $90^\circ$,還讓 $cj+dk$ 依右手定則轉 $90^\circ$ - 想像成 3D 的 Stereographicly Projection **(2D 平面上直線平移、離目標向量愈遠的線移動量愈少) 外,整個空間還會以右手定則方向旋轉** - 幾何: - 理論上 $(a+bi+cj+dk)(e+fi+gj+hk)$ 會以 $bi(e+fi+gj+hk)$、$cj(e+fi+gj+hk)$、$dk(e+fi+gj+hk)$ 組成目標 3D 向量,讓 $(e+fi+gj+hk)$ 依 $a$ 的量往目標 3D 向量轉 $cos^{-1}a$ 度 - 但這也是座標 vector 旋轉,而且在 4D,無法直接視覺化 - Stereographicly Projection: ![image](https://hackmd.io/_uploads/SkSr6MFYR.png) - 簡單來說: **直線平移 + 空間右手定則旋轉** - 詳細來說: - ????組成"目標向量"並"往目標向量轉角度",**是在 4D 中一個 2D 平面上發生**, Stereographicly Projection 使面變成線,**因此"向量旋轉"變成"直線平移"** - **$i,j,k$ 之間的關係**,和 3D -> 2D 一樣,**沒有 $real$ 下 project 前後的位置不變** (畢竟**壓扁的只有 $real$**) - 所以 $sin\theta$ 前的 $i,j,k$ 會是正常 3D 位置,$\sin\theta$ 後(4D 向量旋轉)只是乘係數,方向不變,**$i,j,k$ 能正確表示 4D 座標旋轉的目標向量** - 但 - 像 3D -> 2D 那樣,想像成 $real$ 維度被壓扁到 3D 空間了,**每條線**(含 $x,y,z$ 軸) **都是 $real$ project 到 $i,j,k$ 的結果** - 這包含目標向量的線,所以就和 3D -> 2D 一樣,在向量旋轉時只是 $real$ 讓原本向量減少($real$ 表示與原點的距離) + $i,j,k$ 乘 $\sin\theta$ (目標向量只改長度),所以 project 後有在"目標向量平移"效果 - **Quaternions 與真。3D 旋轉**: ![image](https://hackmd.io/_uploads/r16gzXtYA.png) - 簡單來說: **不要**直線平移,**留下**空間右手定則旋轉 - 直線平移: 座標 vector 轉的角度($real$),乘 $-\theta$ 轉回來 - 空間右手定則旋轉: 目標 vector($i,j,k$),不動 - 詳細來說: - 因此**整個空間**、**繞著指定的軸**轉了 $2\theta$ 度 ## Fourier Series basis 能 span 整個 f(x) 空間 $$ \frac{a_0}{2}+\sum_{n=1}^\infty a_n \cos(n \pi\frac{x}{p})+b_n\sin(n\pi\frac{x}{p}), \: x \in [-p,p] $$ Lecture slide (Download it before it gone!): https://homepage.ntu.edu.tw/~ihwang/Teaching/Fall13/Slides/DE_Lecture_13_handout_v3.pdf series 的 cofficient 來自 f(x) inner product project 到 basis (看[這個](https://www.youtube.com/watch?v=0SGmb_dRm2U)之後我才懂) - p.s. Dirichlet’s theorem 與 Dirichlet Kernel 不一樣,但[很有趣](https://www.youtube.com/watch?v=EK32jo7i5LQ)壓 重點:**沒有任何 $f(x)$ linear independence to** $\{1, \sin(n\pi\frac{x}{p}), \cos(n\pi\frac{x}{p})\} \forall n \in Z^+$,所有 function $f(x)$ 都能用 $\{1, \sin(n\pi\frac{x}{p}), \cos(n\pi\frac{x}{p})\} \forall n \in Z^+$ 組成 - **$f(x)$ 是 domain $[-p,p]$ 讓 sin cos domain $[-\pi,\pi]$ 的週期函數** - 因此 $\sin(1.1 \pi\frac{x}{p})$ 等 $n \notin Z$ 三角函數不能被 fourier series 表示,不討論 - 正常的 function in domain $[-\infty,\infty]$ 會被切成 domain $[-\pi,\pi]$ 的週期函數 - $f(x), g(x)$ linear independence if and only if $\alpha f(x) + \beta g(x)=0$ 時,只能來自 $\alpha = 0$ and $\beta = 0$ 或 $f(x)$ or $g(x)=0$ 推導:$\forall n \in Z^+$,**跟 $\{\sin(n\pi\frac{x}{p})\}$ independent 的只可能是偶函數,跟 $\{\cos(n\pi\frac{x}{p})\}$ independent 的只可能是奇函數**,同時是奇函數與偶函數的 function 是常數函數,但常數函數 dependent to $1$,因此 $f(x)$ 不存在 P.S. [inner product = 0 代表 linear independent](https://math.stackexchange.com/questions/1823780/relation-between-linear-independence-and-inner-product): - inner prodcut: $\int_{-p}^pf(x)g(x)dx$ - 如 $f(x)=c$, $g(x)=\sin(\frac{n\pi}{p}x)$ 時,$\int_{-p}^pf(x)g(x)dx=0$,明顯的讓 $\alpha f(x) + \beta g(x)=0$ 只有 $\alpha= \beta = 0$ 能實踐 - Note: trivially 反方向推,會錯 - 能以 $\int_{-p}^pf(x)g(x)dx=0$ 證明**跟 $\{\sin(n\pi\frac{x}{p})\}$ independent 的只可能是偶函數** - $Z^+$ 確保 P.S. Discrete cosine trnasform 能只用 $\{1, \cos(n\pi\frac{x}{p})\} \forall n \in Z^+$,span 整個 f(x),**因為 $f(x)$ 的 domain $x$ 被限制 > 0** (cos 的 domain 原本 $[-\pi, \pi]$ 變成 $[0, \pi]$),**只要讓 < 0 的值 even padded** (做 DFT 下去就是),整個 $[-\pi, \pi]$ 就是 even function - even function 中,能跟 $\cos(n\pi\frac{x}{p})$ independent 的只有常數函數,常數函數 dependent to $1$,因此在 span 外的 $f(x)$ 不存在 P.S. Frourier Series Complex form: $$ f(x)=\sum_{n=-\infty}^\infty c_n e^{i n \pi\frac{x}{p}}, \:where \:\: c_n=\int_{-p}^{p}f(x)e^{-i n \pi\frac{x}{p}} dx $$ f(x) 現在是在 complex plan 上的週期函數 $c_n$ 的 $e$ 多了負號,來自 cross product 複數推廣:$<f(x),g(x)>=\int_{-p}^{p}f(x)\overline{g(x)} dx$ 因為 $e^{i n \pi\frac{x}{p}}$ 表示 [x 從 $[-p, p]$ 轉 $n$ 圈中,轉到哪裡](https://youtu.be/r6sGWTCMz2k?t=859): - **除非 $f(x)$ 一樣在 x 從 $[-p,p]$ 轉了 $n$ 圈,不然任何 $f(x)$ 都不可能在 $a,b \ne 0$ 下使 $af(x)+be^{i n \pi\frac{x}{p}}=0$** - 為了避免順時針轉與逆時針轉 dependent, $n$ 從 $[0, \infty)$ 擴展到 $(-\infty, \infty)$ - 因此 $\{e^{i n \pi\frac{x}{p}}\} \forall n \in (-\infty, \infty)$ 且 $n \in Z$,能 span 整個 complex 平面的週期函數 $f(x)$ - 一樣無法表示 $f(x)=ne^{i n \pi\frac{x}{p}}$ where $\notin Z$ 的 case 因為他們週期不在 $[-p,p]$ ## 取樣標準誤 Sample Standard Deviation https://classic-blog.udn.com/nilnimest/92412101 $$ SS_T = \sum_{i=1}^n(y_i - \mu)^2 \\ SS_R = \sum_{i=1}^n(y_i - \overline{y})^2 \\ SS_E = \sum_{i=1}^n(\overline{y} - \mu)^2=n(\overline{y} - \mu)^2 \\ $$ - 各樣本與母群 sum of square - 樣本 sum of square - 平均數與母群 sum of square 1. 與母群總變異($SS_T$, Total) = 樣本平均沒解釋的(組內變異 $SS_R$, Residual) + 樣本平均解釋的($SS_E$, Explained) $$ SS_T=SS_R+SS_E $$ $$ \begin{aligned} SS_T & = \sum_{i=1}^n(y_i - \mu)^2 \\ & = \sum_{i=1}^n [(y_i -\overline{y}) + (\overline{y}- \mu)]^2 \\ & = \sum_{i=1}^n (y_i -\overline{y})^2 + \sum_{i=1}^n(\overline{y}- \mu)^2 + \sum_{i=1}^n2(y_i -\overline{y})(\overline{y}- \mu)\\ & = \sum_{i=1}^n (y_i -\overline{y})^2 + \sum_{i=1}^n(\overline{y}- \mu)^2 + 2(\overline{y}- \mu)\sum_{i=1}^n (y_i -\overline{y})\\ & = \sum_{i=1}^n (y_i -\overline{y})^2 + \sum_{i=1}^n(\overline{y}- \mu)^2 \\ & = SS_R+SS_E \end{aligned} $$ from $\sum_{i=1}^n(y_i -\overline{y})=0$ 組內變異總和=0 \ ![A_plus_b](https://hackmd.io/_uploads/Sk5RhEbQbe.png)\ 單獨 $(a+b)^2$ 有 $2ab$,$\sum_{i=1}^n$ 讓所有 $2ab$ 互相抵銷。$SS_T=SS_R+SS_E$ 正確,但不直觀 2. **樣本平均變異 $SS_E$ 解釋了 $\frac{1}{n} SS_T$** $$ SS_E \approx \frac{1}{n} SS_T $$ $$ \begin{aligned} SS_E & = \sum_{i=1}^n(\overline{y} - \mu)^2 \\ & = n(\overline{y} - \mu)^2 \\ & = n(\frac{\sum_{i=1}^ny_i}{n} - \mu)^2 \\ & = n(\frac{\sum_{i=1}^ny_i - n\mu}{n})^2 \\ & = n\frac{[(y_1-\mu)+(y_2-\mu)+...+(y_n-\mu)]^2}{n^2} \\ & \approx n\frac{[(y_1-\mu)^2+(y_2-\mu)^2+...+(y_n-\mu)^2]+\sum_{\forall i,j \ i \not = j }(y_i - \mu)(y_j - \mu)}{n^2} \\ & = n\frac{[(y_1-\mu)^2+(y_2-\mu)^2+...+(y_n-\mu)^2]}{n^2} \\ & = n\frac{\sum_{i=1}^n(y_i-\mu)^2}{n^2} \\ & = \frac{1}{n}SS_T \\ \end{aligned} $$ - $\sum_{\forall i,j \ i \not = j }(y_i - \mu)(y_j - \mu)=0$ from every $y_i$ is identically (同母群) and independently distributed (i.i.d.), covariance is zero\ ![covar](https://hackmd.io/_uploads/SJgs2EbQZl.png) - 原本樣本平均解釋的變異 $SS_E$ 就是 $$ n \cdot \frac{[(y_1-\mu)+(y_2-\mu)+...+(y_n-\mu)]^2}{n^2} $$ $\overline y$ 拆成每項 $y_i$,**$y_i$ 總變異加總,還回去多乘的 $n$,平方** = 一項 $SS_E$,共 $n$ 項 \ 因為共變 = 0,變成 $$ n \cdot \frac{[(y_1-\mu)^2+(y_2-\mu)^2+...+(y_n-\mu)^2]}{n^2} $$ 一樣 $(a+b)^2$ 的 $2ab$ 項 = 0,"總變異加總, 還 $n$, 平方" 與 "總變異平方, 還$n^2$, 加總" aka $SS_T / n^2$ 等價 \ 有 $n$ 個 $SS_T / n^2$, 得到 $SS_E \approx \frac{1}{n}SS_T$ - 記 **"樣本平均解釋了 $\frac{1}{n}$ 總變異"** 較直觀 - 為什麼? Ans: **樣本平均 $=y_i$ 加總除上 $\frac{1}{n}$,跟總變異只差 $\frac{1}{n}$ (平方再*n) 嘛** 3. 得證 $$ \begin{aligned} SS_R &= \frac{n-1}{n}SS_T \\ \frac{SS_R}{n-1} &= \frac{SS_T}{n} \\ s_{y(estim.)}^2 &=\sigma^2 \end{aligned} $$ 樣本平均解釋了 $\frac{1}{n}$ 個總變異,樣本內變異剩 $\frac{n-1}{n}$ 個總變異,樣本內變異回推總變異要 $\frac{n}{n-1}$,但變異數 $\sigma^2$ 是"平均變異",所以 $\frac{n}{n-1}\frac{1}{n}=\frac{1}{n-1}$ 記 **"樣本平均解釋了 $\frac{1}{n}$ 總變異**" $\Rightarrow$ "**樣本內變異解釋了 $\frac{n-1}{n}$ 總變異**" $$ \sigma^2 = \frac{n}{n-1}s_y^2 $$ 或許會直觀一些! <!-- 因為 $c_n=a_n+b_ni$ 且 $e^{ix}=\cos x+i\sin x$,每一項 $c_n e^{\frac{i n \pi}{p}x}$ 都能表示為 $$ a_n\cos(\frac{n \pi}{p}x)-b_n \sin (\frac{n \pi}{p}x)+a_n\sin (\frac{n \pi}{p}x)i+b_n\cos(\frac{n \pi}{p}x)i $$ 其中預設 $b_n < 0$ ($c_n$ 累加時用 $e^{-\theta}=\cos\theta - i\sin\theta$ 累加),因此 real part 被 $\{1, \cos(\frac{n \pi}{p}x),\sin(\frac{n \pi}{p}x)\}$ span (已證明), imaginary part 被 $\{-1, -\cos(\frac{n \pi}{p}x),\sin(\frac{n \pi}{p}x)\}$ span (basis scalar 不重要,因此已證明) --> # 不實用數學的直觀證明 Intuitive Proofs of Unused Tools 已經證好了,但後來發現有更簡潔的說明方式,而棄用的證明 這些證明,目前專精 #遊戲設計 #電腦圖學 的大學生還沒實務上用到,等用到才歸類為"實用" ## Euler Number (e) $$ e=\lim_{n\rightarrow\infty}(1+\frac{1}{n})^n $$ - $e$ 的定義,我想理解成: **為了使 $(e^x)'=e^x$ 的數字** 1. 先了解: $\lim_{h\rightarrow0}h = \lim_{n\rightarrow\infty}\frac{1}{n}$ (都趨近、夾向 $0$) 2. 現在,就能從微分定義推倒: $$ \begin{flalign} & (e^x)' \\ & = \lim_{h\rightarrow0}\frac{e^{x+h}-e^x}{h}\\ & = \lim_{h\rightarrow0}\frac{e^x(e^{h}-1)}{h}\\ & = e^x\lim_{h\rightarrow0}\frac{e^{h}-1}{h}\\ & = e^x\lim_{n\rightarrow\infty}\frac{e^{\frac{1}{n}}-1}{\frac{1}{n}}\\ & = e^x\lim_{n\rightarrow\infty}n(e^{\frac{1}{n}}-1)\\ \end{flalign} $$ 3. 我們需要 $\lim_{n\rightarrow\infty}n(e^{\frac{1}{n}}-1)=1$ 的數字,數學家湊出了 $e=\lim_{n\rightarrow\infty}(1+\frac{1}{n})^n$ 能做到!所以*定義* $e=\lim_{n\rightarrow\infty}(1+\frac{1}{n})^n$ 4. 所以理解 $e$ 是**為了使 $(e^x)'=e^x$ 的數字** ## sin'x 與 cos'x Derivative of sinx, cosx $$ \begin{flalign} & \sin'\theta = \cos\theta \\ & \cos'\theta = -\sin\theta \\ \end{flalign} $$ - 證明來源: https://math.stackexchange.com/questions/392/intuitive-understanding-of-the-derivatives-of-sin-x-and-cos-x 0. 先知道: **一個點的切線斜率就是那個點的微分值** - 從定義知道,"微分的值 $f'(x)$" 意義,是「**如果在 $(a, f(a))$ 的變化速率下,x 走 1 單位,y 可以走 $f'(a)$ 單位**」 (除法的概念) $$ f'(a)=\lim_{x\rightarrow a}\frac{f(x)-f(a)}{x-a} $$ ![4wXT0laiFv-urioumzyt8-derivative-by-first-principle](https://hackmd.io/_uploads/SJk99tU_A.gif) - 也知道****所"走"的這條直線在附近不能與原圖有交點**** (不然 $\lim$ 的 $x$ 就不夠"趨近於 $a$") - 圖片來源: https://brilliant.org/wiki/derivative-by-first-principle/ - **所以,這條"所走的直線"會是切線,直線的斜率($\frac{\Delta y}{\Delta x}$)依照微分定義,也會是 $f'(a)$** 1. 靜下心,理解這張有點複雜,但超有幫助的圖: ![image](https://hackmd.io/_uploads/S1Kk7_UdC.png) - $H$ 是 helix,參數方程式為 $<x,y,z>=<\cos\theta,\sin\theta,\theta>$,我們把 $\theta$ 的數值印在 $z$ 軸, 所以 $\frac{d\sin \theta}{d\theta}$ 與 $\frac{d\sin z}{dz}$ 等價,**討論對 $z$ 微分的結果即可** - 因此,**只要知道 $z$ 走 1 單位,也就是 $\Delta z$(灰色線段) 訂為 $1$ 時,$x = \cos z$ 與 $y =\sin z$ 走了多少單位即可** - 找到 $x=\cos z$, $y=\sin z$ 對應的 $\Delta x$(紅色線段) 與 $\Delta y$(綠色線段) 的意義,有兩種解釋方式,選好理解的理解吧: - $\Delta z=1$ 時 $H$ 在點 $P$ 的切線向量為 $\vec{v}$,project 到 $zx$, $zy$, $xy$ 平面,就分別是 $x = \cos z$, $y=\sin z$, $x^2+y^2=1$ 的切線向量,**因此 $<\Delta x, \Delta y>$ 會是 $x^2+y^2=1$ 在 $z=\theta$ 時的切線向量** - 而且因為 $H$ 是以正方形 + 對角線捲成的 ($z=\theta$ 時 $x^2+y^2=1$ 根據 [radian 定義](https://en.wikipedia.org/wiki/Radian),會在周長走 $\theta$ 單位長),**能確定 $\vec{v}$ 也是某個正方形對角線**,又設定 $\Delta z=1$,所以推出剩下另一邊 $||<\Delta x, \Delta y>||=1$ ![image](https://hackmd.io/_uploads/S1fDkwvOC.png) - 圖源: https://demonstrations.wolfram.com/CalculusFreeDerivativesOfSineAndCosine/ - 因為 $x = \cos z$, $y=\sin z$,$(x,y)$ 永遠是單位圓上的點,因此 **$<\Delta x, \Delta y>$ 會是 $x^2+y^2=1$**(單位圓方程式 by 畢氏定理) **在 $z=\theta$ 時的切線向量** (如果不是,$<\Delta x, \Delta y>$ 的延伸會在 $P_{xy}$ 外的點有交點,而那點會有自己的 $\theta'$,如下圖,**這樣代表 $z$ 不夠"趨近於 $\theta$" ,不合 $\sin'z$ 與 $\cos'z$ 在** 0. **提及的微分定義**) ![not_limit_enough](https://hackmd.io/_uploads/SyXodi__R.png) - $||<\Delta x, \Delta y>||=1$ 解釋與第一種的說明類似, $<\Delta x, \Delta y>$ 是切線向量,根據微分定義,切線也能**解釋為在圓上的 $(x,y)$ 變化長度速度 (單位長 per $\theta$)**,又知道 **$\theta$ 就是"走過的圓周長"**,所以 $(x,y)$ 變化長度速度一定極度趨近($\lim$ 等級趨近) $1$ 單位長 per $\theta$,任何 $\neq 1$ 數字都與此矛盾,所以 $||<\Delta x, \Delta y>|| = 1$ - **$(x,y)$ 變化長度速度 = $1$ per $\theta$** 的直觀圖解 & 對應代數證明: ![71723](https://hackmd.io/_uploads/B1Glnwuu0.jpg) - 直觀幾何理解: **$\Delta \theta \rightarrow 0$ 時,直線變化與弧長貼在一起,變一樣了**,根據微分定義, **$(x,y)$ 變化長度速度**(直線 per $\theta$) **與 "走過圓周長"速度**(弧長 per $\theta$, 已知 $=1$) **必須一樣** - 速度就是微分,微分就是微小 $\frac{\Delta l}{\Delta \theta}$,然後發現 $\frac{\Delta l}{\Delta \theta} =1$,所以同樣表示 $(x,y)$ 變化速度,又同樣 $/\Delta \theta$ 的 $<\Delta x, \Delta y>$,長度必 $=1$ - 如果想了解 $\lim_{\Delta \theta \rightarrow 0}\frac{\sin \Delta \theta}{\Delta \theta}=1$ 的證明,參下(小不值觀,但寫得非常易懂): https://math.stackexchange.com/questions/75130/how-to-prove-that-lim-limits-x-to0-frac-sin-xx-1 2. $<\Delta x, \Delta y>$ 是多少?圖解! ![未命名](https://hackmd.io/_uploads/BJhFSPPdC.png) - 用 dot product 概念,或自己畫直角三角形驗證,就很好理解了~ - 因為知道 $||<\Delta x, \Delta y>||=1$,用 dot product 時,能確定垂直向量的長度 3. 知道 $<\Delta x, \Delta y>=<-\sin\theta,\cos\theta>$,就知道 $z$ 走 1 單位 $\cos z$ 與 $\sin z$ 分別走多少單位 (切線斜率 get!),根據 0. "一個點的切線斜率就是那個點的微分值",因此 $\cos'\theta=-\sin \theta$ 與 $\sin \theta = \cos \theta$ 得證 - 一句話總結: **微分結果會是這樣,因為切線斜率 project 到單位圓的切線!** ## Mean Value Theorem - **正常版**: - 在 $(a, f(a))$ 到 $(b, f(b))$ 中間,一定存在一點 $(\xi, f(\xi))$ 的 $f'(\xi)=\frac{f(b)-f(a)}{b-a}$ - 圖解,超直觀: ![image](https://hackmd.io/_uploads/rJ9K4ztuC.png) - 圖源: https://en.wikipedia.org/wiki/Mean_value_theorem - $x=a$ 到 $x=b$ 的過程,$f(x)$ 只能 1. 依著 $\frac{f(b)-f(a)}{b-a}$ 走 2. 相較 $\frac{f(b)-f(a)}{b-a}$ 的路線,先增加再減少(或先減少再增加)。1. 一定符合 theorem, **2. 的切線斜率會先比 $\frac{f(b)-f(a)}{b-a}$ 高(低),為了回 $f(b)$ 之後的切線斜率必須比 $\frac{f(b)-f(a)}{b-a}$ 低(高)**,所以中間一定有切線的斜率 $= \frac{f(b)-f(a)}{b-a}$ - **mean value theorem for integration:** - **在 $a$ 到 $b$ 中間,一定存在一點 $\xi$ 使 $\int_a^bf(x)dx = f(\xi)(b-a)$** - 直觀的圖解: ![image](https://hackmd.io/_uploads/HkeWhd9uC.png) - **$\int_a^bf(x)dx$ 面積在淺綠與深綠長方形之間,虛線長方形也是,總有一組虛線長方形會剛好是 $\int_a^bf(x)dx$** - 圖源: https://en.wikipedia.org/wiki/Mean_value_theorem#First_mean_value_theorem_for_definite_integrals - let $f(m), f(M)$ in $x=[a,b]$ 分別是 $f(x)$ 在 $x=[a,b]$ 中 min 與 Max 值 - 面積的關係: $$ f(m)(b-a) \le \int_a^bf(x)dx \le f(M)(b-a) $$ - 可推 $f$ 函數值(高) 的關係: $$ f(m) \le \frac{\int_a^bf(x)dx}{(b-a)} \le f(M) $$ - 這說明了 $f(m)$ 到 $f(M)$ 之間,***存在***一個數值,乘上 $(b-a)$ 就是 $\int_a^bf(x)dx$ - $f$ 是連續、沒有斷掉的,$f$ 函數值一定要有 $f(m)$ 到 $f(M)$ 之間的所有數字,因此,***存在***的數值($\frac{\int_a^bf(x)dx}{(b-a)}$)也會**存在**於 $f$ 值域 - 所以能令 $\frac{\int_a^bf(x)dx}{(b-a)}=f(\xi)$,$\xi$ 在 $[m,M]$ 就一定在 $[a,b]$ - 使 $\int_a^bf(x)dx = f(\xi)(b-a)$ 的點 $x=\xi$ 得證! ## Fundamental Theorem of Calculus (Part 1) $$ \begin{flalign} &let \: F(x) =\int_a^xf(t)dt \\ &then \: F'(x) = f(x)\\ \end{flalign} $$ - $a$ 為 $x$ 軸上任意一點,$F(x)$ 能解釋為 $f(x)$ 從 $a$ 到 $x$ 曲線底下的面積 - 微分定義中的 $F(x+h)-F(x)$ 能解釋成$\int_x^{x+h}f(t)dt$,相當於下圖粉紅色面積 ![fundamental_theorem_of_calculus](https://hackmd.io/_uploads/rJNmmUcOC.png) - 再根據 mean value theorem for integration,存在 $\xi$ 使 $\int_x^{x+h}f(t)dt = f(\xi) \cdot h$,換句話說: $\frac{\int_x^{x+h}f(t)dt}{h}=f(\xi)$ - $\lim_{h \rightarrow 0}$ 時: - $f(\xi) =f(x)$ by 被 $f(x)$ 與 $f(x+h)$ 夾擠 - $\frac{\int_x^{x+h}f(t)dt}{h}=F'(x)$ by 微分定義 - 所以 $F'(x)=\frac{d\int_a^{x}f(t)dt}{dx}=f(x)$ 得證! - **直觀理解**: **$F'(x)=\frac{微小面積增加量}{微小底增加量}$ 就是高,在 $h \rightarrow 0$ 下就是 $f(x)$** ## i 在指數 i in exponent $$e^{ix}=\cos x + i\sin x$$ - **Intuition: $e^{ix}$ 是轉 $x$ radian in *complex plain*** - 來源: https://www.youtube.com/watch?v=mvmuCPvRoWQ - **"complex plain" 概念與 xy 座標 vector 的 basis 一樣, x(real) 與 y(imaginary) 互不影響,但可以一起組成一個點(數字, 平面平移位置)** - 證明來源: https://www.youtube.com/watch?v=_f_UXJUO1dY&ab_channel=Madaydude + https://chatgpt.com/share/b2878bbc-5bf4-4f8e-aa42-e3c0979434fd + https://chatgpt.com/share/aa620a89-0b9a-4eae-8fd5-cb714903f25f 1. 當 $f_1(0) = f_2(0)$、$f_1'(x) = f_2'(x)$,可推得 $f_1(x)=f_2(x)$ - **直觀理解**: **出發點一樣,變化方式又一樣,那輸入 $x$ 輸出 $f(x)$ 一定一樣**,函式就等價 - 詳細推導: 1. 用一個函數 $G(x)=f_2(x)-f_1(x)$ 紀錄 $f_2$ 與 $f_1$ 的差距 2. 微分: $G'(x)=f_2'(x)-f_1'(x)=0$ by $f_1'(x) = f_2'(x)$ for all $x$ - 因為變化方式一樣,"$f_2$ 與 $f_1$ 的差距"變化速率為 $0$ (永遠不變) 3. $G'(x)=0$ for all $x$,所以只可能 $G(x)=C$,$C$ 是 constant - 從定義看比較清處: $G'(x)=\lim_{h \rightarrow 0}\frac{G(x+h)-G(x)}{h}=0$ for all $x$,因此必須 **$lim_{h \rightarrow 0}G(x+h)=G(x)$ for all $x$**,$G(x)$ 不能因 $x$ 變動而改變 4. 知道 $G(x)=f_2(x)-f_1(x)=C$,又知道 $f_2(0)=f_1(0)$,用 $x=0$ 帶入 $G(x)$ 得出 $C=0$,所以 $f_2(x)-f_1(x)=0$ for all $x$ - "$f_2$ 與 $f_1$ 的差距" 不能變 + 知道一點 $f_1=f_2$,那"差距"只能是 $0$ 了 5. 所以 $f_1(x)=f_2(x)$ for all $x$ 得證! - $f_1$ 與 $f_2$ 在所有 $x$ 下輸出都一樣(差距 $=0$),那 $f_1$ 與 $f_2$ 就是"等價"的 2. 當 $x=0$ 時: $$ \begin{flalign} & e^{ix}= e^{i0} =1 \\ & \cos x + i\sin x = \cos0 + i\sin0 =1 \end{flalign} $$ 得知 $e^{i0} = \cos0 + i\sin0$,**出發點 $f(0)$ 一樣** 3. **變化方式**: $$ \begin{flalign} & (e^{ix})' = i(e^{ix})\\ & (\cos x + i\sin x)' = -\sin x+i\cos x =i(\cos x+i\sin x)\\ \end{flalign} $$ **都是 $f'(x)=if(x)$**,再加上 2.,我們能確認 $(e^{ix})'= (\cos x + i\sin x)'$ - 直觀理解: 記得 **$*i$ 就是往 $i$ 轉 $90^\circ$,所以速度方向永遠垂直半徑方向** - (真正證明要用微分方程,我沒學過,不過 3.是我理解能使用微分方程的原因) 4. 由 1. 的理論與 2. 3. 的證據,得證出 $e^{ix}=\cos x + i\sin x$ 結果! - 直觀上,**左右兩邊都在畫一個單位圓**,所以左右等價~ - 此時: - $e^{i\pi} = -1$ 就能直觀地用幾何理解 - 其他 $x^i$ 也能用 $e^{\lg xi}$ 推廣了