_(Under Construction)_ ## **Intuition** 對於任意的一個集合 $X$,也就是一堆東西(不一定要是數字),舉凡$$\{a,b,c\},\{\text{all taiwanese}\},\{\text{golden retriever}, \text{husky}\}$$ 之類的,我們想要知道裡面兩個元素的「差距」,也就是**距離**。 在數線上的兩個數,我們已經有一個熟悉的距離概念,像是 $1$ 與 $5$ 的距離是 $|1-5|=4$,而 $1$ 跟 $1$ 的距離是 $|1-1|=0$,這樣的確代表了一種**測量差距**的方法,但有沒有其他度量的方式呢? 針對不同的集合,我們可以定出不同的度量方法,來更好地體現出該集合中不同元素的差距。 ### *String Metric* 考慮所有長度為 $5$ 的英文單字,例如 `apple` `lemon` `guava` 等等,我們有什麼方法丈量任兩個單字之間的差距? 我們考慮 **「字母不同的位置有幾個」**,比如,`horse` 和 `morse` 只有第一個字母相異,所以距離是 $1$,但 `horse` 和 `torch` 僅有兩個位置相同,所以距離是 $3$。 這樣的距離定法符合我們對於**距離**的直覺,兩個單字越不一樣,差得越多,距離就越長,兩個單字只有完全一樣,距離才是 $0$。 ### *Chessboard* 考慮如下的棋盤,我們想要定義兩個棋子之間的距離,在這種情況下,與其關心拿尺量到的直線距離,我們也許比較想知道「一個棋子到另一個棋子要走幾步」,假設每一步棋子都只能移動一格,那麼我們可以把距離定成「$A$ 最短要走幾步才能到 $B$」,我們可以發現這兩個棋子差了 $7$ 格的距離。 這樣的距離是**對稱的**,因為如果 $A$ 到 $B$ 最短要走 $7$ 步,那麼 $B$ 到 $A$ 最短也是 $7$ 步,符合我們對於距離的直覺。 <center> ![](https://hackmd.io/_uploads/HJwnBP2d3.jpg =40%x) </center> 這樣的定義也符合我們的另一個概念,就是「繞路不會比較短」,如果今天先從 $A$ 走到 $C$,再從 $C$ 走到 $B$,總距離是 $5+4=9$,不會比直接從 $A$ 到 $B$ 還短。 ## **Definition** 什麼是「合理的」距離?我們對距離有幾個自然的要求。 用 $d(x,y)$ 表示 $x$ 到 $y$ 的距離 $(x,y\in X)$,那它要滿足下列四個定義: 1. 自己到自己的距離是零 $$d(x, x)=0$$ 2. 跟別人的距離都是正的 $$d(x, y)>0~~~\text{if}~~~x\neq y$$ 3. **我到你的距離**跟**你到我的距離**一樣 $$d(x,y)=d(y,x)$$ 4. 兩點之間的**直線距離**最短 $$d(x,y)\leq d(x,z)+d(z,y)~~~\forall z\in X$$ 第四點又叫 _三角不等式 Triangle Inequality_,如果今天從 $x$ 走到 $z$,再從 $z$ 走到 $y$,不會比直接從 $x$ 走到 $y$ 還短。 一旦滿足上面的條件,這個函數 $d$ 就可以稱為 $X$ 上的一個 _度量 Metric_,$X$ 上的元素 $x,y$ 就可以利用 $d(x,y)$ 來得到它們的距離,那麼,$X$ 搭配 $d$(記作 $(X,d)$) 就是一個「賦有距離概念」的空間,也就是 _賦距空間 Metric Space_。 ## **Example** ### *Euclidean Distance* - 在數線 $\mathbb{R}$ 上,兩點 $x$ 和 $y$ 的**最直覺的**距離是 $d(x,y)=|x-y\hspace{0.5pt}|$,$(\mathbb{R},d)$ 是一個賦距空間。 - 在平面 $\mathbb{R}^2$上,兩點 $\mathbf{x}=(x_1,x_2)$ 和 $\mathbf{y}=(y_1,y_2)$ 的**最直覺的**距離是 $$||\hspace{.5pt}\mathbf{x}-\mathbf{y}\hspace{.5pt}||_2=\sqrt{(x_1-y_1)^2+(x_2-y_2)^2}$$ 可以檢查函數 $d(\mathbf{x},\mathbf{y})=||\hspace{.5pt}\mathbf{x}-\mathbf{y}\hspace{.5pt}||_2$ 的確是一個度量,所以 $(\mathbb{R}^2,d)$ 也是一個賦距空間。 ### *Discrete Metric* - 也有比較不直覺的距離,定 $$ d(x,y)=\begin{cases} 1,&x\neq y\\ 0,&x=y \end{cases} $$ 意即,我跟其他人的距離都是 $1$,和自己的距離是 $0$,為什麼這個距離稱為 _discrete(離散)_? 這個度量只把點分成**相同**或**相異**,只要相異,距離便都定為 $1$,這樣的定法沒有遠近的分別,除了和自己以外,和其他人的距離不會是 $0.5$,不會是 $1.2$,只會是 $1$,因此這個度量不是**連續**的,而是**離散**的。 ## ***Thinkings*** - _Discrete metric_ 真的符合 _metric_ 的四個條件嗎? - 如果在平面 $\mathbb{R}^2$上定的距離為$$ d(\mathbf{x},\mathbf{y})=\max\{|x_1-y_1|,|x_2-y_2|\} $$(其中 $\mathbf{x}=(x_1,x_2),\mathbf{y}=(y_1,y_2)$) 那麼**單位圓**(跟原點「距離」為 $1$ 的所有點形成的圖形)會長怎樣?