# Similarity Metrics --- ## Floating point embeddings(浮點數) 1. Euclidean distance (L2) * 輾轉相除法:是求最大公因數的算法 * ![euclidean_metric](https://hackmd.io/_uploads/BkTF1wLFT.png) * 是最常用的距離度量,當資料連續時非常有用。 > [輾轉相除法-維基百科](https://zh.wikipedia.org/zh-tw/%E8%BC%BE%E8%BD%89%E7%9B%B8%E9%99%A4%E6%B3%95) 2. Inner product (IP) * 內積 * ![IP_formula](https://hackmd.io/_uploads/Hk0iewIY6.png) * 如果您需要比較「非標準化資料』或「關心幅度和角度」時,使用內積會更有用 3. Cosine Similarity * 餘弦相似度始終在區間[-1, 1]內。 * ![cosine_similarity](https://hackmd.io/_uploads/H14JYcwtp.png) * 兩個比例向量的餘弦相似度為1,兩個正交向量的相似度為0,兩個相反的向量的相似度為-1。餘弦越大,兩個向量之間的角度越小,表示這兩個向量彼此更相似。 4. Search Parameters ![image](https://hackmd.io/_uploads/Sy5lj2DYT.png) * Metric Type:為資料建置時就已設定好,當搜尋時無法修改。(有L2、IP、Cosine 可以選擇) * nprobe: Milvus 中搜索過程中用於查找最近鄰居的參數。表示在索引中進行查找的時候,Milvus 將同時搜索的個數。增加 nprobe 可以提高搜索的準確性,但同時會增加搜索的時間和計算成本。 * radius: 在搜索過程中,radius 表示搜索區域的半徑範圍,系統將返回落在這個半徑範圍內的向量。 * range filter: 是一種過濾機制,用於過濾出符合特定範圍條件的向量。當進行搜索時,可以使用 range filter 來指定搜索結果中所需向量的範圍。這有助於縮小搜索範圍,提高搜索效率。 * round: 四捨五入或調整計算的數值。 --- ## Binary embeddings(二進位) * 目前未使用 --- > [Similarity Metrics 介紹](https://milvus.io/docs/metric.md#floating --- # LOG分群,分析 1. 如何將LOG 取特徵值。 2. pnrLocator、operation、 --- # EAI 與 AORS CORE API Response 比較 1. 等候AORS CORE API規格與EAI拉齊後,需要對2個API的Response 進行比較,比對出差異性。 ---