# 向量搜尋與Embedding Model的進階應用 - 後端里長伯 {%hackmd @JSDC2024/INuUpOqWS42gD1_pz5S4Bg %} Slido: https://app.sli.do/event/f8uzarVcVdB1NJYU4rYzap > 開始做筆記 ![image](https://hackmd.io/_uploads/HyLTchQS1g.png) vector - 特徵 - 同概念的會放在附近 - 類似關係的距離,在其他群也是 - 具備了抽象化 不同場景有不同的向量化應用: ![image](https://hackmd.io/_uploads/ryqUj3Xr1g.png) ## 最鄰近問題 Nearest neighbor problem ### 最鄰近(搜索)算法 - 暴力演算法 - ANN 近似最鄰近查找(質量與速度取得平衡) - approximate-nearest-neighbor-search 各種演算法 ![image](https://hackmd.io/_uploads/H1KCihXByg.png) ## index 使用的取捨考量 - 速度 - 質量 - 空間(省記憶體空間) ![image](https://hackmd.io/_uploads/SJlW3nmSJg.png) 使用者 ![image](https://hackmd.io/_uploads/S1gm23QHkg.png) ## 六人理論 ![截圖 2024-12-21 上午11.55.46](https://hackmd.io/_uploads/HJo9337Skg.png) ![image](https://hackmd.io/_uploads/rk6OnnXS1g.png) ![image](https://hackmd.io/_uploads/B10snh7Skg.png) HSNW - 犧牲很多記憶體空間 ## 關鍵字 vs 語意 搜尋 ![截圖 2024-12-21 上午11.59.39](https://hackmd.io/_uploads/SJGBThXrkl.png) ![截圖 2024-12-21 下午12.00.49](https://hackmd.io/_uploads/HyD2TnmByx.png) ![截圖 2024-12-21 下午12.01.17](https://hackmd.io/_uploads/HyZbC2mHye.png) 關鍵字 萃取關鍵字 - `ts_vector` in Postgres - Gin type index - Entry Tree - Posting Tree RAG ![截圖 2024-12-21 下午12.02.04](https://hackmd.io/_uploads/rkAbCh7rke.png) CLIP Model ![image](https://hackmd.io/_uploads/BkXZA3QHyx.png) 文字,圖片,影像,訓練到同一個 Model 中 ![image](https://hackmd.io/_uploads/BJhrAhmrJl.png) ![image](https://hackmd.io/_uploads/H1oc02XBkx.png) ## ImageBind * https://github.com/facebookresearch/ImageBind Demo website: https://imagebind.metademolab.com/demo 後端里長伯 IG: https://www.instagram.com/hohshen.backend > 聊天區 >