# 壓縮方法 $Compress$ **1. 分群** 將每個要被壓縮的實體($\mathbf{e}_i$) 表示為高維度向量 $\mathbf{v}_i \in \mathbb{R}^h$。使用 K-means 聚類算法將這些向量分成 $num=10$ 個群,最小化群內平方和(WCSS): $$ \text{WCSS} = \sum_{j=1}^{10} \sum_{\mathbf{v}_i \in C_j} \|\mathbf{v}_i - \mathbf{\mu}_j\|^2 $$ 其中,$C_j$ 表示第 $j$ 個群,$\mathbf{\mu}_j$ 是第 $j$ 個群的質心: $$ \mathbf{\mu}_j = \frac{1}{|C_j|} \sum_{\mathbf{v}_i \in C_j} \mathbf{v}_i $$ $$ E_j = \{e_i \mid \mathbf{v}_i \in C_j\} $$ **2. 隨機抽取** 從集合 $E_j$ 中隨機選擇數個實體 $\mathbf{e}_k$ 作為該群的代表: $$ \{e_k\} \in E_j $$