生物多樣性的估計量整理（中）：β 多樣性

--- image: https://ecointelligent.files.wordpress.com/2016/10/alpha-e1588253347171.png --- # 生物多樣性的估計量整理（中）：β 多樣性 ###### tags: `生態學` `學習筆記` :::info :::spoiler {state="open"} 題次 [TOC] ::: 承接上一篇〈[生物多樣性的估計量整理（上）：緒論與 α 多樣性](/0A2fYK8ySZqItqJ15ZLZGA)〉，這邊整理的是常用的 β 多樣性估計量。 β 多樣性主要探討在同時間的不同群集之間，或者某群集在不同時間的差異有多大，因此許多量化群集間的差異程度（differentiation）、相似程度（similarity）、重複程度（overlap）或轉換程度（turnover）方法被用以估計 β 多樣性；除此之外，自 Whittaker (1960) 將生物多樣性拆分成 α、β 與 γ 三層次之後，通過分解生物多樣性，也可以利用已知的 α 與 γ 多樣性來分解、轉換出 β 多樣性估計量。 # 群集間的多樣性：β diversity estimators β 多樣性估計量可以表示各個地區群集間的差異。與 α 多樣性類似，β 多樣性的評估大致上也分為只考慮物種數（richness）與同時考慮物種數與各物種個體充裕度（abundance）差異的估計量。好的 β 多樣性估計量要具有單調性（monotonicity），在兩個相同的的任一個群集中加入新的物種，β 多樣性估計量值會上升；好的 β 多樣性估計量也只和物種的相對數量有關，不因絕對數量的增減而有所不同。 ## 呈現物種豐富度（定性估計） ### Jaccard 相似度指數[^1] 考慮的是不同群集中的共同物種數，佔群集的**所有物種數**比例： $$S_j=\frac{S_{12}}{S_1+S_2-S_{12}}$$ ### Sørenson 相似度指數[^2] 考慮的是不同群集中的共同物種數，佔群集的**平均物種數**比例： $$S_ø=\frac{2S_{12}}{S_1+S_2}$$ Sørenson 相似度指數與 Jaccard 相似度指數相比，給予共同出現的物種更大的權重。但是如果其中一個群集的出現物種完全被令一個群集所涵蓋時，Sørenson 指數會受到物種數比較多那個群集的特有物種影響，使得估計量變小。而趙蓮菊老師之後把這兩個豐富度中的參數進行推廣[^3]：令群集 1 中共同物種相對豐富度的總和 $U$，群集 2 中共同物種相對豐富度的總和 $V$。如此一來 Jaccard 相似度指數表示為 $\frac{UV}{U+V-UV}$，解釋為從 2 群集各取 1 個體，在至少有 1 個體是共同種的條件下，此 2 個體都是共同種的機率；而 Sørenson 相似度指數表示為 $\frac{2UV}{U+V}$，解釋為從 2 群集各取 1 個體，在平均有至少 1 個體是共同種的條件下，此 2 個體都是共同種的機率。 ### Lenon 相似度指數 Lenon 等人 (2001)[^9] 為了改善 Sørenson 相似度指數的缺點，提出新的相似度指數： $$S_L=\frac{S_{12}}{S_{12}+min(S_1-S_{12},S_2-S_{12})}$$ 此修改有效避免兩個群集之間物種數差異很大的時後，Sørenson 相似度指數受到影響的情況。之後趙蓮菊老師也將此指數推廣為$\frac{UV}{min(U,V)}=MAX(U,V)$。 ## 同時考慮豐富度與均勻度（定量估計） ### Bray–Curtis 相似度指數[^10] Bray 與 Curtis (1957) 基於 Sørenson 相似度指數提出了量化方法： $$C_{BC}=\frac{\displaystyle\sum_{i=1}^{D_{12}}min(x_i,y_i)}{\frac{1}{2}\left(\displaystyle\sum_{i=1}^{S_1}x_i+\displaystyle\sum_{i=1}^{S_2}y_i\right)}$$ $x_i$ 與 $y_i$ 代表 X 與 Y 群集出現的第 $i$ 個物種個體數比率，當不考慮充裕度（abundance）時，此指數即等同於 Sørenson 相似度指數。 ### Morisita 重疊度指數[^4] Morisita 在 1959 年提出了重疊度指數，可以計算二群集中相同物種重疊的程度： $$C_M=\frac{\displaystyle\sum_{i=1}^{S_{12}}p_i\pi_i} {\frac{1}{2}\left(\displaystyle\sum_{i=1}^{S_1}p_i\displaystyle\sum_{i=1}^{S_2}\pi_i\right)}$$ 這個指數使用個物種在群集中的個體數比率進行計算，不過計算出來的結果偏差較大，所以之後受到修正。 ### Morisita-Horn 重疊度指數[^5] Horn (1966) 修正 Morisita 的指數，限制偏差值，也引入 Simpson 指數的估計方法，透過計算單一群集與群集間平均值的差異得到重疊度，所以較強調群集中普遍種的相似程度： $$ C_{MH}=\frac{2\displaystyle\sum_{i=1}^{S_{12}}x_iy_i}{(D_x+D_y)XY}$$ $x_i$ 與 $y_i$ 代表 X 與 Y 群集出現的第 $i$ 個物種個體數佔群集總個體數 $X$ 與 $Y$ 的比率，$D_x$ 與 $D_y$ 代表 X 與 Y 群集的 Simpson 指數。有些人使用 $\sum_{i=1}^{S}\frac{n_i(n_i-1)}{N(N-1)}$，不過這裡使用 $\sum_{i=1}^{S}\frac{n_i^2}{N^2}$ 即可。與 Simpson 指數類似，此式分子代表在兩個群集中分別隨機抽取一個體，二個體是相同物種的機率，而分母代表在個別群集中隨機抽取二個體是相同物種的機率。如同 Simpson 指數，Morista-Horn 指數強調群集中的常見物種，如果數值高可能代表兩的群集間的物種數量分布雷同，或者有少數的常見種為共同種，或者有許多稀有物種是兩群集所共有的。 ### Horn 重疊度指數 Horn (1966) 亦發展了基於 Shonnon 熵概念的重疊度指數 $P_o=\frac{H_{max}-H{obs}}{H_{max}-H{min}}$，$H_{max}$ 是兩群集沒有共同物種時的 Shonon 熵、$H_{min}$ 是兩群集有最多共同物種時的 Shonon 熵、$H_{obs}$ 就是兩群集實際共同物種的 Shonnon 熵，經過整理之後成為下式： $$C_H=\frac{\left(-\sum_{i=1}^{S}\overline{p}_i\ln{\overline{p}_i}\right) -\left(-\sum_{j=1}^{2}\sum_{i=1}^{S}p_{ij}\ln{p_{ij}}\right)}{\ln{2}}$$ 其中 $\overline{p}_i=\sum_{i=1}^{S}\frac{p_{ij}}{2}$，$p_{ij}$ 表示群落 $j$ 中物種 $i$ 的相對豐富度。式子中 $j=1,2$ 時；代表的是 $p_{i1}$ 與 $p_{i2}\ , i=1,2,...,S$，分別表示兩群集中第 1 到第 $S$ 物種的相對豐富度。比起 Morista-Horn 指數，Horn 指數就沒有那麼強調常見物種了。 ### $C_{qN}$ 指數曲線上述方法都只比較兩個群集。那如果需要計算多個群集的 β 多樣性指數要怎麼辦呢？趙蓮菊老師利用兩階段抽樣機率的概念，把 Morisita-Horn 指數推廣到多個群集[^6]，表示如下： $$C_{qN}=\frac{\frac{1}{N^q-N}\left(\sum_{i=1}^{S}\left(\sum_{i=1}^{N}p_{ij}\right)^q- \sum_{i=1}^{S}\sum_{j=1}^{N}p_{ij}^q\right)} {\frac{1}{N}\sum_{i=1}^{S}\sum_{j=1}^{N}p_{ij}^{q}}$$ 其中足標的 $_N$ 表示要比較的群集數量，$_q$ 表示對於相對豐富度的偏好程度（如同 Hill numbers，$_q$ 值越高越偏好常見種）。當 $N=2$ 而 $q=0,\ 1,\ 2$ 時，這個指標曲線可以分別對應到 Sørensen、Horn 與 Morisita 指標，就像 Hill numbers = 0, 1, 2 時分別對應到物種數、Shanon 熵與 Simpson 指數的轉換值一樣。相較於計算單一的指數，透過 $C_{qN}$ 指數曲線，我們得以更充分地描述多個物種群集間生物多樣性的相似程度。 # 不同層次生物多樣性估計量的分解 Whittaker 把生物多樣性分為 α、β、γ 三層次之後，提出了三者之間的關係可以乘法分解：$\gamma=\alpha\times\beta$，γ 與 α 多樣性的差別就在於尺度的大小（整個區域群集或單一群集的多樣性）。在這個想法下，β 多樣性就被當作詮釋對於整個區域而言，不同群集多樣性的差異（γ 與 α 的比值）。之後，Lande (1996) 提出了不同的方法，定義 α 多樣性定義為各群集內多樣性的加權平均（variance within groups）、β 多樣性為各群集間多樣性的變異（variance between groups），所以 γ 多樣性就是合計所有組內與組間的整體變異（total variance）。這三個名詞如果有做過變異數分析（ANOVA）應該會覺得耳熟，Lande 提出的多樣性分解方法，就是將三個多樣性指數，透過類似 ANOVA 的方式分解，為加法分解：$\gamma=\alpha+\beta$。隨著學者漸漸接受**有效物種數才是群集真正的多樣性**，所以有效物種數的概念，就被加入多樣性的乘法與加法分解之中，各具意義：在乘法分解中，γ 多樣性表示大區域所有群集的有效物種數、α 多樣性定義為各群集有效物種數的平均、β 多樣性就成為有效群集數；而加法分解中的 β 多樣性，就成為關注某一群集時所忽略的有效物種數。 ## Jost 的生物多樣性估計量 Jost (2007) 針對三種多樣性，整理出了 5 個重要的公設[^7]如下： :::success 1. **α 與 β 多樣性彼此獨立** 在生態系統中，針對不同目標的估計值必須彼此獨立，在這個前提下，α 與 β 多樣性的大小不應該互相影響。 2. **不同區域的生物多樣性估計量可以互相比較** 不管針對 α、β 或者 γ 多樣性進行估計，不同區域的相同層次生物多樣性估計量都要能夠互相比較；相同的生物多樣性估計量值也要可以描述相同的生物多樣性程度。 3. **α 多樣性是各群集內多樣性的平均值** 如果一個區域內的所有群集 α 多樣性都相同，那這個區域的 α 多樣性估計量值也要維持相同；α 多樣性就是該區域各群集的多樣性在某種形式上的平均。 4. **γ 須為 α、β 所決定** 如同上個段落的生物多樣性分解，在一區域中，α、β、γ 必然有著某種形式的關係，例如加法或乘法分解關係。 5. **γ 必然大於 α 多樣性** γ 多樣性探討區域內各物種的多樣性，所包含的訊息不可能比 α 多樣性的估計值還少。 ::: 依據該 5 項公設，Jost 利用 Hill number 搭配乘法分解，從 γ 與 α 多樣性中分解出 β 多樣性，表示如下： $$\begin{split} &^qD_\alpha=\left[\frac{\sum_{i=1}{S}p_{i1}^q+\sum_{i=1}{S}p_{i2}^q+...+\sum_{i=1}{S}p_{iN}^q} {N}\right]^{\frac{1}{1-q}}\\ &^qD_\gamma=\left[\displaystyle\sum_{i=1}^{S}\left(\frac{p_{i1}+p_{i2}+...p_{iN}} {N}\right)^q\right]^{\frac{1}{1-q}}\\ \ \\ &^qD_\beta={^qD_\gamma}/{^qD_\alpha}\\ \end{split}$$ 其中$p_{ij}$ 表示群集 $j$ 中物種 $i$ 的相對豐富度；$j=1,2,...,N;\ i=1,2,...,S$，簡單來說，就是把每個群集中的每個物種的相對豐富度都列出來的意思。如同一開始提到的，β 多樣性的內涵包括差異程度、相似程度、重複程度或轉換程度，再由 β 多樣性與群集的差異正相關，與群集相似度負相關，經過形式運算的轉換與標準化後，另外得出轉換—互補（turnover-complement）指數、同質性（homogeneity）指數與局部重複（local-overlap）指數：轉換—互補指數：$\frac{N-^qD_\beta}{N-1}$ 同質性指數：$\frac{1/^qD_\beta-1/N}{1-(1/N)}$ 局部重複指數：$\frac{(1/^qD_\beta)^{q-1}-(1/N)^{q-1}}{1-(1-N)^{q-1}}$ ，後來發現此指數與 $C_{qN}$ 指數等價其中，轉換—互補指數在 $q=2$ 時，便等同於 Chiu 等人 (2013) 提出的區域重複（regional-overlap）指數[^8]：$\frac{(1/^qD_\beta)^{1-q}-(1/N)^{1-q}}{1-(1-N)^{1-q}}$ （指數的部分為 $1-q$，與局部重複指數不同）透過 $q$ 的階層不同，Jost 與 Chiu 的這些指數可以轉換為上文提到的幾種 β 多樣性指數： | | 轉換—互補指數 | 同質性指數 | 局部重複指數 | 區域重複指數 | |:-:| :-----------: | :-------: | :----------: | :----------: | | $q=0$ | Sørenson 相似度 | Jaccard 相似度 | Sørenson 相似度 | Jaccard 相似度 | | $q=1$ ||| Horn 重疊度 | Horn 重疊度 | | $q=2$ | **區域重複指數** | Morisita-Horn 重疊度 | Morisita-Horn 重疊度 | **區域重複指數** | 整理到這邊，大概把趙蓮菊老師文章中的 α 與 β 多樣性整理完畢。之前常在比較植物群集的文章中看到作者使用 Horn 與 Morisita-Horn 重疊度指數比較兩個植群組成的異同程度；如果有多個群集需要比較，則需要做出一張比較兩兩群集的重疊度指數矩陣。如果要計算區域中所有群集的差異程度，那趙老師的 $C_{qN}$ 與 Jost 提出的一系列估計量就可以拿來用了。若要視覺化與比較區域中不同局部的多樣性異同，也有許多人引入距離的概念，使用如 Jacard、Bray-curtis 或者 UniFrac 計算出距離矩陣，後續可以用 UPGMA 或其他方法繪出聚類分析樹；也有人運用多變量分析中的排序方法如 MDS（PCoA）或 NMDS 來呈現不同群集間組成的近似程度，且搭配如 adonis 或 ANOSIM 等統計檢定來分析不同局部群集分組間的組成是否顯著。 ![image](https://hackmd.io/_uploads/SJU5dK6bZx.png) 使用 Jaccard 距離計算出距離矩陣後，以 MDS 呈現的不同飲食法腸道菌相差別。取自 Safari, Z., Bruneau, A., Monnoye, M., Mariadassou, M., Philippe, C., Zatloukal, K., & Gérard, P. (2020). Murine genetic background overcomes gut microbiota changes to explain metabolic response to high-fat diet. *Nutrients*, *12*(2), 287. 不過單純計算群集之內、之間的多樣性，未考慮各物種間親緣關係的遠近，顯然無法滿足某些生態／統計學家，這個系列的最後一篇〈[生物多樣性的估計量整理（下）：親緣關係多樣性（系統演化多樣性）](/JM40uw5oTD6FmDJ2Yne60A)〉就整理了後續發展出一系列包含親緣關係思考的估計量可供參考。另外還有其他的指數，可以參考這篇古生物學多樣性估計工具 tabula 套件作者所撰寫的 [Diversity Measures](https://cran.r-project.org/web/packages/tabula/vignettes/diversity.html)。 <span style="font-size:30px">🐕‍🦺</span><font color="dcdcdc">2023.01.20</font> [^1]: Jaccard, P. (1902) Lois de destributionflorale dans la zone alpine. *Bulletin Société Vaudoise des Sciences Naturelles*, *38*, 69-130. [^2]:Sørenson, T. (1948) A Method of Establishing Groups of Equal Amplitudes in Plant Sociology Based on Similarity of Species Content and Its Application to Analyses of the Vegetation on Danish Commons. *Kongelige Danske Videnskabernes Selskab, Biologiske Skrifter*, *5*, 1-34. [^3]: Chao, A. (2005). A new statistical approach for assessing compositional similarity based on incidence and abundance data. *Ecology Letters*, *8*(2), 148-159. doi: [10.1111/j.1461-0248.2004.00707.x](https://doi.org/10.1111/j.1461-0248.2004.00707.x) [^4]: Morisita, M. (1959). Measuring of interspecific association and similarity between communities. *Memoirs Faculty of Science, Kyushu University. Series E*. (*Biology*), *3*, 65-80. [^5]: Horn, H. S. (1966). Measurement of "overlap" in comparative ecological studies. *The American Naturalist*, *100*(914), 419-424. [^6]: Chao, A., Jost, L., Chiang, S. C., Jiang, Y. H., & Chazdon, R. L. (2008). A two‐stage probabilistic approach to multiple‐community similarity indices. *Biometrics*, *64*(4), 1178-1186. [^7]: Jost, L. (2007). Partitioning diversity into independent alpha and beta components. *Ecology*, *88*(10), 2427-2439. [^8]: Chiu, C. H., Jost, L., & Chao, A. (2014). Phylogenetic beta diversity, similarity, and differentiation measures based on Hill numbers. *Ecological Monographs*, *84*(1), 21-44. [^9]: Lennon, J. J., Koleff, P., Greenwood, J. J. D., & Gaston, K. J. (2001). The geographical structure of British bird distributions: diversity, spatial turnover and scale. *Journal of Animal Ecology*, *70*(6), 966-979. [^10]: Bray, J. R., & Curtis, J. T. (1957). An ordination of the upland forest communities of southern Wisconsin. *Ecological monographs*, *27*(4), 326-349.