---
image: https://ecointelligent.files.wordpress.com/2016/10/alpha-e1588253347171.png
---
# 生物多樣性的估計量整理(中):β 多樣性
###### tags: `生態學` `學習筆記`
:::info
:::spoiler {state="open"} 題次
[TOC]
:::
承接上一篇〈[生物多樣性的估計量整理(上):緒論與 α 多樣性](/0A2fYK8ySZqItqJ15ZLZGA)〉,這邊整理的是常用的 β 多樣性估計量。
β 多樣性主要探討在同時間的不同群集之間,或者某群集在不同時間的差異有多大,因此許多量化群集間的差異程度(differentiation)、相似程度(similarity)、重複程度(overlap)或轉換程度(turnover)方法被用以估計 β 多樣性;除此之外,自 Whittaker (1960) 將生物多樣性拆分成 α、β 與 γ 三層次之後,通過分解生物多樣性,也可以利用已知的 α 與 γ 多樣性來分解、轉換出 β 多樣性估計量。
# 群集間的多樣性:β diversity estimators
β 多樣性估計量可以表示各個地區群集間的差異。與 α 多樣性類似,β 多樣性的評估大致上也分為只考慮物種數(richness)與同時考慮物種數與各物種個體充裕度(abundance)差異的估計量。
好的 β 多樣性估計量要具有單調性(monotonicity),在兩個相同的的任一個群集中加入新的物種,β 多樣性估計量值會上升;好的 β 多樣性估計量也只和物種的相對數量有關,不因絕對數量的增減而有所不同。
## 呈現物種豐富度(定性估計)
### Jaccard 相似度指數[^1]
考慮的是不同群集中的共同物種數,佔群集的**所有物種數**比例:
$$S_j=\frac{S_{12}}{S_1+S_2-S_{12}}$$
### Sørenson 相似度指數[^2]
考慮的是不同群集中的共同物種數,佔群集的**平均物種數**比例:
$$S_ø=\frac{2S_{12}}{S_1+S_2}$$
Sørenson 相似度指數與 Jaccard 相似度指數相比,給予共同出現的物種更大的權重。
但是如果其中一個群集的出現物種完全被令一個群集所涵蓋時,Sørenson 指數會受到物種樹比較多那個群集的特有物種影響,使得估計量變小。
而趙蓮菊老師之後把這兩個豐富度中的參數進行推廣[^3]:令群集 1 中共同物種相對豐富度的總和 $U$,群集 2 中共同物種相對豐富度的總和 $V$。如此一來 Jaccard 相似度指數表示為 $\frac{UV}{U+V-UV}$,解釋為從 2 群集各取 1 個體,在至少有 1 個體是共同種的條件下,此 2 個體都是共同種的機率;而 Sørenson 相似度指數表示為 $\frac{2UV}{U+V}$,解釋為從 2 群集各取 1 個體,在平均有至少 1 個體是共同種的條件下,此 2 個體都是共同種的機率。
### Lenon 相似度指數
Lenon 等人 (2001)[^9] 為了改善 Sørenson 相似度指數的缺點,提出新的相似度指數:
$$S_L=\frac{S_{12}}{S_{12}+min(S_1-S_{12},S_2-S_{12})}$$
此修改有效避免兩個群集之間物種數差異很大的時後,Sørenson 相似度指數受到影響的情況。之後趙蓮菊老師也將此指數推廣為$\frac{UV}{min(U,V)}=MAX(U,V)$。
## 同時考慮豐富度與均勻度(定量估計)
### Bray–Curtis 相似度指數[^10]
Bray 與 Curtis (1957) 基於 Sørenson 相似度指數提出了量化方法:
$$C_{BC}=\frac{\displaystyle\sum_{i=1}^{D_{12}}min(x_i,y_i)}{\frac{1}{2}\left(\displaystyle\sum_{i=1}^{S_1}x_i+\displaystyle\sum_{i=1}^{S_2}y_i\right)}$$
$x_i$ 與 $y_i$ 代表 X 與 Y 群集出現的第 $i$ 個物種個體數比率,當不考慮充裕度(abundance)時,此指數即等同於 Sørenson 相似度指數。
### Morisita 重疊度指數[^4]
Morisita 在 1959 年提出了重疊度指數,可以計算二群集中相同物種重疊的程度:
$$C_M=\frac{\displaystyle\sum_{i=1}^{S_{12}}p_i\pi_i}
{\frac{1}{2}\left(\displaystyle\sum_{i=1}^{S_1}p_i\displaystyle\sum_{i=1}^{S_2}\pi_i\right)}$$
這個指數使用個物種在群集中的個體數比率進行計算,不過計算出來的結果偏差較大,所以之後受到修正。
### Morisita-Horn 重疊度指數[^5]
Horn (1966) 修正 Morisita 的指數,限制偏差值,也引入 Simpson 指數的估計方法,透過計算單一群集與群集間平均值的差異得到重疊度,所以較強調群集中普遍種的相似程度:
$$
C_{MH}=\frac{2\displaystyle\sum_{i=1}^{S_{12}}x_iy_i}{(D_x+D_y)XY}$$
$x_i$ 與 $y_i$ 代表 X 與 Y 群集出現的第 $i$ 個物種個體數佔群集總個體數 $X$ 與 $Y$ 的比率,$D_x$ 與 $D_y$ 代表 X 與 Y 群集的 Simpson 指數。有些人使用 $\sum_{i=1}^{S}\frac{n_i(n_i-1)}{N(N-1)}$,不過這裡使用 $\sum_{i=1}^{S}\frac{n_i^2}{N^2}$ 即可。
與 Simpson 指數類似,此式分子代表在兩個群集中分別隨機抽取一個體,二個體是相同物種的機率,而分母代表在個別群集中隨機抽取二個體是相同物種的機率。如同 Simpson 指數,Morista-Horn 指數強調群集中的常見物種,如果數值高可能代表兩的群集間的物種數量分布雷同,或者有少數的常見種為共同種,或者有許多稀有物種是兩群集所共有的。
### Horn 重疊度指數
Horn (1966) 亦發展了基於 Shonnon 熵概念的重疊度指數 $P_o=\frac{H_{max}-H{obs}}{H_{max}-H{min}}$,$H_{max}$ 是兩群集沒有共同物種時的 Shonon 熵、$H_{min}$ 是兩群集有最多共同物種時的 Shonon 熵、$H_{obs}$ 就是兩群集實際共同物種的 Shonnon 熵,經過整理之後成為下式:
$$C_H=\frac{\left(-\sum_{i=1}^{S}\overline{p}_i\ln{\overline{p}_i}\right)
-\left(-\sum_{j=1}^{2}\sum_{i=1}^{S}p_{ij}\ln{p_{ij}}\right)}{\ln{2}}$$
其中 $\overline{p}_i=\sum_{i=1}^{S}\frac{p_{ij}}{2}$,$p_{ij}$ 表示群落 $j$ 中物種 $i$ 的相對豐富度。式子中 $j=1,2$ 時;代表的是 $p_{i1}$ 與 $p_{i2}\ , i=1,2,...,S$,分別表示兩群集中第 1 到第 $S$ 物種的相對豐富度。比起 Morista-Horn 指數,Horn 指數就沒有那麼強調常見物種了。
### $C_{qN}$ 指數曲線
上述方法都只比較兩個群集。那如果需要計算多個群集的 β 多樣性指數要怎麼辦呢?趙蓮菊老師利用兩階段抽樣機率的概念,把 Morisita-Horn 指數推廣到多個群集[^6],表示如下:
$$C_{qN}=\frac{\frac{1}{N^q-N}\left(\sum_{i=1}^{S}\left(\sum_{i=1}^{N}p_{ij}\right)^q-
\sum_{i=1}^{S}\sum_{j=1}^{N}p_{ij}^q\right)}
{\frac{1}{N}\sum_{i=1}^{S}\sum_{j=1}^{N}p_{ij}^{q}}$$
其中足標的 $_N$ 表示要比較的群集數量,$_q$ 表示對於相對豐富度的偏好程度(如同 Hill numbers,$_q$ 值越高越偏好常見種)。
當 $N=2$ 而 $q=0,\ 1,\ 2$ 時,這個指標曲線可以分別對應到 Sørensen、Horn 與 Morisita 指標,就像 Hill numbers = 0, 1, 2 時分別對應到物種數、Shanon 熵與 Simpson 指數的轉換值一樣。相較於計算單一的指數,透過 $C_{qN}$ 指數曲線,我們得以更充分地描述多個物種群集間生物多樣性的相似程度。
# 不同層次生物多樣性估計量的分解
Whittaker 把生物多樣性分為 α、β、γ 三層次之後,提出了三者之間的關係可以乘法分解:$\gamma=\alpha\times\beta$,γ 與 α 多樣性的差別就在於尺度的大小(整個區域群集或單一群集的多樣性)。在這個想法下,β 多樣性就被當作詮釋對於整個區域而言,不同群集多樣性的差異(γ 與 α 的比值)。
之後,Lande (1996) 提出了不同的方法,定義 α 多樣性定義為各群集內多樣性的加權平均(variance within groups)、β 多樣性為各群集間多樣性的變異(variance between groups),所以 γ 多樣性就是合計所有組內與組間的整體變異(total variance)。這三個名詞如果有做過變異數分析(ANOVA)應該會覺得耳熟,Lande 提出的多樣性分解方法,就是將三個多樣性指數,透過類似 ANOVA 的方式分解,為加法分解:$\gamma=\alpha+\beta$。
隨著學者漸漸接受**有效物種數才是群集真正的多樣性**,所以有效物種數的概念,就被加入多樣性的乘法與加法分解之中,各具意義:在乘法分解中,γ 多樣性表示大區域所有群集的有效物種數、α 多樣性定義為各群集有效物種數的平均、β 多樣性就成為有效群集數;而加法分解中的 β 多樣性,就成為關注某一群集時所忽略的有效物種數。
## Jost 的生物多樣性估計量
Jost (2007) 針對三種多樣性,整理出了 5 個重要的公設[^7]如下:
:::success
1. **α 與 β 多樣性彼此獨立**
在生態系統中,針對不同目標的估計值必須彼此獨立,在這個前提下,α 與 β 多樣性的大小不應該互相影響。
2. **不同區域的生物多樣性估計量可以互相比較**
不管針對 α、β 或者 γ 多樣性進行估計,不同區域的相同層次生物多樣性估計量都要能夠互相比較;相同的生物多樣性估計量值也要可以描述相同的生物多樣性程度。
3. **α 多樣性是各群集內多樣性的平均值**
如果一個區域內的所有群集 α 多樣性都相同,那這個區域的 α 多樣性估計量值也要維持相同;α 多樣性就是該區域各群集的多樣性在某種形式上的平均。
4. **γ 須為 α、β 所決定**
如同上個段落的生物多樣性分解,在一區域中,α、β、γ 必然有著某種形式的關係,例如加法或乘法分解關係。
5. **γ 必然大於 α 多樣性**
γ 多樣性探討區域內各物種的多樣性,所包含的訊息不可能比 α 多樣性的估計值還少。
:::
依據該 5 項公設,Jost 利用 Hill number 搭配乘法分解,從 γ 與 α 多樣性中分解出 β 多樣性,表示如下:
$$\begin{split}
&^qD_\alpha=\left[\frac{\sum_{i=1}{S}p_{i1}^q+\sum_{i=1}{S}p_{i2}^q+...+\sum_{i=1}{S}p_{iN}^q}
{N}\right]^{\frac{1}{1-q}}\\
&^qD_\gamma=\left[\displaystyle\sum_{i=1}^{S}\left(\frac{p_{i1}+p_{i2}+...p_{iN}}
{N}\right)^q\right]^{\frac{1}{1-q}}\\
\ \\
&^qD_\beta={^qD_\gamma}/{^qD_\alpha}\\
\end{split}$$
其中$p_{ij}$ 表示群集 $j$ 中物種 $i$ 的相對豐富度;$j=1,2,...,N;\ i=1,2,...,S$,簡單來說,就是把每個群集中的每個物種的相對豐富度都列出來的意思。
如同一開始提到的,β 多樣性的內涵包括差異程度、相似程度、重複程度或轉換程度,再由 β 多樣性與群集的差異正相關,與群集相似度負相關,經過形式運算的轉換與標準化後,另外得出轉換—互補(turnover-complement)指數、同質性(homogeneity)指數與局部重複(local-overlap)指數:
轉換—互補指數:$\frac{N-^qD_\beta}{N-1}$
同質性指數:$\frac{1/^qD_\beta-1/N}{1-(1/N)}$
局部重複指數:$\frac{(1/^qD_\beta)^{q-1}-(1/N)^{q-1}}{1-(1-N)^{q-1}}$ ,後來發現此指數與 $C_{qN}$ 指數等價
其中,轉換—互補指數在 $q=2$ 時,便等同於 Chiu 等人 (2013) 提出的區域重複(regional-overlap)指數[^8]:$\frac{(1/^qD_\beta)^{1-q}-(1/N)^{1-q}}{1-(1-N)^{1-q}}$ (指數的部分為 $1-q$,與局部重複指數不同)
透過 $q$ 的階層不同,Jost 與 Chiu 的這些指數可以轉換為上文提到的幾種 β 多樣性指數:
| | 轉換—互補指數 | 同質性指數 | 局部重複指數 | 區域重複指數 |
|:-:| :-----------: | :-------: | :----------: | :----------: |
| $q=0$ | Sørenson 相似度 | Jaccard 相似度 | Sørenson 相似度 | Jaccard 相似度 |
| $q=1$ ||| Horn 重疊度 | Horn 重疊度 |
| $q=2$ | **區域重複指數** | Morisita-Horn 重疊度 | Morisita-Horn 重疊度 | **區域重複指數** |
整理到這邊,大概把趙蓮菊老師文章中的 α 與 β 多樣性整理完畢。之前常在比較植物群集的文章中看到作者使用 Horn 與 Morisita-Horn 重疊度指數比較兩個植群組成的異同程度;如果有多個群集需要比較,則需要做出一張比較兩兩群集的重疊度指數矩陣。
如果要計算區域中所有群集的差異程度,那趙老師的 $C_{qN}$ 與 Jost 提出的一系列估計量就可以拿來用了。若要視覺化與比較區域中不同局部的多樣性異同,也有許多人引入距離的概念,使用如 Jacard、Bray-curtis 或者 UniFrac 計算出距離矩陣,後續可以用 UPGMA 或其他方法繪出聚類分析樹;也有人運用多變量分析中的排序方法如 MDS(PCoA)或 NMDS 來呈現不同群集間組成的近似程度,且搭配如 adonis 或 ANOSIM 等統計檢定來分析不同局部群集分組間的組成是否顯著。
![](https://www.researchgate.net/publication/338717777/figure/fig2/AS:849967296032768@1579659403143/A-Comparison-between-Shannon-and-Chao1-diversity-indices-for-C57-n-23-an.jpg)
使用 Jaccard 距離計算出距離矩陣後,以 MDS 呈現的不同飲食法腸道菌相差別。取自 Safari, Z., Bruneau, A., Monnoye, M., Mariadassou, M., Philippe, C., Zatloukal, K., & Gérard, P. (2020). Murine genetic background overcomes gut microbiota changes to explain metabolic response to high-fat diet. *Nutrients*, *12*(2), 287.
不過單純計算群集之內、之間的多樣性,未考慮各物種間親緣關係的遠近,顯然無法滿足某些生態/統計學家,這個系列的最後一篇〈[生物多樣性的估計量整理(下):親緣關係多樣性(系統演化多樣性)](/JM40uw5oTD6FmDJ2Yne60A)〉就整理了後續發展出一系列包含親緣關係思考的估計量可供參考。另外還有其他的指數,可以參考這篇古生物學多樣性估計工具 tabula 套件作者所撰寫的 [Diversity Measures](https://cran.r-project.org/web/packages/tabula/vignettes/diversity.html)。
<span style="font-size:30px">🐕🦺</span><font color="dcdcdc">2023.01.20</font>
[^1]: Jaccard, P. (1902) Lois de destributionflorale dans la zone alpine. *Bulletin Société Vaudoise des Sciences Naturelles*, *38*, 69-130.
[^2]:Sørenson, T. (1948) A Method of Establishing Groups of Equal Amplitudes in Plant Sociology Based on Similarity of Species Content and Its Application to Analyses of the Vegetation on Danish Commons. *Kongelige Danske Videnskabernes Selskab, Biologiske Skrifter*, *5*, 1-34.
[^3]: Chao, A. (2005). A new statistical approach for assessing compositional similarity based on incidence and abundance data. *Ecology Letters*, *8*(2), 148-159. doi: [10.1111/j.1461-0248.2004.00707.x](https://doi.org/10.1111/j.1461-0248.2004.00707.x)
[^4]: Morisita, M. (1959). Measuring of interspecific association and similarity between communities. *Memoirs Faculty of Science, Kyushu University. Series E*. (*Biology*), *3*, 65-80.
[^5]: Horn, H. S. (1966). Measurement of "overlap" in comparative ecological studies. *The American Naturalist*, *100*(914), 419-424.
[^6]: Chao, A., Jost, L., Chiang, S. C., Jiang, Y. H., & Chazdon, R. L. (2008). A two‐stage probabilistic approach to multiple‐community similarity indices. *Biometrics*, *64*(4), 1178-1186.
[^7]: Jost, L. (2007). Partitioning diversity into independent alpha and beta components. *Ecology*, *88*(10), 2427-2439.
[^8]: Chiu, C. H., Jost, L., & Chao, A. (2014). Phylogenetic beta diversity, similarity, and differentiation measures based on Hill numbers. *Ecological Monographs*, *84*(1), 21-44.
[^9]: Lennon, J. J., Koleff, P., Greenwood, J. J. D., & Gaston, K. J. (2001). The geographical structure of British bird distributions: diversity, spatial turnover and scale. *Journal of Animal Ecology*, *70*(6), 966-979.
[^10]: Bray, J. R., & Curtis, J. T. (1957). An ordination of the upland forest communities of southern Wisconsin. *Ecological monographs*, *27*(4), 326-349.