![Statistics](https://hackmd.io/_uploads/H1LyCK060.png) > KGJ0717(柯俊杰)開始撰寫於 2024 年 8 月 4 日。 統計學(Statistics)是一門將大量數據轉化為有意義資訊的科學。它起源於古代的人口普查和稅收記錄,隨著數學家的研究與更多生物科學、社會科學的觀察,在 17 世紀逐漸蓬勃發展。19世紀以來,統計學在自然科學與社會心理研究中發揮了關鍵作用。 在現代社會中,統計學可以說是無處不在,從醫學臨床試驗、金融市場預測到氣象預報,統計數據幫助我們做出更明智的決策。而隨著大數據和人工智慧的發展,統計學成為分析海量數據的核心工具,推動著科技和社會的變革。掌握統計知識,能讓個人和組織在數據驅動的世界中更具競爭力。 因此筆者將自身所學知識做統整,完成此系列筆記,其中參考書目雖然沒有明確詳列,但筆者在此由衷感謝統計學上的偉人們所做出的重大貢獻,也感謝身邊做統計分析相關的大學教師、研究學者的辛勞教學。 # 為什麼要學統計學? 當你漫步在這個由數據驅動的世界裡,無論是瀏覽新聞、逛社群媒體,還是購物和看醫生,你會發現「數據」幾乎無所不在。我們身邊充斥著各種統計數據:失業率、選舉民調、股票市場走勢、醫學研究的實驗結果等等。這些數據看似遙遠而複雜難以理解,但它們卻實際上影響著我們的生活和決策。而統計學,正是解開這些數據密碼的鑰匙。 那麼,為什麼每個人都應該要學習統計學呢?筆者認為,人類發展出統計學有兩個必然性的關鍵因素:一是人類是社會性動物,我們的生活是很難逃離群體的,而若想要在群體中生活,了解群體的特性便是必經之路。二是人類仰賴經驗,不論是文學藝術、自然科學或社會科學,大量的生活經驗、實驗紀錄都是必須的,而可以反覆驗證的事物也才能構築出我們信任的基礎。基於以上兩點因素,了解群體和累積大量經驗都會產生海量的資訊,這時候統計學就成為了非常重要的分析工具。 統計學能夠培養我們的「批判性思維」。現代社會充斥著各式各樣的資訊和數據,尤其在網路上,這些數據往往被片面解讀或誤用。懂得統計學能幫助你辨別真假,看到數據背後的真相。例如,一項看似有力的民調結果,如果缺乏有效的樣本設計和數據分析,就可能誤導大眾。透過學習統計學,你將學會如何正確地解讀數據,不輕信表面的結論,而是從背後的統計推理出發,做出更明智的判斷。 學習統計學,也是在掌握一種解決問題的思維方式。它教會我們如何收集、分析和解釋數據,從中找出問題的根源,並提出有效的解決方案。這種技能在任何工作中都能派上用場,無論你是在幫助企業提升銷售,還是在進行社會研究,統計學都將成為你分析問題、提出建議的重要工具。 學習統計學不僅僅是為了搞懂數字,它更是一種「洞察力」的培養。透過統計,我們能從大量數據中找到某些特徵或規律,從而做出明智的預測與決策。無論你將來想成為醫生、科學家、商業分析師、社會學家,甚至是政策的制定者,統計學都能讓你在這些領域中如虎添翼。舉例而言,醫學上的臨床試驗經常依靠統計推論來判斷一種藥物是否有效,科學家則會透過統計分析氣候變化的趨勢,企業管理者則利用統計數據來制定市場策略。學會統計,你便能比別人更早一步看清趨勢、抓住機會。 此外,統計學還為你開啟了無限可能的職業選擇。隨著大數據和人工智慧的崛起,數據分析師、數據科學家成為了當今最具前景的職業之一。這些職位不僅薪資豐厚,還擁有極高的成長潛力。未來的世界將更加依賴數據,無論在哪個行業,懂得統計分析的人才都將倍受青睞。 總而言之,學習統計學不僅是一門應用科學,更是一種開闊視野、掌握世界運行規則的方式。它能夠讓你更聰明地解讀數據、洞察趨勢,並在這瞬息萬變的現代社會中佔據一席之地。學習統計學,讓你更懂數據、掌握未來! # 統計學的發展脈絡 統計學的起源很早,據說最早的統計手法可以追溯到西元前五世紀。而較為正式的統計學紀錄則可以追溯到西元八到十三世紀的伊斯蘭黃金時代,當時著名的統計學著作是現代密碼學的創始人之一,阿拉伯學者 أبو يوسف يعقوب إبن إسحاق الكندي 所編著的《Manuscript on Deciphering Cryptographic Messages》,此著作也讓後人猜想,**統計學與密碼學幾乎同時誕生**。 中世紀的歐洲有許多銀行家、執政官,對於經濟貿易、人口、宗教、教育等領域做出了許多統計學相關的觀察,也留下了不少紀錄。而此時的統計學只關注的母體的些微特性,並用簡明扼要的敘述性統計量來總結。「統計(statistic)」一詞更是由義大利學者 *吉羅拉莫·吉里尼* 於 1589 年首次用來指稱與國家有關的資訊,直到 1749 年,德國的 *哥特弗里德·阿肯瓦爾* 才將其用來指稱科學中量化資料的蒐集。 西元 17 世紀,法國作為科學重心,*布萊茲‧帕斯卡* 與 *皮耶·費馬* 等人對於 **機率論(probability theory)** 的研究,建立起了統計學的數學基礎,並提供了統計學進行推論的功能,形成了與 **敘述統計學** 相對應的 **推論統計學**。直到西元 19 世紀末到 20 世紀初,統計學迎來了新一波的變革,更加嚴謹的數學基礎與分析理論的引進,使得現代統計學擁有強大的決策與預測能力。 第一階段的變革由 *弗朗西斯·高爾頓* 和 *卡爾·皮爾森* 所領導,將統計學廣泛應用於工業和政治學領域。*高爾頓* 引入了 **標準差**、**相關性**、**迴歸分析** 等概念。*皮爾森* 則發展了 *皮爾森積動差相關係數*、*動差法* 等多項統計分析技術,並創辦了《**Biometrika**》雜誌,成為世界上第一本數學統計和生物統計期刊,*皮爾森* 也在倫敦大學學院創立了世界上第一個大學統計系。 第二階段的變革在 1910~1920 年代,由 *威廉·希利·高斯特*(或者更耳熟能詳地名稱 *"司徒頓 Student"*)發起,將從 **機率論** 時代就獨霸統計的 **常態分布** 拉下神壇,利用 **自由度** 與 **t-分布**、**t-檢定** 來奪得假設檢定的地位。最終 *羅納德·愛爾默·費雪* 達到了這階段變革的高峰,他所撰寫的教科書奠定了大學統計學,並提出了 **變異數**、**實驗設計** 等諸多核心概念。他還創造了「**虛無假設**」一詞,用於知名的「女士品茶實驗」。 第三階段的變革則來自 *埃貢·皮爾遜* 與 *耶日·內曼* 在 1930 年代的合作。他們引入了 **型二錯誤**、**檢定力** 與 **信賴區間** 等概念,將統計推論的效果再推高峰。*內曼* 在 1934 年指出分層隨機抽樣比定額抽樣更有效。 如今的 AI 人工智能時代,龐大數據的分析工作,都必須仰賴前人為我們奠基的良好基礎,讓我們能夠站在巨人的肩膀上,眺望充滿希望與挑戰的未來。如果說,這個時代正是統計學最新一次的變革,你願意加入革命軍的行列,從現在開始學習統計學嗎? --- 以下列舉幾位與統計學發展相關的偉人與其事蹟,如果要寫報告可能可以參考(?) * 皮耶·德·費馬 Pierre de Fermat(法)1601/??/??—1665/1/12 * 享有「業餘數學家之王」的美譽。 * 1654年,與 *布萊茲‧帕斯卡* 在書信中討論,誕生了 **機率論**。 * 布萊茲‧帕斯卡 Blaise Pascal(法)1623/6/19—1662/8/19 * 1653年,以 **帕斯卡三角形** 描述了二項式係數之間的關係。 * 1654年,在熱衷於賭博的朋友的影響下,與 *皮耶·德·費馬* 在書信中的討論催生了 **機率論**。 * 亞伯拉罕·棣美弗 Abraham de Moivre(法)1667/5/26—1754/11/27 * 1718年,首度發現 **常態分布(normal distribution)**。 * 1734年,從二項分布中推導出 **常態分布**。 * 皮耶爾-西門·拉普拉斯 Pierre-Simon Laplace(法)1749/3/23—1827/35 * 1812年,推廣了 *棣美弗* 在二項分布中的結論,後來也被稱為 **棣莫佛-拉普拉斯定理(De Moivre–Laplace theorem)**,此為 **中央極限定理(central limit theorem,CLT)** 的初始版本。 * 阿德里安-馬里·勒讓德 Adrien-Marie Legendre(法)1752/9/18—1833/1/10 * 1805年,引入 **最小平方法(least squares method)**。 * 卡爾·弗瑞德呂希·高斯 Carl Friedrich Gauß(德)1777/4/30—1855/2/23 * 享有「首席數學家」、「數學王子」的美譽。 * **高斯分布(Gaussian distribution)** * 1809年,發表的著作中包含著 **最小平方法**,並在1829年給出了更強而有力的證明,也就是 **高斯-馬可夫定理(Gauss-Markov Theorem)**。 * 弗朗西斯·高爾頓 Francis Galton(英)1822/2/16—1911/1/17 * 1877年,對於種子的研究,發現其遺傳行為有回歸到平均值的現象 * 首先用了 **相關係數** 的概念,並以 $r$ 來表示。 * 安德烈·安德烈耶維奇·馬可夫 Андре́й Андре́евич Ма́рков(俄)1856/6/14—1922/7/20 * 1906年,首先提出 **馬可夫鏈(Markov chain)** 的概念,這也被稱為 **離散時間馬可夫鏈(discrete-time Markov chain,DTMC)**,對隨機過程做出了重要貢獻。 * 卡爾·皮爾森 Karl Pearson(英)1857/3/27—1936/4/27 * 發展出了 **回歸** 與 **相關** 的理論,其巧妙地發現統計研究並非是對於樣本本身,而是根據樣本來發展對於母體的推論,因此發展出了 **適合度檢定** * 1894年,提出 **動差估計法**、**皮爾森積動差相關係數** * 1900年,創立和發展 **卡方檢定**,也給出了適合度檢定的卡方統計量的極限定理。 * 1901年,與 *高爾頓*、*韋爾登* 創辦了 ***《生物統計學》*** 雜誌,成為從數學研究生物統計的第一人。 * 威廉·希利·高斯特 William Sealy Gosset(英)1876/6/13—1937/10/16 * **司徒頓 t-分布**、**司徒頓 t-檢定** * 羅納德·愛爾默·費雪 Ronald Fisher(英)1890/2/17—1962/7/29 * 「一位幾乎獨自建立現代統計科學的天才」、「達爾文最偉大的繼承者」 * 1918年,發表論文建立以生物統計為基礎的遺傳學,同時也是第一次用到 **變異數(variance)** 這個統計學名詞。 * 1921年,建立了 **變異數分析(analysis of variance,ANOVA)** 。 * 1924年,指出 **皮爾森卡方檢定** 與 **司徒頓 t-檢定** 具有與 **高斯分布** 類似的框架,並從中發展出了 **F-分布(Fisher–Snedecor distribution)** * 1925年,出版第一本書,並提出 p-value 的概念與 0.05 為統計顯著性的臨界值。 * 1935年,出版的書除了更完善 **ANOVA** 之外,也從中發明了 **最大概似估計法**。 * 1971年,首創 **虛無假設(null hypothesis)** 的概念。 * 埃貢·皮爾遜 Egon Sharpe Pearson(英)1895/8/11—1980/6/12 * *卡爾·皮爾森* 的兒子,也是一位優秀的英國統計學家。 * 與 *耶日·內曼* 共同引入了 **型二錯誤(Type II error)**、**檢定力(power of a test)** 與 **信賴區間(confidence interval)** 的概念。 * 耶日·斯普瓦瓦-內曼 Jerzy Spława-Neyman(波蘭)1894/4/16—1981/8/5 * 將 **信賴區間(confidence interval)** 的概念引入 **假設檢定(statistical hypothesis testing)** 中。 * 與 *埃貢·皮爾遜* 共同重新詮釋了 **虛無假設** 的概念。 # 資料種類(data type) 統計資料可以根據資料 **取得方式** 分成兩大類: * **觀察型資料(observational data)** 表示資料是透過觀察的方式取得的,通常為社會科學相關的資料都是這種取得方式。例如問卷調查結果、證券交易情形、匯率資料等。因為資料取得手段的關係,**觀察型資料** 往往有較多的雜訊干擾。 * **實驗型資料(experimental data)** 則是利用實驗或測量等手段而得到的資料,自然科學的資料往往是實驗型資料。例如實驗測得化學反應是否成功進行、反應速率、粒子的動能、細菌數量或岩石中的礦物比例等。 最有名的資料分類方式就是美國心理學家 *斯坦利·史密斯·史蒂文斯 Stanley Smith Stevens*(1946)所提出來的分類,他依照資料的 **測量尺度(scale of measure)** 來將資料進行分類。 * **屬性資料(qualitative data)** 表示資料通常是非數值的,而是一種敘述,通常又會被稱為 **定性資料**、**質化資料** 或是 **敘述性資料(descriptive data)**。 * **名義 / 名目尺度(nominal scale)** 是四個尺度中最弱的結構,資料分類無屬性大小之分。根據特徵的性質做分類,純粹用來分辨不同的性質。例如星座、職業,但也可以是數值形式的,例如球員背號、郵遞區號。有一種特殊的名目尺度資料為 **二元資料(dichotomous data)**,表示僅有兩種可能的資料內容,可以是敘述型態的有或無、是或否、正或反,或者是數值型態的 0 或 1。 * **排序 / 順序尺度(rank / ordinal scale)** 除了可區分類別外,同時也具備順序的概念(資料的排序是具意義的),但不能定義中間的差異,也就是兩個不同排序之間實際上到底差多少是無法被確定的。例如名次、成績等第。 * **計量資料(quantitative data)** 表示資料是以數值方式呈現的,也具有一定程度上的數值特性。又被稱為 **定量資料**、**量化資料** 或是 **度量資料(metric data)**。 * **等距 / 區間尺度(interval scale)** 除了具分類及順序外,是可以比較兩個資料之間的差異,在數學運算上可以做加減但不能乘除,因為沒有倍數的關係。例如溫度、曆法年分、智商。 * **比例尺度(ratio scale)** 有以上三種尺度的所有特性外,各數值間具有等差與比率的關係,能衡量數值之間實質的差異,因此可做加減乘除所有的數學運算,這種資料尺度的特性就是具有天然零點(並非人為定義的 0)。例如長度、質量、熱力學溫度(絕對溫標、克耳文)。 | 尺度 | 次序 | 距離 | 原點 | 數學運算 | 中心位置 | 分散測度 | |:----:|:----:|:----:|:----:|:-------------------:|:---------------------------------------:|:-----------------------:| | 名目 | No | No | No | = | 眾數 | 無 | | 排序 | Yes | No | No | =、<、> | 眾數、中位數 | 分位數 | | 等距 | Yes | Yes | No | =、<、>、+、- | 眾數、中位數、算術平均數 | 分位數、全距 | | 比例 | Yes | Yes | Yes | =、<、>、+、-、×、÷ | 眾數、中位數、算術平均數、幾何平均數... | 分位數、全距、標準差... | # 分類與計次 統計調查後,其實我們並不會關心每一筆資料的細節,例如這筆資料是第幾個被取樣到的(只有某些特定情況會關心此資訊)。我們更關心的是資料整體展現出來的特性,包含分布情形、集中於哪個區段等等,因此我們需要整理這筆資料,只顯示出有用的資訊,因此要對資料進行 **分組/分類(classify)** 與 **計次(counting)**。 ### 分組/分類(classify) 定性的質化資料通常會直接用其描述內容來進行分組(投票給A, B, C 或 D 方案),而量化資料的分組比較麻煩,共有 5 個步驟: 1. 根據 *Sturges(1926)* 所提出的公式,對於 $n$ 筆資料來說最適合的組數為 $K$,計算公式如下: $K=1+\frac{lg n}{lg 2}\approx1+3.322.log_{10}n$ 2. 再利用資料數值的最大值($Max$)減去最小值($Min$)得到全距(range, $R$),然後除以組數,得到每組的組距(Class Interval, $CI$),如下所示: $CI=\frac{R}{K}=\frac{Max-Min}{K}$ 3. 接下來必須嚴格定義好組的範圍(如身高150公分以上,155公分以下,包含155公分者為一組),通常習慣不包含組的下限,但包含組的上限,以考試成績分組為例,**90**分者不會被分到 **80-90** 的組,反而是被分到 **90-100** 的組別。要注意的是,同一次的分析中,要盡可能確保每個組別彼此互不重疊,並且可以包含所有的資料,這樣才能完整地進行分析討論而不會出現分析邏輯上的謬誤。 4. 定義好組的上界與下界後,便可以計算 **組中值(class mid-value)**,也就是組上界值與組下界值相加除以 2。 5. 最後計算每一組出現的次數,也就是 **計次(counting)**。 ### 計次(counting) 當定義好組別之後,便依照每一個資料應該屬於哪個組別來進行計次。最後會得到各組別分別有幾筆資料(更常用「出現幾次」的說法)。這樣就把原始龐大的資料(data)整理成較為簡單易懂的資訊(information)。 以下將以 **次數分配表(frequency table)** 的形式來整理一筆範例資訊。 | Label | Education | Marriage | Age | Experience | |:-----:|:---------:|:--------:|:---:|:----------:| | 1 | Bachelor | Yes | 35 | 8 | | 2 | Master | Yes | 32 | 6 | | 3 | Master | Yes | 27 | 4 | | 4 | Master | No | 28 | 9 | | 5 | PhD | Yes | 38 | 16 | | 6 | Bachelor | No | 26 | 6 | | 7 | Bachelor | Yes | 27 | 5 | | 8 | Master | Yes | 29 | 11 | | 9 | Master | No | 27 | 8 | | 10 | Master | No | 31 | 13 | 在此資料表中,教育程度(Education)與婚姻情況(Marriage)屬於質化資料,而年齡(Age)與工作經驗(Experience)屬於量化資料。教育程度可以很輕易地分成三組:學士(Bachelor)、碩士(Master)、博士(PhD)。年齡則需要較仔細地定義,例如將其分成 25-30 歲、30-35 歲,以及 35-40 歲這三組,如下所示。 * 註1:其中組距表示各組中上邊界與下邊界的差,此處組距為 5 歲,通常會固定級距進行分組。 * 註2:習慣上若不特別說明,每組會包含上邊界,但不包含下邊界。 * 註3:雖然根據正確步驟,10 筆資料應該分成 4 類。且通過計算,組距為 3,但在此為了方便,就不依照這個方式來分。 | Education | Counts | | Age | Counts | |:---------:|:------:| --- |:-----:|:------:| | Bachelor | 3 | | 25-30 | 6 | | Master | 6 | | 30-35 | 3 | | PhD | 1 | | 35-40 | 1 | 除了用表格之外,也常常會利用圖形的方式來表示。 ### 長條圖 / 柱狀圖(bar chart) 比較常用於表現質化資料,因為長條圖的每一個長條之間有空隙,因此資料可以不具備連續性。 ![ex01bar](https://hackmd.io/_uploads/HknmLK0aA.png) ### 直方圖(histogram) *卡爾·皮爾森* 於 1895 年開始使用 *histogram* 來稱呼此圖,其則常用於表現量化資料,因為直方圖的每一格之間不會有空隙,所以必須要求資料具有連續性。 ![ex01hist](https://hackmd.io/_uploads/rk4G9Q3pR.png) ### 次數多邊形圖(frequency polygon) 通常是從直方圖修改而來,取出每組的組中值及每組的出現次數,分別作為橫軸座標與縱軸座標來繪製點,再以直線連接,因此有時候也會直接被稱為 **折線圖(line plot)**。 ![ex01line](https://hackmd.io/_uploads/SJaBCX3a0.png) ### 柏拉圖(Pareto Chart) 又稱帕雷托圖、排列圖法,或主次因素分析法。這個名稱是根據 **帕雷托法則(Pareto principle)**,也就是經常聽到的 **八二法則(80/20 rule)**,這個定律原先是義大利社會學家與經濟學家 Vilfredo Pareto 在 1906 年寫下,他觀察到義大利 80% 的土地集中在 20% 的權貴階級身上。此定律也會在後續被提到。 這種作圖方式包含了 **長條圖** 和 **折線圖**,繪製方式是將質化資料整理成次數分配表後,依照次數的多寡降冪排列(由多到少排列),將每一種的次數(或相對次數)繪製成 **長條圖**,累積次數(或累積相對次數)繪製成 **折線圖**。這種作圖方式常見在品管相關領域上。 ![ex01Pareto_chart](https://hackmd.io/_uploads/HyKtmtSRC.png) ### 枝葉圖 / 莖葉圖(stem-leaf plot) 由 *Tukey(1960)* 所提出,可以觀察出資料的集中與分布情形。這是現在較少提及的製圖方式,筆者個人也覺得它根本就是表格。 首先將量化資料分成 **枝(stem)** 和 **葉(leaf)** 兩個部分,枝可以作為分類的依據,而葉則由左至右遞增排序(越右邊數值越大),如下所示: | Counts (f) | Stem: Class | Leaf: Data | |:----------:|:-----------:|-------------| | 6 | 25-30 | 6 7 7 7 8 9 | | 3 | 30-35 | 1 2 5 | | 1 | 35-40 | 8 | # 相對次數與累積相對次數 不論是直方圖或是長條圖,都是單純進行分組並計次,可以表達各組之間次數高低,但有時候無法明顯體現出全體資料中各組的占比大小。 ### 圓餅圖(pie chart) 為了更加直觀地表達每一組的占比情況,通常會將每一組的次數除以總資料筆數,得到該組佔全部資料的百分比(**相對次數 relative frequency**),並以 **圓餅圖** 的形式繪製(在此用質化資料作為示範,質化資料也較常以圓餅圖的形式出現)。 ![ex01pie](https://hackmd.io/_uploads/HkgHUKA6R.png) ### 肩形圖(ogive)/ 累計次數多邊圖(cumulative frequency polygon) 另外,對於量化資料,除了表現出資料在不同組中的占比之外,也展現出全部資料的變化趨勢,便可以將相對次數進行累加,得到 **累積相對次數(cumulative relative frequency, CRF)**,並繪製成 **肩形圖**,繪製方式與折線圖相同(為了使圖的效果更為顯著,在此將上述表格重新分組,將年齡以3歲為組距進行分組)。 | Age | Counts | |:-----:|:------:| | 25-27 | 4 | | 28-30 | 2 | | 31-33 | 2 | | 34-36 | 1 | | 37-39 | 1 | ![ex01ogive](https://hackmd.io/_uploads/rk2BIKATC.png) * 註:大部分圖以組中點來繪製資料點,但在此處筆者選擇利用組上界來繪製。 # 二維統計圖表 上述的圖表都是對於一種資料(教育程度或年齡)的表現形式,若同時間需要針對兩筆資料進行整理,則會需要用到二維統計圖表的方式來表現。 ### 列聯表(contingency table) / 交叉表(cross tabulation) 通常習慣把兩種質化資料分別當成 **欄** 跟 **列** 的標題,並在欄跟列交叉對應的格子中填入數量,如下所示: | Marriage | Bachelor | Master | PhD | |:--------:|:--------:|:------:|:---:| | Yes | 2 | 3 | 1 | | No | 1 | 3 | 0 | ### 群組長條圖(group bar chart)與 堆疊長條圖(stacked bar chart) 若是對於質化資料與量化資料需要同時呈現時,通常會選用變形版的長條圖。當然,二維的質化資料也可以用這個方式呈現。以下將選用年齡與教育程度的兩種長條圖作為範例。 ![ex01Grouped-bar](https://hackmd.io/_uploads/SyDya_R60.png) ![ex01Stackeded-bar](https://hackmd.io/_uploads/SyXm0u06C.png) ### 二類直方圖 當然,如果是兩組量化資料要同時顯示(或者可以想像成一筆只有兩個選項的質化資料跟一筆量化資料),也可以使用 **二類直方圖**。像是人口金字塔圖就是這種圖。 ![people](https://hackmd.io/_uploads/S12iQ7-R0.png) ### 散布圖(scatter plot) 高中二維數據分析最常看到的好朋友就是散布圖,利用兩筆量化資料分別做為橫軸與縱軸座標,將數據點繪製於平面直角坐標上,便可以完成散布圖的製作。當然,如果改變每個點的標示,則可以將質化資料也一併呈現,是資訊密度很高的一種製圖方式。 ![ex01scatter](https://hackmd.io/_uploads/BJP5kY0pC.png) --- ###### 下一回:[統計學(二)統計結果的摘要](https://hackmd.io/@KGJ0717/BkyniQtaC)