# 壹、統計-檢定數據的方法(高中向) 作者:shi wood yán([關於作者](https://hackmd.io/@shiwoodyan/ByOX40lHA))(部分內容由AI輔助) ---- ## 一、為何要資料檢定 1. 以高中生角度 在高中數學必修中,學到了變異數、標準差、平均數與中位數等資料分析名詞,雖然這些名詞可以告訴我們數據的呈現狀況,像變異數,標準差這些數值,它的數值代表一組數據的分散程度,但是卻沒有一個標準,說某資料的標準差超過了某數值,表此組資料可能太過分散,或是太集中,簡單來說單看變異數、標準差可能不夠直觀的看出數據的狀況,例如:如果一組數據的樣本變標準差為2.48,A同學可能會認為很大,B同學可能會認為很小。 而資料檢定就是可以算出某數值(如:p值),並根據某顯著性水平α(通常為0.1、0.05或0.01),明確得知二組數據的關聯。 2. 以資料處理來說 資料分析被大量用於各種科學研究中,但是在許多情況下,我們從母體抽樣的樣本是否可以代表真正的情況?這時就需要資料檢定,來確認此抽樣是否可以代表此母體反應情況。 雖然這是在講媒體識讀的圖,但我認為也可以用於解釋資料檢定的重要,假設母體為紅框,抽樣的樣本為藍框,這種抽樣就會導致與實際狀況偏離,資料檢定就是為了去除這種由於抽樣而造成的誤會。  ## 二、數據檢定在實驗方法中 回歸課本中所講的實驗方法也就是觀察→提出問題→參考文獻資料→假設→實驗→結論,而數據檢定就是確立假設與實驗的關聯。  以我在公鴿的實驗課中所做的實驗課為例,我假設小毛蕨的氣孔密度在陰性地(距離水源近,較潮溼)比在陽性地(距離水源遠,較乾燥)高,於是依據此假設,設計實驗,兩地採集小毛蕨,並計算其氣孔密度,並根據資料型態選擇檢定方法(當時選擇單尾t檢定),得出p值後,與檢定標準α比較,得出結論是否顯著。  ## 三、實際操作 在前面的篇章中,出現了許多較少見的名詞,如:p值、檢定標準α、單尾、t檢定等,這些名詞將會時常出現在之後的篇章,故此章節將會透過以下例子試著一邊實作數據檢定一邊簡單解釋這些名詞。 ### 例子-新式教育下的學生成績比原有的學生好 (以下非實際實驗,僅作為例子示範) 以下數據為A、B兩班考同一考卷的成績,A班接受原有的教育方式,B班則接受新式教育。  ### STEP1:假設 新式教育下的學生成績比原有的學生好。 ### STEP2:設立實驗組與對照組 此實驗目的中,是要以B班的成績(新式教育)比對A班的成績(原有的教育方式),故將B班作為實驗組,其平均值$μ$,A班則為對照組,其平均值$μ_0$。 ### STEP3:設立**虛無假設與對立假設**和決定**雙尾與單尾檢定** 我們的假設為*新式教育下的學生成績比原有的學生好*,也就是說**虛無假設**為B班的平均成績與A班無顯著差異或顯著小於A班平均成績,而**對立假設**則是B班的成績顯著大於A班成績,也就是**右尾檢定**。 $H_0$:新式教育對成績無顯著影響($μ \leμ_0$) $H_1$:新式教育對成績顯著提升($μ \gt μ_0$) #### 簡單解釋1:虛無假設$H_0$與對立假設$H$ 虛無假設(也稱為零假設,$H_0$),和對立假設(也稱為替代假設,$H_1$或$H_A$),是統計假設檢定中的兩個基本概念。 1. 虛無假設 虛無假設是指在假設檢定中,作為初始假設的陳述。它通常表示「無效」或「無差異」的狀況,即認為樣本數據與預期沒有顯著差異或效果不存在。 3. 對立假設 對立假設是指與虛無假設相對立的陳述。它表示研究者希望證明的效果或差異,即認為樣本數據與預期有顯著差異或效果存在。 #### 簡單解釋2:單尾(One-tailed Test)VS雙尾(Two-tailed Test) 單尾檢定和雙尾檢定是統計檢定中兩種不同的假設檢定方法,主要區別在於對假設檢定的方向性要求。接下來講分別介紹左尾檢定(Left-tailed Test)、右尾檢定(Right-tailed Test)、雙尾檢定(Two-tailed Test)。 1. 左尾檢定 虛無假設($H_0$): $μ \ge μ_0$ 對立假設($H_1$):$μ \lt μ_0$ 這種檢定用於檢查樣本平均值是否顯著小於某個值。 1. 右尾檢定 虛無假設($H_0$): $μ \le μ_0$ 對立假設($H_1$):$μ \gt μ_0$ 這種檢定用於檢查樣本平均值是否顯著大於某個值。 3. 雙尾檢定 虛無假設($H_0$): $μ = μ_0$ 對立假設($H_1$):$μ \ne μ_0$ 這種檢定用於檢查樣本平均值是否顯著偏離/差異(無論是大於還是小於)某個值。 ### STEP4:選擇顯著性水平(𝛼) 跟據實驗需求,一般選擇0.05。 #### 簡單解釋3:顯著性水平𝛼(Significance Level) α是指在假設檢定中,研究者預先設定的顯著性水平,它表示在零假設為真時,允許犯第一類錯誤(即錯誤地拒絕零假設)的最大概率。常見的α值有0.05、0.01和0.10,這三者通常分別用於以下三種情況。 * 0.05:最常見的顯著性水平,平衡檢測效力和錯誤率。 * 0.01:更嚴格的標準,用於需要高度確信的研究。 * 0.10:較高的錯誤率,通常用於探索性或初步研究。 ### STEP5:執行檢定,並計算出p值 根據資料型態與實驗性質,此實驗選擇t檢定-變異數相等(如何做t檢定計算出p值,之後的篇章會解釋),並計算出單尾p值約為0.30。 #### 簡單解釋4:p值(p value) p值是指在假設檢定中,根據樣本數據計算出的統計量(如t統計量)所對應的概率值。具體來說,p值表示在虛無假設($H_0$)為真時,觀察到的檢定統計量或更極端的結果出現的概率。 * 當p值小於顯著性水平𝛼 如果p值小於顯著性水平𝛼(通常小於0.05),意味著在虛無假設為真時,觀察到這樣的結果或更極端結果的概率非常低。因此,我們有理由懷疑拒絕虛無假設,並可能拒絕虛無假設。 * 當p值大於顯著性水平𝛼 如果p值大於顯著性水平𝛼,意味著在零假設為真時,觀察到這樣的結果並不是很不尋常(有點饒口,就是指非預期結果,出現的比想像中的尋常)。因此,我們沒有足夠的證據拒絕虛無假設,代表對立假設不成立。 這邊要注意的是,「我們沒有足夠的證據拒絕虛無假設」不代表虛無假設是成立的,它僅僅表示我們在現有數據下沒有足夠的證據來拒絕虛無假設。這是一種謹慎的結論,強調了統計檢定中證據的重要性。 ### STEP6:將p值與𝛼比較,得出統計結論 由於本實驗的p值大於顯著水準(0.05),這表示在虛無假設為真時,觀察到當前數據的概率較高。因此,我們沒有足夠的證據來拒絕虛無假設,即「新式教育對成績無顯著影響」。(這不意味著虛無假設一定為真,而是我們的數據不足以支持對立假設)。 > ### 相關筆記 > * 筆記-自學統計: [壹、檢定數據的方法](https://hackmd.io/@shiwoodyan/ryYzsTlrA) [貳、數據檢定之t檢定(以excel、Google sheet和R語言示範)](https://hackmd.io/@shiwoodyan/BJZ1bgYXC)
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up