--- title: Week05 課後練習 @ 2022. 秋 量化資料分析 tags: 量化資料分析-北大,layout-note --- <div style="text-align: center"> <h1>Week 05 課後練習</h1> </div> ## 問題一 :::info 自尊與憂鬱特質研究 → 樣本: 25低自尊兒童 → 樣本平均憂鬱 M: 93.3 → 母體平均憂鬱: μ= 90 → 母體標準差: δ = 15 → 請問低自尊兒童比較憂鬱嗎? 請以P值<0.05做單尾檢定 → 請設定假設、計算Z test、討論結果 ::: <iframe src="https://docs.google.com/spreadsheets/d/e/2PACX-1vR4BlZX7fylvjPD5gMQcy4Q_7JcJZfxb443sy66zsyC9TzzrUcK5V6ctiMXJTu9J2LRhAGwDr6NNNo-/pubhtml?widget=true&headers=false" width = 50% height = 400></iframe> ## 問題二 :::info 請使用2011health_w3.dta (2011年社會變遷健康組調查資料),回答以下問題: 在台灣,外食很普遍。外食會影響BMI嗎? 請比較不同外食頻率的人,他們的BMI是否不同? 請先根據次數分配與平均數等,針對外食與BMI進行描述,再擬定虛無和研究假設、檢測假設、檢測effect size,並討論結果。 - 外食: eat_out (0=0-1 days per week每周外食0-1天; 1=2-7 days per week每周外食2-7天) - bmi: bmi ::: ```c= use "2011health_w3.dta", clear tab eat_out sum bmi, de bysort eat_out: sum bmi ttest bmi, by(eat_out) // 檢測 effect size esize twosample bmi, by(eat_out) ``` 從樣本分布來看,有過半的受訪者(58.30%)每週外食的次數在1次以內,另有41%的受訪者外食的次數大於2次;而從分配表來看,外食次數高,BMI的平均值反而較低(外食頻率高者的BMI為23.28,小於外食頻率低者的23.91)。 然後從描述統計的分析來看無法確認這樣的差異是否為抽樣誤差造成,因此,後續我們需要進行推論統計。 在設立虛無假設上我們假定外食與bmi並無關係,可得出虛無假設: > H0: 有無外食不會影響 bmi; 相對的,對立假說即是認為外食會影響bmi: > Ha: 有無外食會影響 bmi。 接著進行假設檢定,我們可以發現兩者的差異達到顯著水準,p值遠小於0.0001;換言之,假設虛無假設為真,我們要得到常外食者的bmi比起少外食者要來得少 0.633 這樣的結果,其機率小於0.0001。而這樣的機率太低,因此我們可以拒絕虛無假設。 接著我們檢測 effect size的解釋效力,發現*Cohen's d*的數值在0.168,換言之儘管兩者的差異達到統計意義上的顯著水準,但是這樣的差異並不具備意義(差異很小)。 ## 問題三 :::info 請使用2019inequality_w1b.dta資料,回答以下問題: 工作收入的性別差異一直是社會學關注的重要議題。請問在2019年,就台灣18-64歲的就業者來說,其工作收入有性別差異嗎? 請設定虛無假設和研究假設、進行假設檢定(ttest)和effect size檢定,並以文字說明結果。 接著我們進行 - 個人月收入: f4,請自行編碼,編碼方式如下: - 新變項名稱為wkincome,以萬元為單位 - 取中位數,例如1-2萬重新編碼=1.5,無收入=0,30萬或以上=30 - 性別: gender (1=男; 2=女) - 年齡: age ::: ```c= preserve use "2019inequality_w1b.dta" // create the new variable: wkincome(萬元) gen wkincome = . replace wkincome = 0 if f4 == 1 replace wkincome = (f4 - 2) + 0.5 if f4 >= 2 & f4 <= 21 replace wkincome = 25 if f4 == 22 replace wkincome = 30 if f4 == 23 // 描述性分析 bysort gender: sum wkincome if age >= 18 & age <= 64 // 推論統計 ttest wkincome if age >= 18 & age <= 64, by(gender) // 檢測 effect size esize twosample wkincome if age >= 18 & age <= 64, by(gender) ``` 從樣本分布來看,在18歲至64歲這個年齡區間,男性的收入為4.65萬,遠大於女性的2.99萬元。 然後從描述統計的分析來看無法確認這樣的差異是否為抽樣誤差造成,因此,後續我們需要進行推論統計。 在設立虛無假設上我們假定性別與收入並無關係,可得出虛無假設: > H0: 性別不會影響到月收入; 相對的,對立假說即是認為性別與收入有所關連: > Ha: 性別會影響到月收入。 接著進行假設檢定,我們可以發現兩者的差異達到顯著水準,p值遠小於0.0001;換言之,假設虛無假設為真,我們要得到男性月薪大於女性1.66萬元的這個結果,其機率小於0.0001。而這樣的機率太低,因此我們可以拒絕虛無假設。 接著我們檢測 effect size的解釋效力,發現*Cohen's d*的數值在0.484,換言之兩者的差異不僅具備統計意義上的顯著性,同時這樣的差異也存在意義。 ## 問題四 :::info 請使用2011health_w3.dta,回答以下問題: 比較台灣男性與女性自覺的生活控制自由度,誰的自覺自由度比較高? 請先描述單一變項(g2)的數次分配,寫出虛無假設與研究假設,並討論結果。 - 自覺自己控制生活的自由度: autonomy (1---10) - 原始問題 (g2): 有些人能完全選擇和控制自己的生活,有些則無能為力,您選擇和控制生活的自由度如何? ::: ```c= preserve use "2011health_w3.dta", clear tab g2 bysort gender: sum autonomy ttest autonomy, by(gender) ``` 從樣本分布來看,多數的受訪者傾向認為自己對生活的掌握度是高的(數字小於5的比例約30%),依照性別來進行比較時,可以發現就男性在生活掌握度上比女性要來得低;但從描述統計的分析來看無法確認這樣的差異是否為抽樣誤差造成,因此,後續我們需要進行推論統計。 在設立虛無假設上我們假定性別與生活掌握度並無關係,可得出虛無假設: > H0: 性別不會影響生活掌控度 相對的,對立假說即是認為性別因素會影響生活掌控度 > Ha: 性別會影響生活掌控度 接著進行假設檢定,我們可以發現兩者的差異達到顯著水準,p值遠小於0.05;換言之,假設虛無假設為真,我們要得到男性的生活掌握度會低於女性0.196這樣的結果,其機率小於0.05。而這樣的機率過低,因此我們可以拒絕虛無假設。 ## 問題五 :::info 請使用hsb2.dta調查資料,回答以下問題: 美國某國小的三年級學生進行期中考,請檢測他們數學與科學成績表現是否有差異? - 請寫出虛無假設與研究假設,並討論結果。 - 數學成績: math;科學成績:science ::: ```c= use "hsb2.dta" ttest math = science ``` 從樣本分布來看,學生在數學成績上略高於科學(0.795),但從描述統計的分析來看無法確認這樣的差異是否為抽樣誤差造成,因此,後續我們需要進行推論統計。 在設立虛無假設上我們假定數學成績與科學成績並無差異,可得出虛無假設: > H0: 數學成績與科學成績沒有差異 相對的,對立假說即是認為兩者存在差異 > Ha: 數學成績與科學成績有差異 接著進行假設檢定,我們可以發現兩者的差異並未達到顯著水準,p值為0.17。換言之,假設虛無假設為真,我們要得到數學成績高於科學成績0.795分的這個成果,約有17%的機會,而這樣的機率太高,不足以讓我們拒絕虛無假設,因此我們無法說數學與自然成績之間有差異。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up