GDSC_BigData
      • Sharing URL Link copied
      • /edit
      • View mode
        • Edit mode
        • View mode
        • Book mode
        • Slide mode
        Edit mode View mode Book mode Slide mode
      • Customize slides
      • Note Permission
      • Read
        • Owners
        • Signed-in users
        • Everyone
        Owners Signed-in users Everyone
      • Write
        • Owners
        • Signed-in users
        • Everyone
        Owners Signed-in users Everyone
      • Engagement control Commenting, Suggest edit, Emoji Reply
    • Invite by email
      Invitee

      This note has no invitees

    • Publish Note

      Share your work with the world Congratulations! 🎉 Your note is out in the world Publish Note

      Your note will be visible on your profile and discoverable by anyone.
      Your note is now live.
      This note is visible on your profile and discoverable online.
      Everyone on the web can find and read all notes of this public team.
      See published notes
      Unpublish note
      Please check the box to agree to the Community Guidelines.
      View profile
    • Commenting
      Permission
      Disabled Forbidden Owners Signed-in users Everyone
    • Enable
    • Permission
      • Forbidden
      • Owners
      • Signed-in users
      • Everyone
    • Suggest edit
      Permission
      Disabled Forbidden Owners Signed-in users Everyone
    • Enable
    • Permission
      • Forbidden
      • Owners
      • Signed-in users
    • Emoji Reply
    • Enable
    • Versions and GitHub Sync
    • Note settings
    • Note Insights New
    • Engagement control
    • Make a copy
    • Transfer ownership
    • Delete this note
    • Insert from template
    • Import from
      • Dropbox
      • Google Drive
      • Gist
      • Clipboard
    • Export to
      • Dropbox
      • Google Drive
      • Gist
    • Download
      • Markdown
      • HTML
      • Raw HTML
Menu Note settings Note Insights Versions and GitHub Sync Sharing URL Help
Menu
Options
Engagement control Make a copy Transfer ownership Delete this note
Import from
Dropbox Google Drive Gist Clipboard
Export to
Dropbox Google Drive Gist
Download
Markdown HTML Raw HTML
Back
Sharing URL Link copied
/edit
View mode
  • Edit mode
  • View mode
  • Book mode
  • Slide mode
Edit mode View mode Book mode Slide mode
Customize slides
Note Permission
Read
Owners
  • Owners
  • Signed-in users
  • Everyone
Owners Signed-in users Everyone
Write
Owners
  • Owners
  • Signed-in users
  • Everyone
Owners Signed-in users Everyone
Engagement control Commenting, Suggest edit, Emoji Reply
  • Invite by email
    Invitee

    This note has no invitees

  • Publish Note

    Share your work with the world Congratulations! 🎉 Your note is out in the world Publish Note

    Your note will be visible on your profile and discoverable by anyone.
    Your note is now live.
    This note is visible on your profile and discoverable online.
    Everyone on the web can find and read all notes of this public team.
    See published notes
    Unpublish note
    Please check the box to agree to the Community Guidelines.
    View profile
    Engagement control
    Commenting
    Permission
    Disabled Forbidden Owners Signed-in users Everyone
    Enable
    Permission
    • Forbidden
    • Owners
    • Signed-in users
    • Everyone
    Suggest edit
    Permission
    Disabled Forbidden Owners Signed-in users Everyone
    Enable
    Permission
    • Forbidden
    • Owners
    • Signed-in users
    Emoji Reply
    Enable
    Import from Dropbox Google Drive Gist Clipboard
       Owned this note    Owned this note      
    Published Linked with GitHub
    • Any changes
      Be notified of any changes
    • Mention me
      Be notified of mention me
    • Unsubscribe
    ## 模塊二:問卷設計與統計分析基礎 * 研究設計 * 問卷題目設計 * 敘述性統計 * 基礎概率與統計 --- ### 研究設計 * **調查法的主要目的?** * 母體(population):所有研究對象之集合 • 樣本(sample):母體之部分集合 * 母數(parameter參數):用來描述母體之特徵 • 如:母體平均值、母體標準差 * 統計量(statistics):用來描述樣本之特徵 • 如:樣本平均值、樣本標準差! ![截圖 2023-11-23 下午3.13.22](https://hackmd.io/_uploads/HyNjsu3NT.png) * **適合調查研究法的主題** * 調查法可用於描述性、解釋性或探索性的研究,但主要是用在<font color = #0099ff>以個人為分析單元(unit of analysis)</font>的研究上。 * 母體的分析單元,可以透過<font color = #0099ff>抽樣</font>,進而觀察其樣本特性。 * 同一母體的樣本特徵,具有可歸納的屬性; 樣本可透過標準化問卷,讓所有受試者以相同形式提供資料。 * 為何使用標準化問卷: * 標準化問卷確保所有受試者在相同的情境下提供數據,這有助於增加數據的一致性和可比較性。 * 通過使用統一的問題和回答選項,可以更容易地量化和分析數據,從而提高結果的可靠性。 #### **補充名詞|** ##### **<font color = #0099ff>分析單元(unit of analysis)</font>** 行為科學中最終研究主題對象的選定,其被描述時的屬性範圍以及擬定假設的概念結構。 * 自然人、組織或社會人造事實(如制度、聚落)。 * 請找出下列陳述中的分析單元: 「在七海魚皮事件中,大部分的學生不支持事主的行為。」 ##### **<font color = #0099ff> 區位謬誤(ecological fallacy)</font>** 以全概偏,如果僅基於群體的統計數據就對其下屬的個體性質作出推論,就是犯上區位謬誤。如,錯誤地從團體的觀察來做個體的推論: * 「七海魚皮事件中,迪卡文章都是反對事主的行為,可以推論成大學生都是不支持事主的行為」 ##### **<font color = #0099ff> 描述分析(descriptive analysis) </font>** 針對母體樣態或主要關心的社會現象,進行「是什麼」(what is it?) 的事實描述。 * 成大學生怎麼看待七海魚皮事件 ##### **<font color = #0099ff> 解釋分析(explanatory analysis) </font>** 針對母體分布或主要關心的社會現象,進行「何以造成」(why and how does it happen?)的。 * 為何司成大學生對七海魚皮事件多抱持負面看法? ### 溯因型研究:由果溯因(causes of effects): * 推理過程中無一清楚方向與軸線 * 通常從可觀察的社會現象(依變項)回溯,探討可能的成因(自變項)。 * 從自變項到依變項的因果解釋,通常是透過理論假設的統計檢定來建立。 * 此類型研究多為實際發生的經驗性研究,且較具解釋力與應用性,以及 較高的外在效度(external validity)。 * 外在效度: 研究問題及其發現,概推到解釋其他案例與整個真實世界的 程度。 --- ### 調查法的類型 #### **<font color = #0099ff> 訪問調查 </font>** 由訪問員向受訪者蒐集資料的接觸方式。訪問可能是以面對面的方式進行。 * 回覆率:面訪>郵寄問卷。 * 面訪能減少「不知道」與「無答案」等答案出現的頻率。 * 訪員在場可澄清題意,使受訪者的回答依然與題目相關。 **不論是提問或是記錄答案,訪員都須保持中立** #### **<font color = #0099ff> 電話調查 </font>** **優點** * 適中成本 * 速度: 電訪能於短時間內接觸到很大數目的受訪者。 * 高回收率: 電訪對也許不可能對郵寄問卷作回覆或拒絕面訪的人,提供接觸的機會。 **缺點** * 不願討論敏感主題:受訪者也許對將討論某些議題感到猶豫 * 較少的資料: 訪談者無法提供有關受訪者特質或環境的補充資料 #### **<font color = #0099ff> 網路調查 </font>** **優點** * 成本效益 * 速度:數據收集和處理速度快 * 便利性:受訪者可以在任何時間、任何地點完成調查,只要他們有網路連接。 * 更大範圍的受眾:網路調查可以輕鬆地跨越地理界限,達到更廣泛的受眾。 * 靈活的設計選項:可以容易地使用各種問題類型 * 提高受訪者的匿名性:這可能鼓勵受訪者對敏感或私人問題提供更誠實的回答。 **缺點** * 代表性問題:在網路上接受調查者是否足以代表有意義的母體? ### 測量 #### **<font color = #0099ff> 測量「次數」 </font>** * 一天好幾次、幾乎每天一次、一週好幾次、大約每週一次、每月兩三刺、大約一個月一次、每個月不到一次、一年好幾次、一年一次或更少 * 經常、有時、偶而、很少、從不 #### **<font color = #0099ff> 測量「數量」 </font>** * 很多、相當多、一些、只有一點、一點也不、大、中等、小 * 可用數字來形成主觀的量表測量 #### **<font color = #0099ff> 測量「感覺」 </font>** * 很喜歡、很正面的、不喜歡、很負面的、很難說 #### **<font color = #0099ff> 詢問「評價」性問題 </font>** * 很好、好、還好、不好 #### **<font color = #0099ff> 評量「同意感」 </font>** * 完全同意、同意、不同意、完全不同意 #### **<font color = #0099ff> 測量「優先性」 </font>** * 要求受訪者對於一些不同選擇加以排序 ### 量表的建立 * 量表的建立是指在測量時,將數個相對上較為狹隘的指標合併為一個單一 的測量分數的過程。通常運用在探索性研究。 * 使用多個題目來測量某一概念的原因 * 可捕捉到概念的所有面向 * 可縮小測量誤差 * **有助於檢視測量的信效度** * 可增加測量分數的變異性 #### **<font color = #0099ff> 量表建構的種類 </font>** * **鮑氏社會距離量表 (Bogardus social distance scale):** * 一種用來測量人們參與其他人群的社會關係─不同親近程度─的意願之技術。其能有效地綜合若干不同題項的測量,而不失去任何資訊。 * 鮑氏社會距離量表的題項結構,有強度上的明顯差別。假使一個人有意願接受 一個特定程度的往來時,這個人應該願意接受所有往來清單中該題項之前的題 項──較弱的題項。 ``` Q1. 你是否願意允許性犯罪者住在你的國家? Q2. 你是否願意允許性犯罪者住在你的社區? Q3. 你是否願意允許性犯罪者住在你的鄰里? Q4. 你願意讓一個性犯罪者住隔壁嗎? Q5. 你能讓你的孩子與性罪犯者結婚嗎? ``` * **瑟氏量表(Thurstone scale):** * 按照「評分者」對變項的各個指標所配予的權重來建構的量表。 * 在現今研究中,瑟氏量表法不太被採用之原因: 1. 題項需要有10到15 位評分者給分,需要大量的人力與時間。 2. 因為評分者決定題項的品質取決於他們的經驗與其他各種不同的考量, 因此需要專業的研究者才行。 3. 組成變項題項的意義,也會因時間推移而變遷。為增進瑟氏量表的效果,每隔一段時間要定期更新。 ![截圖 2023-11-23 下午5.10.38](https://hackmd.io/_uploads/H1_mw52E6.png) ` * **李克特量表(Likert scale):** * 用以測定不同題項的相對強度,試圖 改進社會研究的測量水準。 * 李克特題項使用的答項如「非常同意」、 「同意」、「不同意」及「非常不同意」 * **語意差異法(semantic differential):** * 要求受試者就兩個極端的形容詞加以評分並使用修飾詞如「非常」、「有點」、「中間」、「有點」、「非常」 ![截圖 2023-11-23 下午5.13.21](https://hackmd.io/_uploads/rJV6Dq2NT.png) * **古特曼量表(Guttman scale):** * 用以歸納若干不同的 觀察而後代表一些較一般性的變項。 ![截圖 2023-11-23 下午5.21.19](https://hackmd.io/_uploads/B1loFcnN6.png) ### 信度(Reliability) 信度是指測量的一致性和穩定性。如果一項測量具有高信度,則意味著每次使用該測量工具時,它會產生相同或相似的結果。信度的主要類型包括: * 內部一致性信度:測量一個測試中不同項目之間的相關程度。 * 重測信度:測量在不同時間點使用相同的測試所得到的結果的一致性。 * 分半信度:將測試分為兩部分並比較兩個子測試的得分一致性。 * 間評者信度:評估不同評估者或觀察者得出的評分一致性。 ### 效度(Validity) 測量的工具能夠精確反映出要測量的概念 「是否能測量到我想要測量的?」 **效度越高,即表示測量結果越能顯示出所要測量的物件的真正特徵** * 內容效度:測量工具的內容是否全面且適當地覆蓋了要測量的概念。 * 表面效度:測量工具看起來是否有效,這更多的是主觀評估。 * 效標關聯效度(criterion validity): 指測量所得的分數與所預測量特質的真實狀況之間的關聯性。 * 建構效度(construct validity): 測量工具是否真正測量了它聲稱要測量的理論構念。 ### 信度與效度的關係 ![截圖 2023-11-23 下午5.31.39](https://hackmd.io/_uploads/ByTNn52Vp.png) ## 抽樣 ### 非機率抽樣(nonprobability sampling) **凡不是依據機率理論選擇樣本的方法** * 便利抽樣(Convenience Sampling) * 選擇最容易訪問的個體。 * 例如,在學校進行的調查可能只針對能夠輕鬆訪問的學生。 * 判斷抽樣(Judgmental or Purposive Sampling): * 研究者使用自己的判斷來選擇樣本成員,通常是因為他們認為這些成員代表了整個母體的特定特徵。 * 這種方法常用於專家訪談或案例研究。 * 滾雪球抽樣(Snowball Sampling): * 初始受訪者被要求推薦其他可能符合研究條件的人。 * 這對於研究難以接觸的群體(如特定的專業群體或特定疾病患者)特別有用。 * 配額抽樣(Quota Sampling): * 研究者為母體的不同子群體設定配額 * 非隨機地選擇參與者 * ### 機率抽樣(probability sampling): **依據機率理論選擇樣本的概稱,典型的涉及一些隨機選樣的機制。** * 機率抽樣兩大優勢: * 更具代表性,可避免掉偏差問題。機率抽樣比非機率抽樣更能夠代表母體。 * 可藉機率理論推估樣本精確度或代表性 #### **補充名詞|** ##### **<font color = #0099ff> 信心水準(confidencelevel)</font>** 母體參數落在一定信賴區間的估計機率 ##### **<font color = #0099ff> 信賴區間(confidenceinterval) </font>** **母體參數估計會存在的數值幅度。** * **68-95-99原則** ![450px-Empirical_Rule](https://hackmd.io/_uploads/BJm5gon4T.png) ### 抽樣設計與執行步驟 1. 決定資料蒐集方式:面訪、郵寄問卷、電訪、或混合使用 2. 定義母體 3. 決定操作型定義及據以抽樣的母體清冊 4. [決定樣本數](http://www.surveysystem.com/sscalc.htm) 5. 分層 6. 決定各層樣本數 7. 各層獨立進行抽樣設計 8. 分段 9. 決定各段抽出單位數 10. 執行 11. 列出母體參數的推估公式及其變異數的估計式;如有必要加權,列出權值依據 ## 敘述性統計 * 為甚麼進行樣本的描述統計重要? * **數據瞭解**:描述統計能夠快速地提供數據的基本特徵,幫助研究者或分析師對數據集有一個初步的認識。 * **數據整理**:通過描述統計,可以將大量數據整理成幾個關鍵的統計量,便於理解和傳達。 * **異常值檢測**:描述統計有助於識別數據中的異常值或錯誤,這對數據清理和質量控制非常重要。 * **數據比較**:描述統計提供了一種標準化的方式來比較不同數據集或數據集的不同部分。 * **後續分析的基礎**:描述統計是進行更複雜統計分析(如推斷統計)的基礎,有助於決定使用哪種統計方法。 * 進行描述統計,基本要看甚麼統計量? 基本要看的統計量包括: * **集中趨勢的度量**: * 平均值(Mean):所有數值的總和除以數值的個數。 * 中位數(Median):將數據集中的數值按大小排列後位於中間的數值。 * 眾數(Mode):數據集中出現次數最多的數值。 * **離散程度的度量**: * 標準差(Standard Deviation):衡量數據分布的離散程度。 * 變異數(Variance):標準差的平方,反映數據的波動範圍。 * 範圍(Range):數據集中最大值和最小值之間的差距。 * 四分位數(Quartiles):將數據分為四等份,每份包含25%的數據。 * **形狀的度量**: * 偏態(Skewness):衡量數據分布的對稱性。 * 峰度(Kurtosis):衡量數據分布的尖峰程度,相對於正態分布的平坦或尖銳。 ![截圖 2023-11-30 下午6.25.40](https://hackmd.io/_uploads/SJ0qXJ8Ba.png) ### 資料型態與統計方法 * 資料型態資料衡量尺度具有高低位階之分 * 資料衡量尺度決定變數類別(質化或量化),而變數類別又決定統計分析方法 * 同一變數可能因衡量方法之不同而形成不同之變數型態,進而影響統計方法與結果 ![截圖 2023-11-30 下午6.20.34](https://hackmd.io/_uploads/ByeEGyUBT.png) ![截圖 2023-11-30 下午6.28.01](https://hackmd.io/_uploads/B1f0mJUSa.png) #### 集中趨勢 * 質化資料:適用眾數。 * 量化資料:適用中位數、平均值。 (中位數與平均值何者較適合,**需視實際資料是否明顯存在極端值**) #### 離散量數 1. **全距(range) : max-min。** * 特點: * 計算容易 * 無法反映資料觀測值之個體差異 * 受極端值影響 2. **變異數(variance)。** * 優點: * **考慮全部觀測值** * 可作進一步數學推導 * 缺點: * 受極端值影響。 * 單位無法解釋。 3. 標準差(standard deviation) * 優點: * 考慮全部觀測值 * 可作進一步數學推導 * **單位可以解釋** * 缺點: * 受極端值影響 * 不適用於不同單位或不同平均值間之資料比較 ## 基礎概率與統計

    Import from clipboard

    Paste your markdown or webpage here...

    Advanced permission required

    Your current role can only read. Ask the system administrator to acquire write and comment permission.

    This team is disabled

    Sorry, this team is disabled. You can't edit this note.

    This note is locked

    Sorry, only owner can edit this note.

    Reach the limit

    Sorry, you've reached the max length this note can be.
    Please reduce the content or divide it to more notes, thank you!

    Import from Gist

    Import from Snippet

    or

    Export to Snippet

    Are you sure?

    Do you really want to delete this note?
    All users will lose their connection.

    Create a note from template

    Create a note from template

    Oops...
    This template has been removed or transferred.
    Upgrade
    All
    • All
    • Team
    No template.

    Create a template

    Upgrade

    Delete template

    Do you really want to delete this template?
    Turn this template into a regular note and keep its content, versions, and comments.

    This page need refresh

    You have an incompatible client version.
    Refresh to update.
    New version available!
    See releases notes here
    Refresh to enjoy new features.
    Your user state has changed.
    Refresh to load new user state.

    Sign in

    Forgot password

    or

    By clicking below, you agree to our terms of service.

    Sign in via Facebook Sign in via Twitter Sign in via GitHub Sign in via Dropbox Sign in with Wallet
    Wallet ( )
    Connect another wallet

    New to HackMD? Sign up

    Help

    • English
    • 中文
    • Français
    • Deutsch
    • 日本語
    • Español
    • Català
    • Ελληνικά
    • Português
    • italiano
    • Türkçe
    • Русский
    • Nederlands
    • hrvatski jezik
    • język polski
    • Українська
    • हिन्दी
    • svenska
    • Esperanto
    • dansk

    Documents

    Help & Tutorial

    How to use Book mode

    Slide Example

    API Docs

    Edit in VSCode

    Install browser extension

    Contacts

    Feedback

    Discord

    Send us email

    Resources

    Releases

    Pricing

    Blog

    Policy

    Terms

    Privacy

    Cheatsheet

    Syntax Example Reference
    # Header Header 基本排版
    - Unordered List
    • Unordered List
    1. Ordered List
    1. Ordered List
    - [ ] Todo List
    • Todo List
    > Blockquote
    Blockquote
    **Bold font** Bold font
    *Italics font* Italics font
    ~~Strikethrough~~ Strikethrough
    19^th^ 19th
    H~2~O H2O
    ++Inserted text++ Inserted text
    ==Marked text== Marked text
    [link text](https:// "title") Link
    ![image alt](https:// "title") Image
    `Code` Code 在筆記中貼入程式碼
    ```javascript
    var i = 0;
    ```
    var i = 0;
    :smile: :smile: Emoji list
    {%youtube youtube_id %} Externals
    $L^aT_eX$ LaTeX
    :::info
    This is a alert area.
    :::

    This is a alert area.

    Versions and GitHub Sync
    Get Full History Access

    • Edit version name
    • Delete

    revision author avatar     named on  

    More Less

    Note content is identical to the latest version.
    Compare
      Choose a version
      No search result
      Version not found
    Sign in to link this note to GitHub
    Learn more
    This note is not linked with GitHub
     

    Feedback

    Submission failed, please try again

    Thanks for your support.

    On a scale of 0-10, how likely is it that you would recommend HackMD to your friends, family or business associates?

    Please give us some advice and help us improve HackMD.

     

    Thanks for your feedback

    Remove version name

    Do you want to remove this version name and description?

    Transfer ownership

    Transfer to
      Warning: is a public team. If you transfer note to this team, everyone on the web can find and read this note.

        Link with GitHub

        Please authorize HackMD on GitHub
        • Please sign in to GitHub and install the HackMD app on your GitHub repo.
        • HackMD links with GitHub through a GitHub App. You can choose which repo to install our App.
        Learn more  Sign in to GitHub

        Push the note to GitHub Push to GitHub Pull a file from GitHub

          Authorize again
         

        Choose which file to push to

        Select repo
        Refresh Authorize more repos
        Select branch
        Select file
        Select branch
        Choose version(s) to push
        • Save a new version and push
        • Choose from existing versions
        Include title and tags
        Available push count

        Pull from GitHub

         
        File from GitHub
        File from HackMD

        GitHub Link Settings

        File linked

        Linked by
        File path
        Last synced branch
        Available push count

        Danger Zone

        Unlink
        You will no longer receive notification when GitHub file changes after unlink.

        Syncing

        Push failed

        Push successfully