調查問卷開發與應用-期中考前範圍

# <p align="center">調查問卷開發與應用 CH1-CH5</p> [簡單一點的版本](https://hackmd.io/@68ZAczErQD2ELQBcxxI4xQ/ByNcfvaa1e) # 第一章：測驗與評量概說 ## 測量的定義與類型 ### 測量定義 - **測量**是指使用一套符號系統來描述被觀察對象的某個屬性。這個過程並非直接觀察，而是將所關心的現象轉換成變項（變數）來進行衡量。 - 在心理學中，我們常常測量的是**心理構念**，例如情緒、人格、動機、憂鬱等，這些都是無法直接觀察的心理狀態，需要通過間接的方式來推測。 ![image](https://hackmd.io/_uploads/ryII_5p6kg.png) ### 測量的類型 - **物理測量**：這類測量能夠直接觀察，並使用標準化的工具，例如使用尺子量身高、使用儀器測量體重等。 - **心理測量**：與物理測量不同，心理測量針對的是無法直接觀察的心理現象，如幸福感、憂鬱、創造力等。這些需要透過問卷、測驗等工具來進行。 ### 變數的類型 1. **可觀察變數（Observed Variable）**： - 這類變數可以直接觀察並測量。舉例來說，**身高**、**體重**等是可觀察變數，可以用尺子或其他儀器直接測量。 2. **潛在變數（Latent Variable）**： - 潛在變數是指無法直接觀察的心理構念，如**憂鬱感**、**自尊**等。我們無法直接看見一個人是否有憂鬱，但可以透過一系列問題來推測其程度。 - 這些變數是研究的核心，我們的目的是通過測驗題目等工具來間接測量這些潛在變數。 --- ## 測驗量表的定義 - **測驗量表**：測驗量表是指用來測量心理特質或行為現象的工具。測驗的目的是通過一系列問題（題項）來反映受測者的心理構念。 - 測驗是基於**標準化程序**進行的，它要求每個受測者都使用相同的工具，並且測量的過程需要依照一定的規範進行。 ### 心理測驗的三要素 1. **行為樣本的組合**： - 行為樣本指的是測驗中的題項。這些題項需要具備**代表性**與**充分性**，確保測量目標能夠真實反映所要測量的構念。 - 例如，測量**憂鬱感**的題項應包括對受測者情緒、行為、認知等方面的測量，不能僅依賴單一題目。 2. **標準化程序**： - 測驗工具必須經過**標準化**過程，包括設計、預測試、修正等。這樣可以確保測驗結果的一致性，無論在哪個時間或地點進行測試，結果都應該具備穩定性。 - 標準化過程通常需要大量的樣本來驗證測驗的效果，這一過程不僅限於題目的設計，還包括施測的環境、計分方式等。 3. **計分法則**： - 計分法則確保測驗結果能夠被**客觀**和**精確**地評估。無論由誰來進行計分，都應該能夠得到一致的結果。 - 例如，在心理測驗中，如果有一個題目需要評估受測者的**自信心**，則每個受測者在同樣的回答情境下應該能夠得到相同的分數。 --- ## 測量的形式 ### 度量化（Scaling） - **度量化變數**是指我們使用數字來表示某個屬性的強度或程度。例如，憂鬱症的程度可能用1到5的分數來表示，1表示輕微，5表示重度憂鬱。 - 這些數字可以表示不同程度的屬性強度，也可以比較不同受測者之間的差異。 ![image](https://hackmd.io/_uploads/HkxAdcpaJg.png) ### 分類（Classification） - **分類變數**則不包含強度的區別，它是將對象根據某些屬性分成不同的類別。例如，**性別**（男性、女性）或**血型**（A型、B型、O型、AB型）等。 - 這些類別並沒有內在的排序關係，每一類都是平等的。 --- ## 補充 - 老師強調，心理測量的**最難測量的**就是那些**無法直接觀察的心理構念**。像是幸福感、憂鬱感等情感層面的東西，是無法直接目視或量化的，這也是為什麼心理學家需要使用一系列問卷或測驗工具來反映這些心理狀態。 - 老師在課堂上提到，**人心難測**這個概念，並強調這不僅僅是指**女性的心理**難測，所有人的心理都一樣難以觀察與測量。這也是為什麼測量心理構念需要特殊的工具來間接測量。 - 測驗工具的開發是科學的過程，需依賴大量的樣本來驗證效度和信度，並且需要標準化程序來確保結果的一致性。這一過程涉及大量的設計與測試，確保每一個受測者能夠在公平的條件下進行測試，並產生有效的測量結果。 </br> # 第二章：測驗標準與倫理 ## 測驗標準 ### 測驗標準的建立 - 測驗標準是指針對測驗發展與應用所制定的一系列規範，這些標準是由專業機構制定的，旨在確保測驗工具的有效性和可靠性。標準的制定通常包含了以下幾個方面： 1. **效度**：測驗必須能夠測量其所聲稱測量的內容，例如測量智力的測驗必須真正測量智力，而非其他特質。 2. **信度**：測驗的結果必須是穩定且一致的。測驗結果的可靠性應經過多次測試或多種施測方式來檢驗。 3. **適當的使用**：測驗的使用必須符合法律和倫理規範，保障受測者的權利與隱私。 ### 標準的制定機構 - 測驗的標準主要由專業機構負責制定，這些機構通常包括美國教育研究協會（AERA）、心理學會（APA）、測量學會等。這些機構會定期更新標準，並推動測驗發展中的最佳實踐。 --- ## 測驗倫理 ### 測驗的倫理問題 - 測驗的倫理問題主要涉及受測者的權益，這些問題包括： 1. **保密性**：受測者的測驗結果應該保密，未經許可不得公開。測驗結果應只用於預定的用途，並且應向受測者清楚說明其用途。 2. **知情同意**：在進行測驗之前，受測者必須獲得充分的資訊，包括測驗的目的、過程、可能的風險和受測者的權利，並明確同意參與測驗。 3. **公平性**：測驗設計應該公平，避免任何形式的文化或性別偏見。測驗應對不同背景的受測者保持公正。 ### 測驗的公正性與公平性 - 測驗的設計與應用應確保公平性，特別是在跨文化應用時。公平性要求測驗不會因為受測者的文化、性別、年齡等因素而導致不公正的結果。 - 例如，針對特定文化背景的測驗可能會因為語言或文化差異而偏向某一群體，這樣會影響測驗的有效性和可靠性。因此，在設計測驗時，需要考慮這些因素，確保測驗的適應性。 ### 受測者的權益 - 測驗的應用必須考慮到受測者的權益，特別是在測驗結果對其生活或工作有重大影響時。測驗不應該成為決策過程中的唯一依據，應該與其他信息一起使用。 --- ## 測驗使用者的資格 ### 使用者資格的要求 - 測驗使用者，尤其是心理測驗的實施者，應具備專業背景和資格。這樣可以確保測驗結果的正確解釋，並減少誤用的風險。 - **專業資格**：測驗使用者應該具有心理學、教育學或相關領域的專業背景，並且在使用測驗工具之前，需要接受專業訓練。這樣可以保證測驗過程和結果的解釋都符合專業標準。 - **訓練與經驗**：除了專業背景，測驗使用者還需要有足夠的實踐經驗，尤其是在解釋測驗結果時，必須能夠理解測驗結果對受測者的意義。 ### 購買與使用測驗的資格 - 並非每個人都可以隨意購買測驗。測驗的購買與使用通常受到嚴格的規範： 1. **學校與機構**：許多學校、醫療機構或政府認可的機構可以購買和使用測驗。 2. **資格審核**：企業或研究機構在使用測驗前，需要經過資格審核，並向相關機構申請使用許可。 3. **心理學專業資格**：只有持有心理學師或相關領域資格的專業人員才能合法購買和使用心理測驗。 --- ## 測驗的應用範疇 ### 教育領域 - 在教育領域，測驗被廣泛應用於學業評量、入學選拔等。測驗不僅用來評估學生的學習成果，還可作為課程安排、學習計劃的依據。 - **學業測評**：測驗可以幫助了解學生在某個學科或領域的掌握程度，並指導教學策略的調整。 - **入學測驗**：許多教育機構使用標準化的入學測驗來評估學生的學術能力，選擇適合的學生進入學校。 ### 職業與人事應用 - 在職業選擇與人事管理中，測驗被用來評估應聘者的能力、興趣和性格特徵，從而幫助企業選擇合適的人才。 - **職業適應測驗**：這類測驗幫助個人了解自己是否適合某一特定職業，並提供職業生涯的規劃建議。 - **員工選拔與培訓**：企業在招聘過程中可以利用各種心理測驗來篩選合適的員工，並且通過測評來確定員工的培訓需求。 ### 醫療與臨床應用 - 測驗在臨床心理學和精神科領域具有重要應用，用來幫助診斷和治療心理障礙或情緒問題。 - **心理健康測驗**：例如用來評估抑鬱症、焦慮症的程度，幫助醫生制定治療計劃。 - **臨床診斷**：測驗可用於輔助臨床診斷，例如透過量表來確定病人的情緒或行為問題的嚴重程度。 # 第三章：測評工具的發展程序 ## 測評工具的發展 ### 測評工具的開發過程測評工具的開發是一個系統的過程，通常經歷以下幾個步驟： 1. **確定測量目標**： - 開發測評工具的第一步是明確測量的目標和範疇，這意味著我們需要清楚定義我們希望測量的心理構念。例如，如果要測量「情緒健康」，我們需要確定是測量「焦慮」、「抑鬱」還是其他情緒相關的構念。 2. **設計測量工具**： - 根據測量目標，設計測量工具。這包括編寫問卷或測驗題項，並選擇合適的測量形式（如選擇題、填空題、量表等）。設計時要確保問題能夠全面且準確地反映所測量的構念。 - 例如，若測量「自尊」，設計問題時需要涵蓋自我認知、他人評價等方面的指標。 3. **預測試與修正**： - 測評工具設計完成後，需要進行預測試。預測測試的目的是檢測工具的可靠性和有效性，並識別其中的問題。這些問題可能是題項不夠清晰、內容不夠全面，或是測量結果不穩定等。 - 透過預測試獲得反饋後，對測驗進行修正，改進題目和測量方式，直到測驗能夠準確有效地測量所設定的構念。 4. **正式施測與評估**： - 修正後的測驗進行正式施測，並收集足夠的數據以便進行效度和信度的評估。這一步驟是測評工具開發中的重要部分，通過大量數據分析來確保測評工具的可靠性和準確性。 ### 測評工具的驗證 - 在測評工具的開發過程中，對其進行驗證是至關重要的，驗證主要包括**效度**和**信度**的測試： - **效度（Validity）**：確保測評工具能夠有效測量預定的心理構念。例如，若測量的是「創造力」，測驗必須能夠反映出創造性行為或思維的多樣性。 - **信度（Reliability）**：確保測評工具在不同時間、不同環境或不同施測者之間結果的一致性。信度通常通過重測信度、內部一致性等指標來測量。 --- ## 測評工具的分類根據測量內容、性質和形式，測評工具可以分為不同的類型。常見的分類方式包括： 1. **根據測量內容分類**： - **智力測驗**：測量受測者的思維能力和知識掌握程度，例如智商測驗。 - **性格測驗**：測量受測者的性格特徵、情緒反應等心理特質，例如大五人格測驗。 - **能力測驗**：測量受測者在特定領域或職業中的能力，例如語言能力、數學能力測驗。 2. **根據測量工具的形式分類**： - **問卷調查**：通常包括一系列的選擇題或評分量表，常見於社會科學研究中。 - **實驗測試**：包括各類測量反應時間、決策過程等的實驗工具，常見於認知心理學研究中。 - **訪談與觀察**：直接與受測者互動，通過訪談或觀察行為來收集數據，通常用於質性研究。 --- ## 測評工具的應用 ### 教育領域 - 在教育領域，測評工具被廣泛應用於學業成績測量、入學選拔等。 - **學業測量**：測量學生在某些學科上的掌握程度，例如使用標準化考試測量數學或語文能力。 - **入學測驗**：學校和大學常使用測評工具來篩選申請者，評估他們的學術潛力或適應能力。 ### 醫療領域 - 在臨床心理學和精神健康領域，測評工具被用來診斷和治療各種心理問題或情緒障礙。 - **精神疾病診斷**：例如抑鬱症、焦慮症等的測量工具，可以幫助醫生了解病人的病情。 - **心理健康篩查**：這些測評工具也可以用於大範圍的心理健康篩查，對於特定群體進行篩查，發現可能的心理健康問題。 ### 職業與人力資源領域 - 測評工具也廣泛應用於職業選擇和招聘過程中，幫助企業選擇適合的員工。 - **職業適應測量**：這類工具幫助應聘者了解自己是否適合某個職位或行業，通常包括興趣測驗、能力測試等。 - **員工選拔**：企業使用測評工具來篩選應聘者，特別是大公司會使用多種測評工具來評估應聘者的能力、性格和工作潛力。 # 第四章：題型格式與題本組成 ## 測驗題型 ### 題型的設計與選擇測驗題型的設計與選擇非常重要，因為不同的題型適用於不同的測量目標。常見的測驗題型有以下幾種： 1. **選擇題（Multiple Choice）**： - 這是最常見的題型之一，受測者需要從給定的選項中選出正確答案。選擇題的設計要求問題具有清晰性，選項間不應有重疊，並且應涵蓋所有可能的答案範圍。 - 優點：便於自動計分，適合測量知識掌握、事實性問題。 - 缺點：容易造成猜測行為，無法深入測量受測者的思維過程。 2. **填空題（Fill in the Blank）**： - 這類題型要求受測者在空格處填寫正確答案。填空題更能測量受測者對特定知識的掌握程度，並能促進思考。 - 優點：要求受測者主動思考，能夠反映受測者的知識掌握情況。 - 缺點：計分相對較為繁瑣，且可能因書寫不清晰而影響計分結果。 3. **是非題（True or False）**： - 這是一種簡單的題型，受測者需要根據問題的陳述判斷其真假。這類題型主要用於測量知識或事實性問題。 - 優點：簡單、迅速，容易設計與計分。 - 缺點：受測者有50%的猜測機會，難以測量複雜的概念或深入的理解。 4. **簡答題（Short Answer）**： - 受測者需要用簡短的文字來回答問題，這類題型能夠測量受測者的理解與表達能力。 - 優點：可以測量受測者的思維過程和表達能力。 - 缺點：計分較為主觀，需要有明確的計分標準來確保公平。 5. **問答題（Essay）**： - 受測者需要對問題作出詳細的回答，通常用來測量更高層次的理解、分析與表達能力。 - 優點：能深入了解受測者的思維過程，適用於測量綜合性能力。 - 缺點：評分主觀性較強，批改時間長，且不便於大範圍施測。 ### 題型的選擇原則選擇題型時需要考慮以下幾個原則： 1. **測量目的**：根據測量的目的來選擇合適的題型。例如，若測量知識掌握程度，選擇選擇題或填空題較為合適；若測量理解與分析能力，則應選擇簡答題或問答題。 2. **受測者的特點**：選擇適合受測者的題型，考慮其文化背景、語言能力等因素。 3. **計分方式**：題型的選擇應該考慮到計分的方便性與客觀性。對於大範圍施測的情況，選擇易於自動化計分的題型，如選擇題、填空題會更加方便。 --- ## 題本的組成 ### 題本結構測驗題本的組成包括以下幾個基本部分： 1. **導言部分（Introduction）**： - 在測驗開始之前，題本應包括簡短的介紹，向受測者說明測驗的目的、結構及注意事項。這部分應簡單明瞭，讓受測者清楚了解測驗的規則和流程。 - 例如：測驗的時間限制、作答方式、題目數量等。 2. **題目部分（Items）**： - 題目部分是題本的核心，包含所有的測驗題目。每個題目都應該清晰、無歧義，並且能夠有效測量所設計的構念。 - 題目應按難易度排序，從簡單到複雜，以確保測驗能夠全面衡量受測者的能力或特質。 3. **結束部分（Conclusion）**： - 結束部分通常會包含感謝語，並提醒受測者完成測驗後的處理方式，如提交測驗卷、休息時間等。 - 若測驗需要進行後續分析，應告知受測者如何獲取測驗結果。 ### 題本的編排原則 - **題目順序**：題目的排序應該從簡單到難，或者按照測量層次（如從事實性知識到分析、綜合能力）進行排列。 - **題目設計的平衡性**：題目要涵蓋測驗目標的所有層面，確保測驗的全面性，避免偏向某一類型的題目。 - **清晰性與簡潔性**：每個題目應該表述清楚，避免使用難懂或模糊的語言，讓受測者能夠準確理解題意。 ### 題本的測驗長度 - **題本長度**應該根據測量目的、受測者的耐力及時間限制來進行調整。測驗時間不宜過長，以免受測者感到疲勞，影響測驗結果的有效性。 - 在設計測驗時，應考慮每個題目所需的時間，並確保整個測驗在合理的時間內完成。 --- ## 測驗題型的結合與運用 ### 題型的綜合應用 - 測驗通常會使用多種題型來進行綜合測量。例如，在一個學科的學術能力測驗中，可能會先使用選擇題來測量知識的掌握，再使用簡答題來測量理解與應用能力，最後用問答題來測量綜合分析能力。 - 結合不同的題型可以讓測驗更全面，能夠測量受測者的多個方面，並提高測驗結果的準確性。 ### 試題設計的多樣性 - 在設計測驗時，應該避免過於單一的題型，因為單一題型可能無法全面測量受測者的能力或心理構念。不同題型的運用可以激發受測者的不同思維，從而獲得更為準確的測量結果。 # 第五章：測驗分數的應用與常模 ## 測驗分數的應用 ### 測驗分數的功能測驗分數不僅僅是一個數字，它在不同情境下有多種應用。測驗分數能夠幫助我們了解受測者的心理狀態、能力、行為等多方面的特徵，並且在多個領域中發揮作用。主要的功能包括： 1. **描述性功能**： - 測驗分數可以用來**描述受測者的當前狀況**。例如，學業測評中，學生的測驗分數能反映他們在某一學科的知識掌握情況。透過測驗分數，我們可以了解受測者的能力水平，並確定他們在哪些領域有優勢或需要改進。 2. **預測功能**： - 測驗分數可以用來**預測未來的行為或表現**。例如，職業選擇測評可以預測一個應聘者在某個職位上的表現；學校的入學測驗可以預測學生未來的學業表現。在這個過程中，測驗分數作為對未來行為的指標，可以幫助人們做出有根據的決策。 3. **分類功能**： - 測驗分數常常用來**將受測者分為不同的群體**。例如，在學校的分班過程中，學生的測驗分數可以決定他們被分配到哪個班級。職場上，測驗分數可以幫助企業將應聘者劃分為不同的職位層級或訓練需求。 4. **決策功能**： - 測驗分數在許多重要決策中發揮作用。比如，學校會根據學生的入學測驗成績做出錄取決定；企業也會根據員工的測評結果來進行升遷、晉升等決策。 ### 測驗分數的解釋測驗分數本身的數字並不意味著所有的解釋。正確的解釋必須依賴於對分數的背景和標準的理解。當我們解釋測驗分數時，除了觀察分數的絕對值外，還需要把它與**常模**（即群體的測驗結果）進行比較，這樣才能了解某個分數在整體群體中的位置。 - **常模參照**：通過將受測者的測驗分數與群體的分數進行比較，可以了解受測者的相對位置。例如，一個學生的數學測驗分數為80分，如果大部分同學的分數都在70分左右，那麼這位學生的表現就顯得非常突出；反之，如果大部分同學的分數接近90分，那麼這位學生的80分就顯得較為一般。 - **效標參照**：效標參照測驗則不關心其他人的表現，而是將分數與預定的標準或目標進行比較。例如，在駕照考試中，所有考生都需要達到一定的標準才能通過，無論他們與其他考生相比如何。 --- ## 常模的使用 ### 常模的定義 **常模**（Norm）是指基於一定樣本數據所建立的測驗結果參照標準。常模幫助我們理解受測者的測驗分數在整體群體中的位置。這樣，我們能夠將單個受測者的分數與群體的分數進行比較，進而做出更有意義的解釋。 - **常模的作用**：常模不僅能幫助我們了解受測者的相對位置，還能用來判斷受測者是否處於正常範圍內。例如，在心理健康測評中，常模幫助我們判斷某個人是否存在焦慮或抑鬱的症狀，並對其進行相應的干預。 ### 常模的建立建立常模的過程是根據大量受測者的測驗結果來推導的。通常，這個過程包含以下步驟： 1. **樣本選擇**： - **樣本代表性**：選擇的樣本必須能夠代表整個目標群體的特徵。這意味著樣本的年齡、性別、文化背景等應該與整體群體相符。 - **樣本大小**：常模的建立需要足夠大的樣本來確保結果的穩定性和有效性，通常需要幾百甚至幾千人的測量數據。 2. **統計計算**： - 一旦樣本數據收集完成，就需要進行統計分析，通常會計算**平均數**、**標準差**等指標。這些指標能夠幫助我們了解測驗分數的分布情況。 - 例如，假設在一項數學測驗中，某學校的學生平均分數是75分，標準差是10分。這意味著大部分學生的分數集中在65分到85分之間。 3. **標準化處理**： - 標準化過程是將測驗結果轉換為可以比較的分數，例如將其轉換為**Z分數**或**T分數**。這樣的標準化處理能夠消除測驗本身的單位差異，讓不同測驗的分數可以進行直接比較。 ### 常模的類型常模根據測量方式和比較對象的不同，主要分為兩種： 1. **常模參照測驗（Norm-Referenced Testing）**： - 在常模參照測驗中，受測者的分數是根據群體的分數來解釋的。這類測驗的目的是將受測者的表現與其他人進行比較。 - 例如，學校的期末考試或國家標準化考試中，學生的分數往往會與全國或學校的其他學生進行比較，從而確定學生的相對位置。 2. **效標參照測驗（Criterion-Referenced Testing）**： - 效標參照測驗則關注受測者是否達到特定的標準或要求，而不關心其他人表現如何。這類測驗用於測量是否達到預定的能力或知識水平。 - 例如，駕照考試、英語語言能力測試等，考生是否合格取決於是否達到預定的標準，而不是與其他考生的表現進行比較。 --- ## 測驗分數的解釋與應用範疇 ### 測驗分數的解釋測驗分數的解釋應該依賴於標準化和常模參照。這不僅是關於分數的大小，還包括分數所處的群體範圍、標準偏差等因素。對測驗分數的解釋需要考慮以下幾點： - **受測者背景**：解釋分數時應考慮到受測者的年齡、性別、教育背景等因素，這些都會影響測驗結果。 - **測驗環境**：測驗的環境、施測的時間和方式等也會對結果產生影響。 - **測量目的**：解釋分數時，還要根據測量的目的來進行解釋，無論是學業成績、職業適應還是心理健康等。 ### 測驗結果的應用範疇測驗結果的應用範疇廣泛，主要包括以下幾個領域： 1. **教育領域**： - 測驗結果可用於學業成績的評估，學校會根據學生的測驗結果來調整教學策略或分班。 2. **心理健康篩查**： - 測驗結果可用於心理健康篩查，幫助診斷心理疾病或情緒障礙，並對患者提供相應的干預。 3. **職業選擇與招聘**： - 測驗結果在職業選擇和招聘中發揮著重要作用。企業會根據應聘者的測驗分數來進行選擇或篩選，這樣可以幫助企業挑選最適合的人才。