# 0929設計方法報告 pdf 143~162 彥均:section 1~3 士軒:section 4~6 季馨:section 7~9 最晚9.27 傳筆記 最晚9.24晚上整理大綱+空白ptt ## ***Preview*** 在第一章中科學家如何發展律法和理論去解釋他們觀察到的現象,要做到這一點,我們必須從**一般關於行為的廣泛類別的陳述到具體的例子,**要研究的現象可以是任何事件複雜性和多樣性。當我們開始通過實驗研究事件時 ,我們必須去除其中的一些複雜性。 本質上,我們採取現象並將其轉化為一個或多個變量。 變量:在測試條件的某個面向,在不同條件下改變或是呈現不同特徵。 目的是可以減少現象變量將研究人員的注意力集中在特定事件上。 興趣現象是社會痛苦。至研究這種現象,有必要指定某些類別的事件作為要測量的變量並忽略其他事件。 德沃爾和他的 同事 (2010) 測量了學生的每日傷害感受水平,每日水平積極情緒等等。 理論概念是無形的:**飢餓、愛、 動機,焦慮**。這些變量通過以下方式與理論概念相關聯用於衡量概念的操作定義的手段。 假設你的理論說增加焦慮會增加歸屬感動機。要檢驗這個理論,你必須掌握以下理論概念`焦慮和歸屬動機`,並將它們與現實世界中的變量聯繫起來通過操作定義。 理論是一個抽象的陳述。 你必須把它歸結為案件。 你可以用泰勒測量焦慮通過人們坐在一起的距離來表現焦慮量表和從屬關係,在實驗中。這兩項措施構成了研究的變量。 **焦慮和距離變量**的得分與一個相關,另一個作為假設的檢驗。變量之間的關係是被視為支持或反對產生的特定理論本實驗。此研究中研究人員忽略了學生的成績、在校年份和社會經濟狀況。 在本章中,我們研究了一些與變量相關的主題。首先,我們使變量類型之間對心理學很重要的幾個區別, 然後我們討論測量的概念。 在討論變量的類型之前,我們必須說明變量 # *不同種類的變量* 了解變量是如何在心理學中使用和討論的研究,必須了解之間的幾個區別變量的類型。 * 因變量和自變量 1.變量之間最基本的區別是因變量之間和自變量。 2.因變量是行為的度量的主題。**因變量**是個人或動物使此響應可能是某種測試的分數,也可能是一種行為反應 例如: **假設我們對音樂的存在是否會改變名為 Yolanda 的參與者的跑步行為感興趣**。 我們可以用幾種不同的方式或維度來衡量這種行為。 如果我們用頻率來衡量她的跑步,我們會計算 Yolanda 跑步的次數,或者她的腳著地的次數,因為頻率是特定行為發生的次數。 如果我們測量Yolanda跑步時每小時行駛的英里數,我們實際上是衡量她行為的速率,因為***速率是頻率與時間***的比值。 如果我們測量時間長度 Yolanda 在任何給定的地點跑步,我們將***測量她跑步的持續時間***。雖然這三個維度可能是衡量跑步的明顯方法,也可以用其他四種方式來衡量方法。 例如:如果我們讓 Yolanda 跑步,然後測量她開始跑步的時間,我們就會延遲測量。更仔細地檢查 Yolanda的跑步方式,包括她的步幅(以測量她的行為型態),以衡量她的行為或地形的形狀。當測量Yolanda的雙腳著地的強度時,它被稱為力量。如果我們想描述 Yolanda 跑步的環境或區域,我們會測量軌跡。 我們稱這些類型的測量為**因變量**,因為它們取決於(我們希望)另一個變量(**自變量**)的值。 在第 1 章中,我們說過一個目標,科學是在世界上的事件之間尋找合法的關係。這些關係會在因變量和自變量之間尋找。 自變量是一個被認為會導致一些變化的變量 因變量的值。在上面關於運行的示例中,**自變量是音樂;我們希望這會影響Yolanda的行為。** 在第 1 章關於社會痛苦的例子中,自變量是學生服用的藥丸;研究人員希望 Tylenol® 能減輕社交痛苦,而安慰劑則不會(DeWall 等人,2010 年)。 自變量是刺激-反應心理學的刺激。刺激一詞,在其最普遍的用途中,等同於一個原因。作為另一個示例,請考慮以下示例中的挫敗感。 **根據著名的挫折-攻擊定律,挫折導致攻擊。** 我們可以通過向學生承諾完成某項任務(例如塗色)獲得獎勵來測試挫折-攻擊定律。學生將被分成兩組。我們可以給一組獎勵,但給另一組一些藉口,說明他們為什麼不能得到承諾的獎勵,這可能會增加挫敗感。如果受挫組認為該任務不如未受挫組有趣,那麼我們將確認該假設。 (在測量因變量後,倫理和實際考慮都應該引導你給兩組人承諾的獎勵!)這裡,自變量是學生是否獲得了承諾的獎勵。因變量是他們對任務有趣程度的評價。 每個自變量至少有兩個值;否則,它不會是一個變量。這些值通常稱為級別。在挫折-攻擊法則的例子中,自變量有兩個層次:沮喪而不沮喪。 社交痛苦的例子(DeWall 等人,2010 年)對於自變量也有兩個水平:Tylenol® 和安慰劑。儘管將自變量視為原因和因變量作為一個效果,它並不總是那麼簡單。有時 我們很難確定研究中的兩個變量中的哪一個是原因和效果。 例如,暴力之間存在關係,行為和看電視。我們可能很難做出決定,觀看暴力電視節目是否會導致暴力行為或暴力傾向是否導致人們觀看暴力節目。 在此類調查中,變量通常被稱為感興趣變量,因為觀察到的變量之間關係的因果關係尚不清楚。 這個問題是第 8 章和第 9 章討論的非實驗研究的典型問題。 > ***自變量通常可以被認為是研究人員對受試者所做的事情,而因變量是受試者所做的事情。*** 儘管這條規則在許多情況下都是正確的,但有時也有研究人員不會操縱的自變量。 這些被稱為***主題變量***。 主題變量的示例是**貧困**和一個人的**性別、年齡或智商** (IQ)。 這些自變量不能由研究人員控制。我們將在第 8 章、第 9 章和第 13 章專門討論使用此類非操縱自變量的研究。正如我們將在這些章節中看到的那樣,正是因為它們沒有被操縱,所以在解釋時需要更加小心。 --- * Confounded Variables (混雜的變量) 混雜變量是隨自變量變化的變量。 假設想研究顏色偏好的性別差異。如果在他的研究中,所有男性參與者在嬰兒時期一直穿著藍色,而所有女性參與者一直都穿著粉紅色,那麼嬰兒時期所穿衣服的顏色就會與性別混淆。 Marshall教授無法確定是否存在顏色差異,在他的研究中,男性和女性之間的偏好是生物學或過去經驗的結果。 因此,在Marshall教授的研究中,性別這一主題變量不幸與過去的經驗相混淆。您可以很容易地看到,性別差異可能是由對待男孩和女孩的方式的各種差異造成的。在使用諸如性別等主題變量的研究中,混淆是一個大問題,因為男性和女性在許多方面都有所不同。 --- * Not All Details of a Study Are Independent Variables 並非研究的所有細節都是自變量,要成為一個變量,某些東西必須變化。為了確保意外變量不會混淆研究,許多潛在變量在不同條件下保持不變或相同。 例如,在 DeWall 等人中。2010) 對社會痛苦的研究、印有傷害感量表的紙的顏色、房間的照明以及研究的所有其他附帶細節都不是變量,因為它們在不同條件下(在那些服用 Tylenol® 和服用安慰劑的人)。相反,它們在各種條件下受到控製或保持不變。顯然,紙必須是某種顏色,他們必須在房間裡使用某種類型的光,等等。但除非調查人員改變紙張的顏色或房間照明的類型,否則這些細節不是變量。這樣的細節可能對實驗的成功至關重要,但在這項特定研究中保持不變,而不是作為變量包含在內。現在,一些後來的研究者可能會在後續實驗中將這些細節變成變量,但在本研究中它們不是變量。~~ --- * Quantitative and Categorical Variables(定量和分類變量) 一些變量是定量的,而其他變量是分類的,這一區別很容易說明,儘管它可能難以應用於特定情況。 定量變量是數量變化的變量,而分類變量是種類變化的變量。 定量變量的例子是。 大學專業(科系)和性別(男女)將是分類變量,功能是將研究對象分類。 定量變量和分類變量之間的區別可以當我們開始建立理論時變得很重要。 例如,理論家就味覺爭論不休,詢問是否存在不同的基本味覺——咸、酸、甜和苦味——或者是否所有味覺都屬於一個連續統一體,四種基本味覺只是方便但隨意的類別(McBurney & Gent, 1979)。 出於同樣的原因,在製作圖表時必須牢記定量變量和分類變量之間的區別,正如我們將在第 14 章中看到的那樣。 --- * Continuous and Discrete Variables(連續變量和離散變量) 一些定量變量可以在連續統一體上取任何值。它們被稱為連續變量,因為它們不限於特定數量的值。原則上,您可以以任何所需的精度測量槓鈴推舉的延遲、持續時間或力量;在實踐中,測量的精細度受限於測量儀器的能力。相比之下,離散變量屬於不同的分類,正如離散這個詞所暗示的那樣。締結的婚姻、犯下的謀殺案或寫的書都是離散變量。雖然一個變量可能是連續的,但它的測量往往是不連續的。 雖然身高是一個連續變量,但我們通常會測量到最接近的英寸。同樣,心理學研究方法的知識可能是一個連續變量,但它通常以測試中正確項目的數量來衡量,這是一個不連續的衡量標準。這不會使知識成為一個離散變量,因為原則上可以按照人們的意願盡可能精細地衡量知識。 由於連續變量通常以不連續的方式測量,因此有必要將測量的實際限制與表觀限制區分開來。研究方法測試分數的明顯限制是一個無限小的分數:分數為 1、2 或其他整數。但該分數代表對材料知識的估計,它是一個連續變量。真正的限制是該分數加上或減去到下一個分數的距離的一半:0.5 到 1.5、1.5 到 2.5,等等。當繪製數據並執行某些統計計算時,這種區別很重要。 變量按其數值表現是否連續,分為連續變量和離散變量。離散變量指變量值可以按一定順序一一列舉,通常以整數位取值的變量。如職工人數、工廠數、機器台數等。有些性質上屬於連續變量的現象也按整數取值,即可以把它們當做離散變量來看待。例如年齡、評定成績等雖屬連續變量,但一般按整數計算。 --- * Measurement(測量) 測量是根據允許對像或事件的重要屬性由數字系統的屬性表示的規則將數字分配給事件或對象。 這個定義的關鍵是事件的屬性由數字系統的屬性表示。 將數字分配給事件的規則決定了測量的有用程度。 例如,如果我們稱每個心理正常的人為 0,每個心理障礙的人為 1,我們會進行一種測量:我們會根據規則為人們分配數字。 該規則允許我們計算屬於這兩類的人數,並確定人口中心理異常的百分比。 正在對進行測量的規模做出假設。例如,10的外觀是否會是5的兩倍?另一方面,學生可能會迴避數學參與測量。有些人可能對數字感到不安,而另一些人可能會被關閉,因為對他們來說,數字使主題變得更加枯燥和不那麼人性化。我們不能完全擺脫做實驗心理學所需的數學。原因很簡單。正如人們常說的,一個領域的科學進步的標誌是它定量地陳述其規律的程度。定量地陳述規律的能力意味著兩件事是正確的。 首先,這種現象足夠有規律,可以對它做出合理準確的陳述。過於多變的數據可能會掩蓋任何基本規律;他們變化太大,無法觀察任何關係。的確,存在許多巧妙的技術來揭示潛伏在數據中的規律性,但科學家總是努力使現象的規律性變得顯而易見,盡可能地,以便可以精確地陳述定律。用數學方法陳述定律的第二個含義是,該定律是簡單到可以寫出一個方程式來描述它。如果法律包含許多限定性陳述和特殊條件,則方程式將變得複雜才能準確。複雜的方程很難測試。出於這個原因,科學家們在他們用來描述他們的數據的法律中尋求簡單性。這一事實是愛因斯坦著名的 E = mc2 能引起想像力的原因之一:他的理論簡單而優雅。在心理學中,一個一個優雅的定律的例子是史蒂文斯的感覺幅度定律:R = kSn。這個定律說,R,響應幅度,等於 k,一個任意常數,乘以 S,刺激強度,提高到一個冪,n。史蒂文斯定律激發了許多研究,並極大地影響了感覺過程領域,主要是因為該定律的表述非常優雅。 --- # Reliability and Validity of Measurements(測量的可靠性和有效性) ## reliability(可靠性): 在不同情境下,實驗是否能得到相同的結果。 ## validity(有效性): 實驗是否能達到想要的成果。 為了使實驗結果能夠有科學根據,它必須同時具有可靠性 和有效性。 以以下的例子為例,測量受試者的帽子尺寸和智力的相關性,顯然,這是一個非常糟糕的實驗,因為智商和頭的大小並無直接關聯。然而,這個測驗仍然是可靠的,因為每次測量你的頭部大小時都會得到相同的結果。但這個實驗顯然不是有效的,因為量測的數據和我們想要得到的結論無關。 現在嘗試另一個智力相關的測驗,問受試者"道瓊斯工業股票平均指數昨天收盤了嗎?",這個實驗是較為有效的,因為問題是關於一般的知識。平均而言,知道道瓊斯平均數比其他人更聰明。但這不會是一個非常可靠的測量,對於詢問同一個人不同的知識,它不會給出一致的結果。兩個測試都是不恰當的,帽子大小測試產生可靠但無效的數據,而道瓊斯平均測試產生有效但不可靠的數據,良好的智力測量實驗必須既可靠又有效。 下面描述測量的有效性,研究的有效性是一個相當廣泛的議題,我們將在第 6 章詳細討論它。 ## Variability and Error(變異性和誤差) 測量效度包括了: ### construct validity(結構效度) 有幾種方法可以確定測試是否產生具有結構效度: * 應該測試理論上應該測試的項目(ex.領導能力測試不應該等於測試外向性。) * 不應測量太多不相關的結構(ex.音樂天分不需要太多的閱讀能力) * 測試應該證明在預測與其測量的理論概念相關的結果方面是有用的。(ex.音樂能力測試應該預測誰將從音樂課中受益,應該區分選擇音樂作為職業的群體和不是的) ### Face validity(表面效度) 任何受試者都應該接受實驗應該受測的內容,然而,表面有效性更多是公共關係的問題,通常測試較傾向有高或低的效度,較少考慮它的表面效度。 ### Content validity(內容效度) 指測驗應該針對將要被測量的理論概念進行抽樣。舉例來說,智力測試應該測量一般知識、語言能力、空間能力和定量能力等。 一種僅測量空間能力的智力測試不會有足夠的內容有效性。 ### Criterion validity(標準效度) 指一項有效的測試必須與其他具有相同理論結構的測試高度相關,舉例來說,一項有效的智力測試應該與其他智力測試高度相關,它也應該與被認為需要智力的行為相關,例如在學校表現良好。 如果智力測驗的標準給定與孩子在學校的考試表現有關 ,稱為並發有效性。如果一個智力的測試是如何預測孩子未來的表現,比如大學畢業後,那就叫預測有效性。舉反例而言,外向性和領導力的特質則不太有關聯。 涉及各種測試有效性的問題是技術問題;如需進一步討論,請參閱有關測試和測量的任何標准文件。 ### Types of Measurement Error(測量誤差的類型) 有兩種基本類型的測量誤差:系統的誤差和隨機誤差。以我的體重舉例,它在剛起床時會減少大約2磅,而若吃鹹的食物,它會增加大約3磅。 所有這些可變性都可以由自變量解釋,如夜間失水、暴飲暴食等引起的。那麼,這種可變性並不會被視為誤差,因為它與獨立變量相關。 系統性誤差在研究中是不應該存在的,假設整個研究過程的誤差相同——即所有研究的群體或條件同樣受到系統性的影響,稱為系統性誤差。 我的體重秤也記錄了我體重的變化,如果我在體重秤上不喜歡我所看到的,我有時再試一次,得到一個更低的讀數,甚至更高的讀數。這個可變性可以稱為隨機誤差(或誤差方差),它與任何已知的自變量無關。 隨機誤差一直是研究中的一個嚴重問題,因為它可以 降低評估自變量影響的精度。這是對測量可靠性的威脅。 ## Types of Reliability Measures(可靠措施的類型) 有兩種提高可靠性的方式,重測和內部一致性。重測信度關注的是相同的測量是否會在另一個情境產生相同的結果。一個例子是重考 SAT 或 GRE,一個好的測試會使兩次得分相近。 內部一致性涉及測試中的各個項目是否能測量同一個目標。舉例來說,分半信度的測量過程將測試中的項目被分成兩組,好像它們是兩個單獨的測試。 然後將兩半的分數相關聯,檢視是否同個人的分數在兩半是一致的。 如果是好的測試,它將具有很高的分半相關性。 另一種廣泛使用的內部一致性測量方法是 Kuder Richardson-20,K-R-20 被認為是計算一組數據上所有可能的分半相關性並取平均值。 K-R-20 的值可以從 0.0 ,這意味著完全不同意,到1.0,完全同意。 # * Types of Measurement Scales(測量尺度的類型) * **Nominal Scales(標稱秤)** **名義尺度是將對象或事件分類的尺度。** 認為那個烏爾夫是在美國的交換生。在學習蔬菜的英文名稱:蘆筍、西蘭花、玉米、青豆和 豌豆。他必須知道新鮮豌豆、冷凍豌豆和罐裝豌豆是相同的蔬菜,無論是蒸的、奶油的還是炒的。什麼是烏爾夫做的是學習一個簡單的蔬菜量表,它給出了每個例子, 一種蔬菜一個名字,其他蔬菜類的每個成員都有一個不同的名字。我們將開發這個相當基本的名義上的例子 隨著我們進展到其他類型的規模。 名義尺度是最簡單的尺度,因為它的分配規則對象或事件的數字(或其他標籤)是最簡單的。 規則是相同類型的對象或事件獲得相同的數量和對象或事件,不同種類的得到不同的數字。名義上的規模,作為名稱暗示,是一個分類系統。每個單獨的事件或對象,蔬菜在這種情況下,已分配到一個類。 人們有時認為名義尺度太原始而無法考慮適當的尺度。它似乎沒有多少數學。事實上,例如,可以使用單詞而不是數字來識別類別。 這種態度忽略了分類對發展的重要性的科學。正如我們在第 1 章中討論的,定義行為類別是發展行為規律的第一步。 --- * **Ordinal Scales**(序數尺度) 序數尺度是按對象或事件的大小順序對它們進行排序的尺度。 假設傑西卡的媽媽告訴她冰箱裡有五種蔬菜,並讓她按照自己喜歡的順序列出它們,其中 5 代表最喜歡的。 傑西卡可能會給她媽媽以下排名: 5 豌豆 4 玉米 3 綠豆 2 西蘭花 1 蘆筍 我們有傑西卡對蔬菜的偏好的順序量表。 在序數尺度上分配數字的規則是數字在尺度上的序數位置(等級順序)必須代表對像或事件的心理屬性的等級順序。 請注意,規模不告訴。 傑西卡更喜歡青豆而不是西蘭花。也許她喜歡豌豆、玉米和綠豆,但對西蘭花完全無動於衷。量表只給出偏好順序,而不是項目之間的偏好差異。 區間尺度區間尺度是一種尺度上的數字之間的差異是有意義的。讓我們假設尼科的媽媽對他說:“我知道你最喜歡豌豆,最不喜歡蘆筍。在 1 到 7 的範圍內,1 代表蘆筍,7 代表豌豆,你如何評價西蘭花、玉米和綠豆?”假設 Nico 給出以下數據: 7.0 豌豆 6.5 玉米 6.0 綠豆 5.0 西蘭花 4.0 3.0 2.0 1.0 蘆筍 從這些數據中,我們可以推斷出 Nico 對綠豆的喜愛程度介於西蘭花和豌豆之間。此外,綠豆和蘆筍之間有 5 個單位的差異,而玉米和綠豆之間只有 0.5 個單位的差異。 Nico 的媽媽比 Jessica 的媽媽更了解他對蔬菜的喜好。量表上的數字必須代表事件或對象之間相同的心理差異。 * **Ratio Scales** (比例尺) 比率量表是指具有有意義的零點以及量表上的數字之間存在有意義差異的量表。 1 假設 Jasmine 的母親對她說:“如果您對綠豆的感覺在開放式量表上是 10,您感覺如何關於西蘭花、玉米等? 如果你對某種蔬菜持中立態度,就給它一個零。 如果你喜歡一個是你喜歡另一個的兩倍,給它一個兩倍大的數字。 如果你不喜歡一種蔬菜,就給它一個負數。 –10 分表示您不喜歡蔬菜,就像您喜歡青豆一樣。 您可以使用任何號碼似乎合適;您可以使用的數字沒有上限或下限。”現在,假設 Jasmine 給出以下數據: 30 20個豌豆 15 玉米 10個綠豆 0 西蘭花 –10 –20 –30 –40 蘆筍 –50 茉莉媽媽開發的量表信息量最大 我們討論過的尺度。首先,這個量表有一個有意義的零點,其他天平都沒有。因此,我們可以知道茉莉花是 對西蘭花無動於衷。其次,數字之間的比率是有意義的。 我們可以說茉莉花喜歡豌豆的次數是綠豆的兩倍,或者她 討厭蘆筍是喜歡青豆的四倍。 按比例為事件或對象分配數字的規則是 量表上的數字之間的比率必須代表心理 事件或對象之間的比率。例如,如果你測量它的時間 花了三個人按一個按鈕來回答一個問題,他們的時間 可能是 50 毫秒、100 毫秒和 75 毫秒。因為反應 時間是一個比例尺度,你可以準確地告訴第二個人 按下按鈕的時間是第一個人的兩倍。和蔬菜一樣規模以上發展,反應時間有一個真正的零和之間的比率 這些數字是有意義的。 * **Comparison of the Scales**(量表比较) 當我們從名義到有序、間隔和比率尺度時,我們能夠從數據中獲得更多信息。 名義規模僅提供有關兩個事件是相同還是不同的信息。序數尺度也這樣做,但也給我們一些變量的排名。區間尺度傳達名義和有序信息,還允許我們對事件之間差異的大小做出定量陳述。比率尺度包含其他三個尺度的所有信息,以及傳達有關幅度比率的信息。為此原因,如果可能的話,我們努力使我們的變量比例比例尺。如果做不到這一點,我們會嘗試使用區間量表,依此類推。在我們進行過程中,您可能已經住意到每個人對五種蔬菜的評分與其他人的評分一致。也就是說,知道了Jasmine在比例尺度上的數據,我們可以推導出其他三個尺度的所有信息。這樣做是為了表明比率尺度是最強大的尺度,而其他尺度則按以下順序不太強大:區間、序數、名義。所以,茉莉的媽媽最了解她對蔬菜的喜好,而烏爾夫的女主人最不了解他的。具體來說,茉莉的媽媽知道她的女兒喜歡豌豆。比綠豆多一倍,對西蘭花無動於衷,不喜歡蘆筍的次數是喜歡豌豆的兩倍。另一方面,傑西卡的母親只知道她的偏好順序,而不知道它們之間的差異或零點。烏爾夫的女主人只知道他知道一種蔬菜或零點。烏爾夫的女主人只知道他知道一種蔬菜 另一種看待尺度類型差異的方法是問,我們如何在不違反尺度類型規則的情況下改變事件的數字分配?我們可以在不扭曲尺度的情況下改變對單個事件的數字分配的方法稱為允許轉換。可以進行數據轉換 為了幫助解釋,或滿足統計檢驗的假設。隨著我們從標稱到比率,允許的轉換變得越來越少。在名義比例的例子中,我們可以稱蘆筍 1、西蘭花 2 等等。或者我們可以做相反的事情。另一方面,我們也可以將它們標記為 37 和 59 等等;任何五個數字都可以。如果我們更改標籤,我們將不會丟失有關 Ulf 識別蔬菜能力的任何信息,因為我們僅使用數字將蔬菜分類。對於序數比例,我們可以以任何方式更改數字以保持順序對蔬菜的偏好。我們可以稱傑西卡最喜歡的蔬菜為 59,第二個為 14,第三個為 13,以此類推。我們仍然會知道傑西卡對蔬菜的偏好順序。 我們可以減少更改區間尺度的數量,因為我們必須保留項目之間差異的意義。但是我們可以從所有數字中添加或減去一個常數,或者我們可以將它們乘以一個正常數。因此,我們可以將 Nico 的所有答案加 10 或將它們乘以 100,而不會改變我們關於他對蔬菜偏好的任何結論。 在比例尺度上,我們可以在不扭曲它的情況下改變一點。唯一的 我們能做的就是將所有數字乘以一個正常數。如果我們要添加一個常數,我們會破壞數字之間的比率的重要性;我們不能再說茉莉花喜歡豌豆是喜歡綠豆的兩倍。 表 5.1 總結了我們在本節中提出的觀點。 秤的類型在第一列中按順序列出。第二列指示必須在用於為事件或對象分配編號的規則中表示的編號系統的屬性。第三列給出了允許的轉換。第四列給出了心理學量表的常見例子。 各種心理防禦機制是名義尺度的好例子。防禦機制的名稱沒有暗示嚴重程度的順序:投射、否認、智能等等。序數尺度的常見示例包括我們在討論中已經使用過的任何偏好數據。智商是區間尺度的一個很好的例子。智商測試旨在使人們之間的差異量可以通過智商分數有意義地表示。然而,智商不是一個比例量表,因為說一個智商為 120 的人比智商為 60 的人聰明兩倍是沒有意義的。最常見的。 ![](https://i.imgur.com/Ld8c4YF.jpg) Stevens 的量表給出了比例量表的例子,如 Jasmine 對蔬菜的喜愛的例子。她被告知用數字來表示蔬菜之間差異的比率。 了解測量數據的尺度類型對於避免得出錯誤的結論很重要。我們已經說過,說一個智商為120的人是智商的兩倍是沒有意義的。智商為 60 的人。同樣,即使許多教師在計算平均成績時,認為 A 值 4 分,B 值 3 分,依此類推,但沒有人會得出這樣的結論:獲得 A 的人所學的知識是獲得 C 的人的兩倍。實際上,以比率甚至間隔量表衡量的心理清單相對較少,儘管行為的許多維度(例如反應時間或頻率)是用比例尺測量。因此,在比較數字之間差異的大小之前,我們必須知道我們的數據是在何種尺度上測量的。 測量和統計?心理學家普遍認為,測量變量的尺度決定了可以對數據適當執行的統計類型。因此,許多人認為,除非數據是在區間或比率尺度上測量的,否則使用通常的參數統計是不合適的。 (參數統計是對從中提取數據的總體做出假設的那些,即數據是正態分佈的,並且每組具有相同的方差。)參數統計包括通常的 Pearson 相關係數、t 檢驗和分析的方差。 非參數統計包括各種基於 數據的排列順序或受試者之間差異的符號。 非參數檢驗相對較少使用,因為它們缺乏功率與相應的參數檢驗進行比較。原因是技術, 但簡而言之,參數測試使用了 數據,而非參數檢驗只使用其中的一部分。 沒有進入關於規模和適當性爭議的歷史 統計,足以說明參數檢驗的概念是有限的 用於在區間或比率尺度上測量的數據 心理學家和統計學家不同意這一點。統計學家認為 適合在名義、有序、區間或 比率數據(Gaito,1980)。大多數心理學家已經接受了這一立場 統計學家,儘管心理學家寫的一些統計學書籍 仍然教導說,測量數據的尺度決定了合適的統計數據。 --- # A Case in Point ## 班級規模和學習 Class Size and Learning 書上以美國的大學教學當做例子,每年立法機關分配給州立大學的總資源是有限的,然而每年都會增加所收學生數量,此時,我們想研究,在同樣的教學資源下,**大班或小班制可以使學生更好的學習。** 實驗以一學期的心理學課程為例,課程分配同樣皆為八個章節,授課班級最大以500人為單位,最小為20人。 有一名心理學系的教授提出了他的看法,他認為,無論班級的大小,積極性更高的學生將能夠學到更多的東西,因為他們將可以自主學習知識,而若是積極性較低的學生,他們在較大的班級中學到的東西將會較少。 教授在上課的第一天將動機測試問卷分給每一位學生,並使用問卷調查的結果將學生分為高積極性和低積極性。 需要的變數: * 在控制班級規模及上課教室大小的前提下,決定學生需要學習心理學當中的那些章節 * 決定研究者感興趣的變量和獨立變量 * 繪製圖表以顯示數據類型。 ## 維度獨立性測試 Testing for Independence of Dimensions 研究者想要知道在治療注意力缺陷多動障礙(ADHD)上,行為療法與興奮劑哪一種方法更好,或兩種療法放在一起時是否會產生加乘效果。 研究人員在暑期對兒童們進行雙盲研究,所有參加計畫的兒童都接受了藥物治療(藥物分為三階段以及一個安慰劑,餐與者需要接受一種)或行為治療(存在或不存在)。 在研究中,雖然兩種療法皆有產生效果,兩種療法一起實施的效果會優於僅實施單一療法。你可以想到為何藥物治療和行為治療不是獨立變量的原因嗎? ## 網絡上的研究方法和統計 Web-Based Workshops on Research Methods and Statistics www.cengage.com/psychology/workshops Wadsworth Publishing Company維護基於網絡上的研究方法和統計。