# Elementy statystyki # Wprowadzenie ## Podstawowe pojęcia - **Zbiorowość statystyczna** - ogół osób, rzeczy, przedmiotów, zjawisk, zdarzeń poddanych badaniom statystycznym, jednoznacznie określony i wyodrębniony od pozostałych elementów. - Poszczególne jednostki wchodzące w skład badanej zbiorowości statystycznej charakteryzują się pewną cechą wspólną, a jednocześnie różnią się innymi cechami, które podlegają badaniu. - Badana zbiorowość powinna być szczegółowo określona: - Co i kogo badamy? - Na jakim terenie przeprowadzane jest badanie? - Jaki jest termin lub okres przeprowadzania badań? - *np. formy spędzania czasu wolnego przez nauczycieli nauczania początkowego na terenie miasta Białegostoku w roku szkolnym 1995/1996* - **Jednostki statystyczne** - poszczególne elementy wchodzące w skład badanej zbiorowości statystycznej. Bezpośredniej obserwacji i opisowi w badaniach podlegają jednostki wchodzące w skład zbiorowości. - Elementy zbiorowości statystycznej: - Osoby - Rzeczy - Przedmioty - Zjawiska - Zdarzenia - **Liczebność** to ogólna liczba jednostek w zbiorowości. - Cała zbiorowosć to **zbiorowosć generalna** lub **populacja**. - Gdy badanie całej populacji jest niemożliwe, badaniom poddaje się ***próbę*** - część populacji dobrana w taki sposób, aby była reprezentatywna oraz aby jej struktura była zbliżona do populacji, z której ją pobrano. - **Cechy statystyczne** - właściwości charakteryzujące jednostki badanej zbiorowości, służące do ich różnicowania i identyfikacji. Stanowią kryterium podziału badanej zbiorowości lub jego klasyfikacji, w wyniku czego można wykryć pewne prawidłowości. - **Cechy stałe** to takie, które są wspólne dla całej badanej zbiorowości, służą do jej określenia i nie podlegają badaniu. - **Cechy zmienne** to takie, które przybierają różne wartości, np. - płeć - poziom wykształcenia - staż pracy - Każda **zmienna** może występować w rozmaitej formie lub różnych wielkościach. - W zależności od wielkości zbioru, a także od liczby możliwych wariantów, wyróżnia się zmienne: - dwudzielne - dychotomiczne - wielodzielne - Ze względu na rodzaj cech wyróżnia się: - jakościowe - kolor oczu - płeć - ilościowe - wzrost - waga - porządkujące - **Cechy jakościowe** to właściwości ludzi, przedmiotów lub zjawisk wchodzących w skład badanej zbiorowości, których określanie polega na zakwalifikowaniu badanego obiektu do dokładnie jednejz dopuszczalnych kategorii, np: - płeć - zawód - rodzaj zainteresowań - **Cechy ilościowe** to właściwości, których wielkość lub nasilenie mierzy się w pewnych jednostkach, przy pomocy liczb. Wartości liczbowe cechy ilościowej mogą występować w postaci zmienności ciągłej lub zmienności skokowej. - **Zmienność ciągła** występuje, gdy wartość cechy przybiera dowolne wartości w danych granicach. Oznacza to, że między dwiema wartościami, mogą wystąpić wartości pośrednie. - **Zmienność skokowa** (dyskretna) występuje, gdy badaną cechę można wyrazić tylko w liczbach zmieniających się skokami, bez wartości pośrednich, np. liczba dzieci. (liczby naturalne) - **Nominalizacja cechy** to wyodrębnienie z cechy ilościowej cechy jakościowej dychotomicznej (dwudzielnej) lub wielodzielnej. - **Zmienna zależna** to taka, która zmienia się pod wpływem innej zmiennej, której związki z innymi zmiennymi są badane. - **Zmienna niezależna** to taka, która powoduje zmiany w innej zmiennej. - **Zmienna pośrednicząca** to zmienna wpływająca pośrednio na zmienną zależną, mogąca modyfikować związek między zmienną niezależną i zależną. - **Zmienna kontrolowana** to taka, na którą badacz ma wpływ, np. ruchy, czynności, procesy psychiczne wywołane eksperymentami. - **Zmienna niekontrolowana** to taka, na którą badacz nie ma wpływu, nie może jej wywołać lub zmienić jej natężenia. ## Pomiar i skale pomiarowe Pomiar to przyporządkowanie liczb przedmiotom, osobom, zjawiskom i zdarzeniom w celu przedstawienia ich cechy w taki sposób, aby przyporządkowane liczby odzwierciedlały relacje zachodzące między nimi. Wyróżnione w badaniach cechy charakteryzujące badaną zbiorowość wymagają skal do ich pomiaru. Ze względu na stopień dokładności pomiaru wyróżnia się 4 podstawowe rodzaje skal pomiarowych: - **Skala nominalna** - Polega na przyporządkowaniu liczb przedmiotom, zjawiskom, zdarzeniom i osobom w taki sposób, aby otaczały one ich przynależność do rozłącznych kategorii. Liczby pełnią tu rolę umownych symboli i nie można dokonywać na nich żadnych operacji matematycznych. Możliwe jest tylko liczenie jednostek w poszczególnych kategoriach i obliczanie np. proporcji. W praktyce dla oznaczenia kategorii zamiast liczb używa się oznaczeń słownych i na tej podstawie dokonuje się klasyfikacji, np. płeć, pochodzenie społeczne. Podstawą zaliczenia do kategorii jest fakt posiadania określonego wariantu cechy. O poszczególnych wariantach cech można tylko powiedzieć, że są jednakowe lub różne. - **Skala porządkowa** (rangowa) - Umożliwia nie tylko rozróżnianie przedmiotów, ale także ich porównywanie i porządkowanie. W przypadku tej skali porównuje się ze sobą przedmioty i ocenia je ze względu na to, czy przejaw danej cechy jest większy, mniejszy czy równy. - W skali tej przyporządkowuje się liczby przedmiotom w taki sposób, że odzwierciedlają one ich uporządkowanie ze względu na nasilenie mierzonej cechy. - Wadą skali rangowej jest brak możliwości mierzenia różnic między rangami. - **Skala przedziałowa** (interwałowa) - Posiada wszystkie cechy skali porządkowej, a ponadto umożliwia określenie odległości, dystansu między jej punktami. - Podstawą tej skali są przedziały o równej wielkości, a punkt zerowy przyjęty jest umownie. - Na skali przedziałowej dopuszczalne jest dokonywanie większości operacji matematycznych. - **Skala ilorazowa** (stosunkowa) - Skala ilorazowa zachowuje własności trzech poprzednich skal. Zbudowana jest podobnie do skali interwałowej, z tym że posiada absolutne zero, co umożliwia dokonywanie na niej wszystkich operacji matematycznych. - Zero jest przyporząkowane przedmiotowi mającemu cechę mierzoną w stopniu zerowym. ![](https://i.imgur.com/LM8qu6Z.png) Wymienione skale charakteryzują się narastającym stopniem dokładności pomiaru. Każda kolejna jest dokładniejsza, mocniejsza, zawiera wszystkie własności poprzedniej, a także nowe. ## Etapy i rodzaje badania statystycznego Każde badanie statystyczne składa się z kilku etapów. Są nimi: 1. Zaplanowanie i przygotowanie badań statystycznych 2. Przeprowadzenie badań (obserwacja stratystyczna) 3. Opis zbiorowości statystycznej (opis statystyczny) 4. Analiza wyników obserwacji (analiza statystyczna) Przygotowanie badań statystycznych obejmuje m.in. - Określenie celu badań, problemów i hipotez badawczych - Określenie badanej zbiorowości i jednostek, ustalenie zmiennych i związków między nimi - Ustalenie rodzaju badania (wyczerpujące, reprezentacyjne) - Wskazanie lub opracowanie metod, technik i narzędzi badawczych - Przygotowanie badań od strony organizacyjnej Rodzaje badań: - **Badania wyczerpujące** to takie, w których obejmuje się badaniami wszystkie jednostki statystyczne wchodzące w skład zbiorowości generalnej (populacji). - Często przeprowadzenie takich badań jest niemożliwe ze względów technicznych, lub jest niecelowe. W takich przypadkach przeprowadza się badania częściowe. - **Badania częściowe** (reprezentacyjne) to takie, w których badaniami obejmuje się tylko część zbiorowości statystycznej, niektóre jednostki czy próbę wybraną w taki sposób, aby jej właściwości w sposób wiarygodny reprezentowały właściwości całej zbiorowości. Wyniki badań wyczerpujących są stwierdzeniami kategorycznymi, dotyczącymi wprost badanej populacji, natomiast wyniki badań reprezentacyjnych są stwierdzeniami hipotetycznymi, o określonych granicach niepewności wniosku. ### Przeprowadzenie badań - **Badania wstępne** przeprowadza się na mniejszej próbie niż badania właściwe. - **Badania właściwe** dostarczają materiałów umożliwiających znalezienie odpowiedzi na sformułowane problemy poprzez weryfikację hipotez. Przeprowadzenie badań właściwych czasem poprzedzają badania wstępne (pilotażowe). Rezultatem przeprowadzonych badań są nieuporządkowane materiały empiryczne, określane jako materiały surowe. Zgromadzony materiał powinien zostać poddany kontroli merytorycznej ze względu na jego kompletność. W ramach kontroli formalnej należy sprawdzić, czy są wszystkie materiały oraz wyeliminować te, które nie zawierają kompletnych informacji. Podczas kontroli szczególną uwagę należy zwracać na najczęściej występujące błędy tendencyjne i przypadkowe. - **Błędy tendencyjne** wynikają z celowej dezinformacji, mającej miejsce np. gdy osoba badana nie chce stawiać siebie w niekorzystnym świetle. - Błędy mogą być również rezultatem źle skonstruowanych narzędzi badawczych, a także mogą powstać w wyniku błędnego pogrupowania badanych zmiennych i mogą zniekształcać rezultaty badań. - Błędy przypadkowe są przypadkowe. ## Metody doboru próby reprezentacyjnej Wielkość próby reprezentacyjnej zależy od: - **stopnia różnorodności cech badanej zbiorowości**: im bardziej różnorodna zbiorowość, tym większa powinna być próba - **ilości kategorii statystycznych**, na jakie ma być podzielona badana zbiorowość: im więcej kategorii badacz zamierza wyróżnić, tym większa powinna być próba - **stopnia dokładności** i pewności, jakie badacz zamierza osiągnąć w badaniach; im większa próba, tym większa dokładność wniosków o populacji reprezentowanej przez próbę. Przyjmuje się, że próba poniżej 30 osób jest próbą małą, a powyżej 30 jest próbą dużą. Na ogół stosuje się 2 metody doboru próby: - **dobór losowy** - Badacz nie może mieć wpływu na dobór jednostek z populacji generalnej. - **dobór celowy** - Badacz wybiera jednostki do badania z populacji. Wyróżnia się 2 rodzaje losowania: - **Losowanie niezależne** - Jednostka raz wylosowana może być wylosowana ponownie. - Każdy element ma jednakowe szanse dostania się do próby. - **Losowanie zależne** - Element raz wylosowany jest usuwany z powtórnego losowania. Rodzaje doboru: - **Dobór losowy prosty** - Każdej jednostce w populacji generalnej przyporządkowuje się numer, a następnie z listy wybiera się określoną ilość elementów. - **Dobór systematyczny** - Gdy do próby badawczej wlicza się np. co 5 jednostkę. - **Dobór warstwowy** - Stosowany, gdy populacja nie jest jednorodna - Wówczas dzieli się populację na jednorodne warstwy i dokonuje się losowania z każdej warstwy osobno. - Dobór jednostek do poszczególnych warstw jest różny. Wyróżnia się 2 rodzaje doboru warstwowego: - **Proporcjonalny** - z poszczególnych warstw dobiera się ilość jednostek proporcjonalną do liczebności warstw - **Nieproporcjonalny** - dobór elementów do próby nie jest uzależniony od wielkości warstw, a ilość jednostek wchodzących do próby z każdej warstwy uzasadnia się kwestiami praktycznymi. - **Dobór zespołowy** - Stosowany, gdy badaczowi zależy na losowym doborze nie pojedynczych jednostek, ale całych zespołów, np. klas, miast. - Próbę badawczą stanowią wszystkie jednostki należące do wylosowanych zespołów. - **Dobór dwustopniowy** - Dwuetapowy dobór zespołowy: 1. Następuje wylosowanie pewnej liczby zespołów 2. Wylosowanie elementów do zbadania z wylosowanych grup - **Dobór celowy** - Decyzja dotycząca tego, które jednostki będą stanowiły próbę, uzależniona jest od informacji dotyczących zbiorowości posiadanych przez badacza. - Powoduje włączenie do próby jednostek nietypowych lub o charakterystycznych cechach. - Wymaga dokładnego określenia populacji pod względem cech interesujących badacza i w takich proporcjach, aby próba była odzwierciedleniem populacji. # Grupowanie i prezentacja zebranego materiału ## Grupowanie statystyczne - **Grupowanie statystyczne** polega na podziale zebranego materiału, stanowiącego zbiór dużej ilości szczegółowych informacji na jednorodne grupy. Podstawą ich wyodrębnienia są cechy (zmienne). - **Grupowanie typologiczne** polega na wydzieleniu grup względnie jednorodnych z niejednorodnej zbiorowości i odnosi się głównie do cech jakościowych. Przejawem takiego grupowania jest podział badanej zbiorowości na grupy według cech jak np. płeć, pochodzenie społeczne, wykształcenie. - **Grupowanie wariancyjne** polega na łączeniu poszczególnych jednostek statystycznych według wielkości interesującej badacza cechy i dotyczy cech ilościowych. Można dokonać grupowania wariancyjnego uwzględniając jedną cechę lub wiele cech. - **Grupowanie kombinowane** (analityczne) to takie, w którym uwzględnia się dwie lub więcej cech powiązanych ze sobą z punktu widzenia celu badań, co prowadzi ddo uchwycenia związków między cechami. ## Budowa szeregu rozdzielczego Rezultatem grupowania i zliczania danych są szeregi statystyczne, będące zbiorem informacji uporządkowanych według pewnej cechy. Najprostszy szereg składa się z dwóch wierszy i kolumn, z których jedna podaje warianty cechy, a druga liczbę jednostek w danym wariancie. Przyjmując jako kryterium sposób budowy szeregu wyróżnia się: - **Szeregi wyliczające** - Składa się z dowolnej liczby pozycji luźno powiązanych ze sobą, zawierających niejednorodny materiał dotyczący pewnej zbiorowości. - Wielkości zawarte w tablicy nie stanowią całości, nie można zatem szeregu sumować. Można natomiast jedną lub więcej pozycji z szeregu ująć lub dodać, brz uszczerbku dla reszty szeregu. - **Szeregi szczegółowe** - Uwzględnia wszystkie wartości cechy występujące w zbiorowości. Nie są one pogrupowane, tylko uporządkowane według pewnego kryterium. - Przydatność takiego szeregu jest niewielka i często, nawet gdy badana zbiorowość jest nieliczna, przekształcany jest w szereg rozdzielczy. - **Szeregi rozdzielcze** - Powstaje w rezultacie podziału zbiorowości z punktu widzenia pewnej cechy na grupy i przyporządkowania im liczebności występowania poszczególnych wariantów cechy. - W przypadku, gdy w szeregu warianty cechy przyjmują bardzo wiele wartości liczbowych, wskazane jest łączenie w jedną klasę kilku zbliżonych do siebie wartości. - **Klasa** to zbiór wszystkich wartości liczbowych leżących wewnątrz przedziału oznaczonego ustalonymi granicami. Najniższa wartośćliczbowa klasy to jej dolna granica, a najwyższa stanowi górną granicę. - **Środek przedziału** to średnia arytmetyczna jego dolnej i górnej granicy. - **Rozpiętość klasy** jest to ilość wartości liczbowych zawartych w danej klasie. Jest to różnica dwóch średnich arytmetycznych klas następujących bezpośrednio po sobie. - Dokonując budowy szeregu rozdzielczego należy na wstępie ustalić liczbę klas, ich wielkość a także punkt wyjściowy klasy początkowej. - W rezultacie przyjęcia dużej wielkości klasy uzyskuje się małą liczbę klas, a przyjęcie małej wielkości klasy powoduje dużą liczbę klas. - **Szeregi kumulacyjne** - Powstaje najczęściej z szeregu rozdzielczego w rezultacie kolejnego dodawania przedziałów klasowych wraz z odpowiadającymi im liczebnościami. - Zabieg taki jest pożądany gdy badacz zainteresowany jest nie tym, jakie liczebności przyjmują poszczególne klasy ale tym, jakie wartości znajdują się poniżej lub powyżej pewnej wartości zmiennej. - Środek przedziału stanowi średnia arytmetyczna jego górnej i dolnej granicy. Tak ustalone granice przedziałów klasowych nie wskazują jednak dokładnie, gdzie przedział zaczyna się i kończy na linii pomiarowej. Pamiętać jednak należy, że np: - wynik 7 oznacza faktycznie od 6.5 do 7.5 - wynik 8 od 7.5 do 8.5 - 7-8 oznacza 6.5 - 8.5 Natomiast z punktu widzenia celu badań: - **Szeregi dynamiczne** (czasowe) - ***szeregi okresów***, np. - produkcja - konsumpcja - przychody - zużycie materiałów - ***szeregi momentów***, np. - zapasy wyrobów - cena - zatrudnienie - **Szeregi terytorialne** - Zawiera wielkości statystyczne rozmieszczone w przestrzeni. - inne # Kwestionariusz badawczy - Kwestionariusz badawczy, razem z ankietą oraz wywiadem jest narzędziem badawczym w naukach społecznych. - Kwestionariusz spełnia trzy podstawowe funkcje: - Przełożenie problematyki badawczej na pytania zadane respondentom w taki sposób, aby otrzymać interesujące nas dane - Nakłonienie respondenta do odpowiedzi poprzez ułatwienie mu sformułowania odpowiedzi w danym zakresie problemowym - Przygotowanie materiału do ilościowej lub jakościowej analizy. Co oprócz pytań powinno pojawić się w kwestionariuszu? - **List wprowadzający** - Kim się jest - W jakim celu przeprowadza się badania - **Metryczka** - Rok urodzenia - Płeć - Wykształcenie - Dochody - Stan cywilny - Miejsce pochodzenia Rola kojeności pytań w kwestionariuszu - **Strategia lejka** - Każde kolejne pytanie jest powiązane z poprzednim, i ich zakres jest coraz mniejszy. - Ta strategia pozwala na bardziej skuteczne ujawnianie szczegółów. - **Strategia odwróconego lejka** - Pytanie zawężające jest przed pytaniem o ogólnym zakresie - Ta strategia przydaje się, gdy tematyka sondażu nie motywuje do wyrażania własnych opinii. - Jest używana, gdy celem badania jest określenie sposobu generalizowania wniosków. Niezależnie od wybranej strategii, na początku pytania powinny być łatwiejsze, aby wprowadzić respondenta w tematykę i aby pomóc mu się rozluźnić. - Pytania otwarte służą do zmuszenie respondenta o odpowiedź własnymi słowami. - Pytania zamknięte (kafeterie) zawierają gotowe odpowiedzi, a zadaniem respondenta jest wybranie odpowiedzi najbliższej jego zdaniu na dany temat. Rodzaje pytań - **Pytania filtrujące** - Pomagają wyeliminować osoby, które nie mają nic do powiedzenia w związku z problematyką pytania - **Pytania warunkowe** - Pytania zależące od wcześniejszych pytań - **Pytania sprawdzające** - Mają służyć sprawdzeniu wcześniejszych odpowiedzi - **Pytania tabelaryczne** - Mają zestaw powtarzających się odpowiedzi - **Pytania półotwarte** - Opcja udzielenia własnej odpowiedzi w przypadku braku odpowiedzi odpowiadającej respondentowi. - **Alternatywa** - tak/nie - **Kafeteria** - **dysjunktywna** - jedna odpowiedź - **koniunktywna** - wiele odpowiedzi ![](https://upload.wikimedia.org/wikipedia/commons/7/71/Nothing_whitespace_blank.png)