tyce
Copyright
©
Recenzenci
SPSS Polska, Kraków 2002 Jarosław
Górniak, Leszek A.
Wstęp·
Gruszczyński
1. Jak
. być
badaczem? . podstawowe Od czego zacząć? Nauka . Metoda naukowa Testowanie hipotez Od hipotez do teorii . Typy zależności . . . Zależność a związek przyczyno-skutkowy Jednostka analizy
Pojęcia
Projekt graficzny
Małgorzata
Dubowiak
Opracowanie edytorskie, redakcja techniczna, i łamanie systemem 'lEX preTEXt, Kraków, www.pretext.com.pl
skład
Druk i oprawa Wydawca
Drukarnia Know-How, Kraków, tel. 012.6369607
SPSS Polska Sp. z 0.0., Kraków, ul. Racławicka 58 tel./faks: 012.6369680, e-mail:
[email protected]. www.spss.pl
Wszelkie prawa zastrzeżone. Żadna część niniejszej książki nie może być powielana ani rozpowszechniana metodami elektronicznymi, mechanicznymi, fotokopiowania, zapisu magnetycznego czy innymi - w jakiejkolwiek formie - bez pisemnej zgody wydawcy. Zastrzeżenie to nie wyklucza możliwości wykorzystania krótkiego fragmentu w związku z omówieniem w prasie lub innych mediach. SPSS jest zastrzeżonym znakiem towarowym, a pozostałe produkty i nazwy SPSS są znakami towarowymi SPSS Inc. Inne produkty i nazwy występujące w publikacji są znakami towarowymi lub zastrzeżonymi znakami towarowymi odpowiednich firm i zostały użyte jedynie w celu identyfikacji.
ISBN 83-912871-1-4
Wydanie pierwsze Printed in Poland
1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7. 1.8.
11
15 15 16 17 21
22 26 28 31 33
Ćwiczenia
35
Literatura
36
2. Jak
zmierzyć szczęście?
Pojęcia
2.1. 2.2. 2.3. 2.4. 2.5. 2.6. 2.7. 2.8. 2.9.
podstawowe Pomiar . . . . . Poziom nominalny. Poziom porządkowy . Skala Likerta. . . . . Poziom interwałowy i ilorazowy Definicje operacyjne. Tworzenie indeksów Trafność .
37 37 37 38
41 42
44 51 54 58
Rzetelność
59
Ćwiczenia . . .
61 65 70
Co może zrobić za nas komputer Literatura . . . . . . . . . . . . .
r
I
3. Co piszczy w szeregu statystycznym? pojęcia podstawowe 3.1. Średnia arytmetyczna. 3.2. Mediana . 3.3. Dominanta 3.4. Skośność . 3.5. Inne miary pozycyjne 3.6. Rozstęp· . 3.7. Odchylenie średnie 3.8. Wariancja i odchylenie standardowe Ćwiczenia . Co może zrobić za nas komputer Literatura . . . . . . . . . . . 4. Co widać przez okna tabeli? . Pojęcia podstawowe 4.1. Tabele kontyngencji . . . 4.2. Przekodowywanie danych. 4.3. Forma prezentacji danych w polach tabeli 4.4. Miary zależności dla tabel dwa-na-dwa 4.5. Miary związku dla tabel n-przez-n. 4.6. Trzecia zmienna . . . 4.7. Modele przyczynowe Ćwiczenia . Co może zrobić za nas komputer Literatura . . . . . . . . 5. Jak żyć w niepewności? . Pojęcia podstawowe . . . . . . . . . . . . 5.1. Czym zajmuje się statystyka indukcyjna? 5.2. Próba losowa. . . . . . . . . . 5.3. Testy statystycznej istotności 5.4. Prawdopodobieństwo . . 5.5. Rozkład normalny. . . . 5.6. Rozkład średnich z prób 5.7. Rozkład t Studenta . . . 5.8. Test istotności dla proporcji 5.9. Estymacja przedziałowa Ćwiczenia . Co może zrobić za nas komputer L~ff~ura . . . . . . . . . . . . .
6
71 71
72 76 82 85 88 89 90 92 99 102 106 107 107 108
109 112 118 122 131 135 137
138 143
145 145 146 148 150 154 155 160 164 168 169
172 175 176
6. Jak kontrolować ryzyko? . Pojęcia podstawowe 6.1. Sposób doboru prób. 6.2. Test dla dwóch prób niezależnych 6.3. Test dla dwóch prób zależnych .. 6.4. Jednoczynnikowa analiza wariancji 6.5. Test post hoc . Ćwiczenia . Co może zrobić za nas komputer Literatura . . . . . . . . . . .
177 177 178 179 186 189 201 204 206 210
7. Jak postawić kropkę nad L.. ? Pojęcia podstawowe 7.1. Test chi-kwadrat . . . . . 7.2. Warunki stosowania testu chi-kwadrat 7.3. Miary związku oparte na chi-kwadrat . 7.4. Między poziomem nominalnym a ilorazowym. 7.5. Koncepcja liniowości . 7.6. Prosta regresja liniowa Ćwiczenia . Co może zrobić za nas komputer Literatura . . . . . . . . . . . . .
211 211 212
216 223 224 227
230 238 239 242 243 245
Dodatek. Jak być odkrywcą? Analiza struktur ukrytych Pojęcia podstawowe Co to jest zmienna ukryta Analiza struktur ukrytych Formalny model analizy struktur ukrytych Porównywanie struktur ukrytych między grupami Budowanie modeli zależności Zamiast ćwiczeń . Literatura . . . .
250
Załącznik
283
1. Pola pod
krzywą normalną
246 247 260
265 267
280
Załącznik
2.
Rozkład
Studenta t .
289
Załącznik
3.
Rozkład
F . . . . . .
293
Załącznik
4.
Rozkład
chi-kwadrat
299
Chciałabym podziękować wielu osobom, bez których wsparcia i zaangażowania książka
ta nie
miałaby
szans
się ukazać.
Jej merytoryczna zawartość swój ostateczny kształt zawdzięcza wnikliwym uwagom recenzentów Leszka A. Gruszczyńskiego i Jarosława GÓrniaka. Dzię ki nim udało mi się uzupełnić i dopracować wiele fragmentów oraz uniknąć szeregu błędów a za te, które ewentualnie pozostały, tylko ja w pełni odpowiadam. Dziękuję Aleksandrowi Zaigraevowi za konsultacje w zakresie statystyki indukcyjnej, Bogdanowi Cichomskiemu za szybkie udostępnienie danych PGSS z edycji 1999 roku, a także Henrykowi Domańskiemu, Krystynie Lutyńskiej i Andrzejowi Rostockiemu za zgodę na ponowne opublikowanie mojego tekstu z zakresu analizy struktur ukrytych, który wcześniej ukazał się w tomie pod ich redakcją. Dziękuję wszystkim studentom, którzy uczestniczyli aktywnie w testowaniu przydatności tej książki do celów dydaktycznych a szczególnie Aleksandrze Bronk, która sprawdzała przydatność wszystkich przykładów w programie SPSS. Książka w opracowanej ostatecznie formie ma szansę ukazać się dzięki wsparciu organizacyjnemu i finansowemu dwóch instytucji: firmy SPSS Polska i Uniwersytetu Mikołaja Kopernika w Toruniu. Instytucje to przede wszystkim ludzie. Zatem dziękuję Piotrowi Komornickiemu i Januszowi Mikulskiemu z SPSS Polska za ich szczególny wkład w to przedsięwzięcie. Życzliwość i wsparcie Dyrektora Instytutu Socjologii UMK Andrzeja Zybertowicza i mojego bezpośrednie go przełożonego a zarazem ówczesnego Dziekana Wydziału Humanistycznego UMK Ryszarda Borowicza była nie do przecenienia. Ostateczną formę książka ta zawdzięcza pracy Ewy Kmiecik.
Maria Nawojczyk
I
Od przeszło dziesięciu lat uczę studentów socjologii statystyki. Jest to, jak dostateczny okres czasu aby zgromadzić doświadczenia i pokusić się o pewne uogólnienia. Zacznę od spostrzeżeń niezbyt przyjemnych dla nauczyciela statystyki. Większość osób podejmujących studia na kierunku socjologia uważa się za humanistów - i słusznie. Szkoda tylko, że to przekonanie często definiowane jest w oparciu o wykluczenie - nigdy więcej matematyki i czegokolwiek, co się z nią łączy. Zatem konieczność studiowania statystyki jest dla wielu przykrą niespodzianką. Próba przekonania studentów, że to przedmiot pożyteczny i nawet można go polubić, graniczy z cudem. Najczęściej przyjmowaną przez studentów postawą bywa zatem strategia 3 x Z (zakuć, zdać, zapomnieć). Bywała ona efektywna tylko w wymiarze lokalnym, bowiem już na zajęciach praktycznych z programem SPSS okazywało się, że bez teoretycznych podstaw ze statystyki nie da się zrobić niczego sensownego z naj ciekawszymi nawet danymi. Z racji tego, że zajęcia te poświęcone były nabywaniu umiejęt ności posługiwaniasię programem SPSS, to "odkurzanie" wiedzy ze statystyki musiało się odbywać w bardzo ograniczonym zakresie. O tym, jak duże były to ograniczenia, miałam się przekonać prowadząc seminarium magisterskie. Wielu moich magistrantów miało świetne pomysły na prace oparte na materiale empirycznym, niewielu z zebranym materiałem umiało sobie dobrze radzić. Jeszcze więcej z nich miałoby szansę na zdobycie ciekawej pracy po studiach, gdyby takie umiejętności w stopniu dostatecznym posiadali. Z kontaktów z naszymi absolwentami wiem, że część z nich tę wiedzę samodzielnie uzupełnia. sądzę,
Kij, jak wiadomo, zawsze ma dwa końce. Postawa studentów to jedno, ale z drugiej strony jestem ja, jako nauczyciel z dostępnymi mi pomocami w nauczaniu. Ucząc statystyki korzystałam z dość już "wiekowego", przetłumaczonego na język polski trzydzieści lat temu, podręcznika Huberta Blalocka i skryptów publikowanych na własne potrzeby przez różne wydawnictwa uniwersyteckie. Żadna z tych pozycji nie brała pod uwagę dynamicznie rozwijającego się pro-
(
cesu komputeryzacji, wspomagającegoanalizę statystyczną. Każda z nich była bardziej zorientowana teoretycznie (co humanistów przyprawiało o koszmary senne a próbujących ich tego nauczyć -- o stały stres bycia nauczycielem z tych koszmarów) a mniej praktycznie. Doświadczeniate złożyły się na podjęcie przeze mnie decyzji o napisaniu nowoczesnego, przyjaznego studentom podręcznika podstawowego - elementarnego kursu statystyki. W moich założeniach powinien on zawierać: ilI
II!
III
III
niezbędną wiedzę teoretyczną, opisaną językiem możliwie najmniej formalnym, ze szczególnym naciskiem na zdobycie umiejętności interpretacyjnych; dodatek do każdego rozdziału pokazujący, jak wprowadzone zagadnienia zastosować w praktyce, posługując się programem SPSS, i korzystając z danych Polskiego Generalnego Sondażu Społecznego;
dodatek dla zaawansowanych (tych, których udałoby mi się zachęcić do statystyki), obejmujący najczęściej stosowane metody analizy na wyższym poziomie zaawansowania; dodatek w formie tekstu mojego autorstwa: "Zastosowanie modeli logarytmiczno-liniowych ze zmiennymi ukrytymi do badania postaw", który ukazał się w pracy "Spojrzenie na metodę" pod red. Henryka Domańskie go, Krystyny Lutyńskiej i Andrzeja Rostockiego (Warszawa 1999: IFiS PAN, ss. 81-94), a który chciałabym opatrzyć komentarzami dydaktycznymi i pokazać "od kuchni" .
Jak to zwykle bywa, życie weryfikuje większość naszych zamierzeń. Punkt pierwszy, jako dla mnie najważniejszy, został zrealizowany, dodatki natomiast uległy pewnym korektom. W trakcie moich prac nad dodatkami do poszczególnych rozdziałów, mającymi w zamierzeniu pokazać, jak prezentowanąwcześniej analizę dokonać za pomocą programu SPSS - ukazała się pozycja autorstwa Jarosława Górniaka i Janusza Wachnickiego "SPSS PL for Windows: Pierwsze kroki w analizie danych" . Książka ta, w o wiele pełniejszy sposób prezentuje to, o co mi chodziło przy konstrukcji dodatków zatytułowanych "Co może zrobić za nas komputer". Zamiast zatem pokazywać, jak "zrobi" to za nas komputer (tu podaję odsyłacze do wspomnianej pozycji), przedstawiam sposób interpretacji uzyskanych za pomocą komputera wyników. Posługuję się w tych przykładach danymi z Polskiego Generalnego Sondażu Społecznego z roku 1999, zachęcając studentów w trakcie zajęć do próby samodzielnego uzyskania prezentowanych wyników końcowych przeprowadzanych analiz. W dodatku dla zaawansowanych zamierzałam zawrzeć poszerzenie wiedzy o analizie regresji oraz wprowadzenie do analizy czynnikowej i analizy struktur ukrytych. Niestety część podstawowa książki rozrosła się do takich rozmiarów,
\
\I,
że z części tych planów musiałam zrezygnować. Ponieważ w liter~turze st~~ tystycznej w języku polskim można znaleźć pozycje opisujące anahzę regresF na wyższym niż elementarny poziomie oraz analizę czynnikową - te kwe~t~e postanowiłam pominąć. Zamieszczam natomiast rozdział poświęcony anah.zl: struktur ukrytych, gdyż jest to metoda słabo obecna w literaturze polskIeJ. Jej użyteczność pokazuję na moim wcześniej już opublikowanym tekście (za zgodą redaktorów tomu), przedstawiającymtaką analizę niejako "od kuchni". Sugestie obu recenzentów szły w kierunku wyeliminowania tego dodatku, jako mało spójnego z całością podręcznika. Zgadzam się z uwagami, że tok wywodów w tym dodatku odbiega od konwencji prowadzenia czytelnika krok po kroku w możliwie naj prostszy sposób, ale materia jest bardziej skomplikowana i wymagałaby dużo więcej miejsca na taki typ wykładu, jaki poprzednio proponowałam. Ponieważ obaj recenzenci zachęcali mnie do napisania kolejnego tomu, obejmującego metody analizy na wyższym poziomie zaawansowania, pozwalam sobie jednak ten dodatek pozostawić, jako ewentualny spójnik, jeśli wyzwanie to podejmę w przyszłości. Wróćmy
do części zasadniczej książki. Zakładam, że studenci zapisujący się na ze statystyki mają za sobą kurs metodologii badań społecznych oraz metod i technik badawczych. Dwa pierwsze rozdziały ("Jak być badaczem?"; "Jak zmierzyć szczęście?") poświęcone są na przypomnienie wiedzy z tych kursów ale w kontekście wprowadzenia do zagadnień ze statystyki. Zaczynam od metody naukowej, stawiania hipotez, określania zależności między zmiennymi, by przejść do poziomu pomiaru zmiennych, tworzenia indeksów, określania ich trafności i rzetelności. Pogłębionej wiedzy w tym zakresie należy poszukiwać w podręcznikach do metodologii, tu przypominam je na tyle, na ile jest to niezbędne do wprowadzenia kolejnych kwestii. zajęcia
W rozdziale trzecim ("Co piszczy w szeregu statystycznym?") pokazuję, jak analizować jedną wybraną zmienną poprzez miary tendencji centralnej oraz miary dyspersji. VI[ kolejnym rozdziale ("Co widać przez okna tabeli?") przedstawiam sposoby konstrukcji tabel statystycznych i pomiaru siły związku między zmiennymi w tych tabelach. Rozdział piąty ("Jak żyć w niepewności?") jest wprowadzeniem do statystyki indukcyjnej. Wyjaśniam w nim istotę testów statystycznej istotności, by w rozdziale kolejnym ("Jak kontrolować ryzyko?") zaprezentować testy dla dwóch prób i analizę wariancji.
W rozdziale siódmym ("Jak postawić kropkę nad i... ?") dopełniam wiedzę dotyczącą pomiaru siły związku między zmiennymi i jego statystycznej istotności
w zależności od ich poziomu pomiaru. Znalazły się tu więc test chi-kwadrat, i prosta analiza regresji. Całość jest uzupełniona wcześniej sygnalizowanymi dodatkami. Program zajęć oparty o wstępny maszynopis tego podręcznika był testowany dwukrotnie:
w roku akademickim 1999/2000 jako osobny kurs statystyki i w roku akademickim 2000/2001, w zestawie wykład ze statystyki wraz z ćwiczeniami (zaję cia z programem SPSS realizowane w pracowni komputerowej). Prezentowany podręcznik przygotowany jest do obu form prowadzenia zajęć, z tym że w tej drugiej formie przynosi moim zdaniem naj pełniejsze efekty. Ponieważ kurs ze statystyki w moim Instytucie już od kilku lat nie jest przedmiotem obowiązkowym, przyjazna studentom forma prezentowanego podręcz nika została potwierdzona rosnącą liczbą uczestników tego kursu. Liczę więc na to, że ten elementarz do statystyki dla studentów socjologii stanie się dla nich zachęcającym wstępem do studiowania tej dyscypliny.
Pojęcia
II
charakter empiryczny charakter normatywny hipoteza nauki społeczne tabela kontyngencji liczebność brzegowa liczebność ogólna pole (tabeli)
II
związek
II
II
zmienna indukcja dedukcja eksperyment
II
II II II
Toruń,
lipiec 2002
podstawowe
II II II II
II
II III
II II II II II II II II
II II
prawo naukowe dane warunek konieczny warunek wystarczający teoria zależność pozytywna zależność negatywna związek przyczynowo-skutkowy zmienna zależna zmienna niezależna jednostka analizy statystyka
Podręcznik ten obejmuje zagadnienia z zakresu statystyki i analizy danych w naukach społecznych. Zawarte w nim procedury znajdą zastosowanie wówczas, gdy będziemy dysponować zgromadzonym materiałem badawczym. Gromadzenie i interpretacja takiego materiału jest logicznym procesem o ustalonych standardowych procedurach, zwanych metodą naukową, charakterystycznym dla wszystkich dziedzin nauki.
Metoda naukowa jest procedurą, za pomocą której określamy związek pomię dzy interesującymi nas z badawczego punktu widzenia zjawiskami, a następnie sprawdzamy, czy takowy związek rzeczywiście istnieje. O ile metoda naukowa jako procedura badawcza jest wspólna dla nauki jako całości, to konkretne techniki gromadzenia materiału badawczego i prowadzenia jego analizy mogą się różnić w zależności od uprawianej dyscypliny. Zrozumienie istoty metody badawczej stanowi jednak niezbędny warunek by zostać badaczem.
i I
!
~
1.1. Od czego
zacząć?
Cele nauki są różnorodne, ale istotą prowadzenia badań naukowych jest zrozumienie interesujących nas zjawisk. Opisywanie i wyjaśnianie tych zjawisk ma w konsekwencji prowadzić do możliwości przewidywania ich rozwoju, lub w ogóle wystąpienia, i być może uzyskania nad nimi kontroli. Podstawowymi więc pytaniami, na jakie badacz poszukuje odpowiedzi są pytania: "Jak jest?" oraz "Jak być powinno?" Pytania i odpowiedzi koncentrujące się na wymiarze "jak jest" mają charakter empiryczny, natomiast obejmujące wymiar "jak być powinno" - mają charakter normatywny. Oba te wymiary obecne są we wszystkich dziedzinach nauki. Odpowiedzi, jakich udzielamy na pytania dotyczące tego "jak być powinno", mają zasadnicze znaczenie dla zrozumienia społeczeństwa, w którym żyjemy. Przywołajmyparę konkretnych przykładów, pytamy np.: "Co to jest dobre społeczeństwo? Co to jest sprawiedliwość?Czy demokracja parlamentarna jest najlepszym systemem politycznym? Czy powinno stosować się karę śmierci? Czy
eutanazja powinna być legalnie dozwolona? Czy państwo powinno gwarantować swoim obywatelom minimalny dochód?" Odpowiedzi na takie pytania zależą od naszego systemu wartości, preferencji, światopoglądu. Stanowią one podstawę i istotę filozofii społecznej. Jak daleko nie sięgalibyśmy w historii społecznej to zawsze znajdziemy myślicieli, którzy takie pytania stawiali i poszukiwali na nie odpowiedzi, poczynając od Platona i Arystotelesa, poprzez Augusta Comte'a, Emila Durkheima, Maxa Webera po Talcota Parsonsa i wielu innych twórców teorii społecznych. Stawiając pytania empiryczne dążymy do ustalenia faktów anie wartości. Przypuśćmy, że z normatywnego punktu widzenia akceptujemy stwierdzenie, iż wolność prasy jest niezbędnym warunkiem istnienia wolnego społeczeństwa. Odnoszące się
do takiego stwierdzenia pytania empiryczne mogłyby być sformu-
łowane następująco: Czy w danym społeczeństwie istnieje wolność prasy? lub, Na ile w danym społeczeństwie istnieje wolność prasy? Załóżmy, że wolność prasy zdefiniujemy jako istnienie w badanym społeczeń stwie, przez co najmniej ostatni rok, gazety lub stacji telewizyjnej, która nie była własnością państwa, nie była też przez rząd kontrolowana, ani jej artykuły, bądź audycje, nie były przedmiotem działań cenzury. Niezależnie od tego, czy taka definicja wolności prasy nam się podoba czy nie, to jeśli raz uznamy ją za obowiązującą, to w oparciu o nią możemy dokonywać analizy materiału empirycznego pochodzącego z różnych państw, aby stwierdzić czy wolność prasy w nich istnieje, czy nie. Istnienie wolności prasy jest więc przedmiotem empirycznej weryfikacji. Natomiast pytanie, czy istnienie wolności prasy jest
warunkiem koniecznym (czy nie) dla rozwoju demokracji, pozostaje pytaniem normatywnym, na które odpowiedzi udzielamy w zależności od naszego systemu wartości.
Przy definiowaniu wolności prasy musimy brać pod uwagę zarówno normatywne, jak i empiryczne założenia. Na przykład, możemy znaleźć takie państwa, w których w czasie pokoju istniała duża wolność prasy, ograniczona znacznie przez cenzurę wojskową w czasie wojny z powodów bezpieczeństwa narodowego. To, czy państwo takie będziemy nadal uważać za charakteryzujące się wolnością prasy, będzie zależało od naszego systemu wartości. Jakiego rodzaju ograniczenia możemy zaakceptować, uważając jednocześnie, że wolność prasy została zachowana? Założenia empiryczne wymagają od nas możliwie precyzyjnego pomiaru badanego zjawiska. Musimy więc poradzić sobie na przykład z takimi problemami, jak możliwość zdobycia informacji koniecznych do określenia wolności prasy w badanym państwie. Jeżeli nasza definicja wolności prasy obejmuje także możliwość publikacji "miękkiej" pornografii, to gdzie znajduje się granica pomiędzy pornografią akceptowalną, a tą już nie do przyjęcia? Wymiary normatywny i empiryczny w badaniach społecznych współistnieją i uzupełniają się w prosty sposób: fakty potwierdzone empirycznie pozwalają nam ocenić, w jakim stopniu osiągnęliśmy stan pożądany z normatywnego punktu widzenia. Jeżeli przyjmiemy, że jedną z konsekwencji zmian systemowych zachodzących w Polsce powinno być podniesienie standardu życia Polaków, to wiedząc, że na początku lat gO-tych PKB na jednego mieszkańca wynosił około 2 tys. dolarów a pod koniec tej dekady ponad 6 tys. dolarów, możemy powiedzieć, iż posuwamy się w kierunku osiągnięcia celu normatywnego. Głównym celem tego podręcznikajest zaprezentowanie sztuki prowadzenia analizy empirycznej. Jest wiele możliwych sposobów badania tego "co jest", tzn. definiowania faktów, ich pomiaru i interpretacji. Wszystkie te zabiegi operacyjne muszą pozostawać w zgodzie z istotą i logiką badania naukowego.
1.2. Nauka Wiedza empiryczna jest wynikiem obserwacji lub eksperymentu. Prowadząc obserwację lub eksperyment stajemy się badaczami. Badacz zbiera i interpretuje informacje empiryczne. Czyni to, aby zweryfikować hipotezy. Przez hipotezy będziemy tu rozumieć stwierdzenia określające przypuszczalne zależności lub związki miedzy badanymi zjawiskami. Te zależności będące przedmiotem naszych rozważań w dalszej części tego rozdziału - pojawiają się wówczas, gdy zaistnienie określonej własności lub ilości jednego zjawiska prowadzi do wystąpienia określonej własności lub ilości innego zjawiska. Zjawiskami leżący-
mi ~ .polu naszych zainteresowań będą zjawiska społeczne, tzn. odnoszące się do ~oznorodn~ch aspektów życia społecznego: społeczeństwa, kultury, systemu pol~tycz~ego Itp. Zajmują się nimi poszczególne dyscypliny wiedzy, takie jak: ??htologla, psyc~ol~gia, polityka społeczna, antropologia społeczna, socjologia l mne, zwane ogolme naukami społecznymi.
Stud~nci o utrwalonej wiedzy z zakresu metodologii nauk społecznych bez trudu wskazą na zn.a~zne uproszczenia w poniżej prezentowanych rozważaniach. Są
one w, t!'~ mIeJSCU usprawiedliwione koniecznością skrótowego wprowadzenia, a włascIwIe ?rzypomnienia, pewnych pojęć ogólnych z metodologii, do których statystyka SIę odwołuje.
Na~ki społeczne podzielają z innymi naukami wspólne założenia. Stosują w badamach metodę naukową, tj. procedurę logicznie po sobie następujących etapów badawczych, pozwalającą zminimalizowaćwpływ systemu wartości badacza na proces badawczy. Poza tym używają również metod ilościowych w celu zmierzenia, policzenia, zebrania i analizy materiału empirycznego.
~etoda naukowa jest zatem serią zadań intelektualnych, które badacz podejmuJe .aby s~ormułować hipotezy a następnie je zweryfikować (również negatywnie). Uz~wam: metody naukowej stanowi podstawę do wygenerowania wiedzy, która moz~ byc z~ak~epto:vana przez społeczność naukową. Taka przyjęta "prawda" powmna byc mezalezna od wartości i preferencji badacza. Prawidłowo przeprowadzone badanie dotyczące rozkładu poglądów politycznych w danej grupie, np. stud~nckiej grupie ćwiczeniowej, mogłoby wykazać, że 58% osób ma poglą d~ pra:VIcowe a 42% lewicowe. Wynik taki byłby stwierdzeniem faktu i byłby mezalezny od poglądow politycznych badacza. Największymwyzwaniem dla badacza oraz osób korzystających z wyników jego
pracy jest rozróżnienie tego, co jest udowodnionym faktem, a co jest moralną lub etyczną ocen~ badanych aspektów zachowań społecznych. Zwykle nie jest to ła~wym.zadan~em., ponie~aż już sam wybór badanej problematyki, sposób ~efimowama faktow Jest zalezny od systemu wartości i preferencji badacza, od Jego systemu normatywnego.
v:
Od wi~ków środowisku naukowym trwa filozoficzna debata nad tym, czy nauka moze byc wolna od wartościowania. Zdania są podzielone, w zależności od przyję:y?h zał~że.~ epistemologicznych i ontologicznych. Na potrzeby naszych rozw~zan przYjmIjmy założenie, że nie jesteśmy w stanie całkowicie wyeliminowac wpływu systemu normatywnego badacza na efekty jego pracy. Dlatego z .pun~tu widzenia obiektywizmu naukowego korzystne jest, gdy badacz sam uJawma swoje poglądy na badaną kwestię. Poza tym jesteśmy w stanie znacznie ten wpływ ograniczyć lub kontrolowaćjego oddziaływanie na wnioski wywodzo-
ne z badań, poprzez stosowanie w badaniach metody naukowej. Na przykład, badacz, który uważa, że bierne palenie jest szkodliwe dla zdrowia, może opublikować raport, powołując się tylko na wyniki badań potwierdzających jego hipotezę, ignorując te, które takiej szkodliwości nie potwierdzają. Niezależnie jednak od powstania takiego tendencyjnego raportu, dalsze wyniki badań powinny potwierdzić lub obalić prezentowaną w nim hipotezę. Z faktami bowiem, jak wiadomo, nie dyskutuje się. Aby prześledzić kolejne kroki metody naukowej wybrałam banalnie prosty przykład, który jednakże, mam nadzieję, pozwoli nam poprowadzić proces badawczy od obserwacji aż do sformułowania teorii. Powinniśmy pamiętać, że po sformułowaniu teorii możemy nadal prowadzić obserwacje, które z czasem mogą tę teorię konkretyzować. Proces ten ma charakter cykliczny, od obserwacji do teorii, od teorii do obserwacji. Na ogół badania naukowe oparte są na pewnych teoretycznych założeniach. Na podstawie zgromadzonej już i dostępnej nam wiedzy oraz wyników badań pokrewnych formułujemy własne hipotezy badawcze, które w trakcie przeprowadzanych badań będziemy weryfikować. Czasem jednak, gdy stajemy w obliczu "nieznanego", wszystko zaczyna się od obserwacji. W przypadku prezentowanego tu przykła du przyjmiemy, że taka wstępna teoria nie istnieje.
Zacznijmy
więc naszą podróż
po naukowej metodzie.
Przypuśćmy, że każdego ranka biegam w pobliskim parku. W niedzielę była piękna pogoda, świeciło słońce i niebo miało czysty błękitny kolor. Tak samo było w poniedziałek. Niestety we wtorek i w środę padało a niebo przykrywały ciemne szare chmury. W czwartek przejaśniło się, niebo zasadniczo było czyste ale gdzieniegdzie widoczne były ciemne chmury. Zakładając mój całkowity brak wykształcenia i wcześniejszych doświadczeń, zauważam coś, co dla wszystkich jest oczywiste: występowanie deszczu jest związane z obecnością chmur na nie-
bie, natomiast gdy świeci słońce, oznacza to mniejsze zachmurzenie. W każdym razie, jeśli pada, to na pewno są chmury na niebie. Mój wniosek wynikający z pięciodniowej obserwacji jest więc taki, że opady deszczu są związane z z~ chmurzeniem. Zastanawiam się nad tym i myślę, że jeżeli w ciągu tych 5 dni opady deszczu związane były z zachmurzeniem, to może wzorzec ten potwierdzi się w dłuższym przedziale czasu. Zaczynam robić notatki. Każdego dnia odnotowuję, czy nie-
bo było zachmurzone, częściowo zachmurzone, czy czyste, oraz czy padało, czy
W.
nie. końcu P? 30 dniach podsumowuję moje obserwacje. W tym czasie było 10 dm z całkowItym zachmurzeniem, 10 dni z częściowym zachmurzeniem oraz 10 dni z błękitnym niebem. Odnotowuję również 15 dni z opadami deszczu i .~5 dni bez opadów. Swoje spostrzeżenia zamieszczam w tabeli kontyngenCJI (lub'p'o prostu w tabeli 1.1). Sumowanie na brzegach tabeli nazywa się liczeb~osclą ~rzegową (używa się również nazw liczebność cząstkowa, liczebność margmalna l marginesy). Mamy zatem trzy liczebności brzegowe w kolumnach (z~chm.urzone -: 10, częściowo zachmurzone - 10, czyste - 10), które w sumIe dają nam .hczebność ogólną 30 dni. Dwie liczebności brzegowe w rzędach (pada - 15, me pada -- 15) również sumują się w liczebność ogólną - 30 dni. Tabela 1.1.
Deszcz
Niebo Zachmurzone
Częściowo
zachmurzone
Czyste
Pada Nie pada Suma
Suma
15 15 10
10
10
30
Zaglądam
teraz do swoich notatek z 3D-dniowych obserwacji, umieszczając w powyższej tabeli każdy dzień z uwzględnieniem jego indywidualnej charaktery~tyki, ': postaci. opadów deszczu i stopnia zachmurzenia nieba. Dokonuję po~hczen l wypełmam wszystkie pola (np. "niebo zachmurzone, pada" czy "mebo czyste, nie pada") tabeli 1.2. Tabela 1.2.
Deszcz
Niebo Zachmurzone
Częściowo
zachmurzone
Czyste
Suma
Pada Nie pada
10
O
5 5
10
15 15
Suma
10
10
10
30
O
Wyniki obserwacji 3D-dniowych potwierdzają spostrzeżenia z pierwszych 5 dni: w dni o całkowitym zachmurzeniu zawsze padało, w dni częściowo zachmurzone :zasem. padało a w dni o czystym niebie nigdy nie padało. Zatem opad deszczu Jest zWiązany z występowaniem zachmurzenia - jeśli nie ma chmur deszcz nie pada. Obserwacje prowadzone przeze mnie przez kolejne 30 dni p~twierdziły poprzednie wnioski.
Po jakimś czasie konkluzję, że chmury "wiążą się" z deszczem zaczęłam uważać za coś oczywistego, co jak przypuszczam, wszyscy podzielają·
1.3. Metoda naukowa Niezależnie od prostoty poczynionych przeze mnie obserwacji, świadczących o mojej niewiedzy z zakresu meteorologii, w prezentowanym wyżej przykładzie zastosowana została metoda naukowa. Prześledźmy ten proces myślowy, leżący u podstaw empirycznego badania. Przez pierwsze 5 dni badań zauważyłam, że być może istnieje związek między dwoma zjawiskami: stanem zachmurzenia nieba i opadami deszczu. Oba obserwowane zjawiska nazwiemy zmiennymi, ponieważ wartości, jakie przyjmują, zmieniają się z obserwacji na obserwację· I tak, stopień zachmurzenia nieba zmienia się od całkowitego zachmurzenia przez częściowe zachmurzenie, do czystego nieba, czyli braku zachmurzenia. Opady deszczu zmieniają się w taki sposób, że występują, lub nie występują· (Można było oczywiście opisać opady deszczu w sposób bardziej szczegółowy np.: ulewa, deszcz, mżawka, brak opadów. Na razie jednak bardziej odpowiadało mi proste rozróżnienie na opady lub ich brak.) Takie zdefiniowane przez nas wartości zmiennych nazywamy kategoriami. Zjawiska, które możemy określić jako zmienne, są przedmiotem szczególnego zainteresowania nauk społecznych. To co się w nich zmienia, to wymiar ilościo wy lub własność dla każdego pojedynczego przypadku (jednostki, grupy, społeczeństwa, państwa, kultury - tego, co jest przedmiotem naszej obserwacji). Oto przykłady zmiennych, których rozumienie jest istotne w naukach społecz nych: klasa społeczna (wyższa, średnia, niższa), status zawodowy (pracownik umysłowy, pracownik fizyczny), poglądy polityczne (prawicowe, lewicowe), status społeczny (przypisany, osiągany), typ rządów (demokratyczne, autorytarne, totalitarne). Zostały one utworzone na takiej samej zasadzie jak zmienne w omawianym wyżej przykładzie "meteorologicznym". Innymi zmiennymi, które często pełnią rolę wyjaśniającą w stosunku do tych wyżej przytoczonych są np.: dochód (wysoki, średni, niski - bądź wyrażony ilościowo w złotówkach), wykształcenie (podstawowe, średnie, wyższe - bądź wyrażone w ukończonych latach edukacji), wyznanie (katolickie, protestanckie, prawosławne itd.). Można zatem pokazać, że klasa społecznamoże być opisana poprzez dochód i wykształ cenie jej członków. Wracając do przykładu, związek jaki zaobserwowałam,polegał na zależnościach pomiędzy określonymi kategoriami jednej zmiennej a określonymi kategoriami drugiej zmiennej: całkowite zachmurzenie z obecnością deszczu, czyste niebo z brakiem opadów. Na podstawie wstępnych 5-dniowych obserwacji mogłam
J
Jak
więc sformułować następujące stwierdzenie: "Istnieje związek pomiędzy stanem zachmurzenia nieba a obecnością deszczu, taki, że całkowite zachmurzenie jest związane z opadami a czyste niebo jest związane z brakiem opadów".
III
III
III
Istnieje związek między statusem zawodowym a wykształceniem, taki że osoby o wyższym poziomie wykształcenia częściej posiadają wyższy status zawodowy a osoby o niższym poziomie wykształcenia częściej posiadają niższy status zawodowy. Istnieje związek pomiędzy przynależnościądo klasy społecznej a dochodem, taki że im wyższy dochód danej osoby, tym wyższa jej pozycja społeczna, a im niższy dochód, tym niższa pozycja społeczna. Istnieje związek pomiędzy pochodzeniem społecznym a osiąganym wykształceniem, taki że z im wyższej klasy społecznej pochodzi osoba, tym większe ma szanse na osiągnięcie wyższego wykształcenia, a pochodzenie z niższej klasy skutkuje niższym wykształceniem.
We wszystkich powyżej przytoczonych hipotezach, niezależnie od użytego słow nictwa da się wskazać dwie zmienne i związki pomiędzy ich poszczególnymi kategoriami.
1.4. Testowanie hipotez W oparciu o małą liczbę obserwacji, prowadzonych w ciągu pierwszych 5 dni, udało mi się dostrzec związek, który miałam nadzieję potwierdzić w kolejnych 3D-dniowych obserwacjach. Postępując tak, zastosowałamprocedurę nazywaną indukcją, czyli sposobem rozumowania "od szczegółu do ogółu". Indukowałam hipotezę na podstawie 5 szczegółowych obserwacji i zakładałam, że będzie ona prawdziwa dla wszystkich przypadków.
badaczem?
. Gdy hipoteza była już postawIOna, postanowI'ł am sprawd ZI'ć J'ą w .,wybranym . . do badania okresie 30 dni. Moje rozumowanie było następujące: JeslI p~st~wIO.n~ . . . to powinna byc rowmez hIpoteza Jest prawdZIwa dla wszyst k'ICh przypadk'ow' . ie prawdziwa dla wybranego przeze mnie okresu czasu. TakIe rozu~~wan wiodące nie od szczegółu do uogólnienia ale w ~.r~g~ ~tron~ "o.d ogołu. do szczegółu" nazywa się dedukcją. Dedukowałam, IZ JezelI mOJa hIpoteza Jest prawdziwa w ogóle, to powinna być prawdziwa również dla wybranego przeze mnie okresu 30 dni.
Powyższe stwierdzenie nazywamy hipotezą. Hipoteza wymienia dwie zmienne, które pozostają ze sobą w związku i wskazuje, na czym ten związek polega (zachmurzenie-deszcz, brak chmur- brak opadów). Innym sposobem wyrażania związków w hipotezach jest użycie sformułowania "jeżeli... to... ": "jeżeli występuje całkowite zachmurzenie, to będzie padało"; "jeżeli niebo jest czyste, to nie będzie padało". Innymi hipotezami postawionymi w stosunku do badanych tu zmiennych byłyby hipotezy alternatywne: "jeżeli niebo jest czyste, to pada deszcz"; "jeżeli niebo jest całkowicie zachmurzone, to deszczu nie ma". Hipotezy alternatywne w tym przypadku są błędne, nie znajdują potwierdzenia we wstępnej obserwacji.
Spróbujmy teraz postawić hipotezy w stosunku do uprzednio zaprezentowanych zmiennych występujących w naukach społecznych.
być
W niektórych dziedzinach wiedzy możliwy jest do zaprojektowania eksperyment tzn. testowanie hipotez w warunkach laboratoryjnych. W moich badaniach' "eksperyment" ograniczył się do wyboru określonych 30 dni do badania.
l ~l
j
!
Informacje zawarte w tabeli 1.2 wskazują, że moja hipoteza została zwer~fi kowana. Jeśli wiele podobnych badań prowadziłoby do podobnych rezultatow, to związek pomiędzy całkowitym zachmurzeniem a opadami desz~zu ~~stał~y uznany przez społeczność naukową i rzadko poddawany w wątplIwosc; mOJa hipoteza stałaby się zatem prawem naukowym. Prawa naukowe to hipotezy o wysokim prawdopodobieństwietrafności. Abso-
co do ich obowiązywania nie możemy jednak nigdy posiadać. na dwie kwestie, które później zostaną szczegółowo omówione. Po pierwsze, większość naszych rezultatów pochodzi z badań prowadzonych na małej próbie, dokonujemy więc uogólniania z małej liczby elementów (próby) na ich całość (populację). Niestety, nigdy nie mamy 100% gwarancji, że to co było prawdą dla każdego elementu w próbie, będzie nią również dla każdego elementu w populacji. Możemy tylko oszacować prawdopodobieństwo, że tak będzie. Po drugie, według zasad formalnej logiki, na podstawie próby nie możemy niczego tak naprawdę udowodnić. Możemy tylko pokazać, że wszystkie inne alternatywne hipotezy nie są prawdziwe dla naszej próby, więc zostaje nam tylko jedna ewentualność - hipoteza, którą udowadniamy. lutnej
pewności
Zwrócę tu uwagę tylko
Wymienione wyżej problemy w niczym nie zmieniają faktu, że prawa naukowe różnią się od hipotez, gdyż zostały uznane przez społeczność naukową, aktywną na polu, którego dotyczą, za posiadające duże prawdopodobieństwotrafności. Prawa naukowe obowiązują, ponieważ eksperci z danej dziedziny doszli do takiego wniosku a nie zadecydowała o tym opinia publiczna, czy też naukowcy zajmujący się inną dyscypliną. Prawo grawitacji jest obowiązujące, ponieważ fizycy, nie socjologowie czy teolodzy, uznali, że jest ono wartościowe do wyjaśniania zagadnień z zakresu ich dyscypliny. Niestety w rzeczywistości "świat" rzadko współpracuje z badaczami w tak klarowny sposób, jak przedstawiono to w tabeli 1.2.
Jak
Przypuśćmy, że
po 30 dniach obserwacji nasze wyniki
prezentują się
być
badaczem?
Tabela 1.4.
jak w ta-
beli 1.3.
Niebo Deszcz Tabela 1.3.
Deszcz
Niebo Zachmurzone
Częściowo
zachmurzone
Czyste
Suma
Pada Nie pada
5
5
5
5
5 5
15 15
Suma
10
10
10
30
W tym przypadku moja hipoteza nie byłaby prawdziwa, obserwacje empiryczne zweryfikowałybyją negatywnie. Nie byłoby więc związku pomiędzy stanem zachmurzenia nieba a opadami deszczu. Przez połowę dni z niebem zachmurzonym pada (5 dni z 10), tak samo jest przy częściowym zachmurzeniu i przy czystym niebie (niezależnie od zachmurzenia pada przez połowę badanego czasu). Zatem wiedza na temat stopnia zachmurzenia nie daje nam żadnej pożytecznej informacji w kwestii występowania, bądź nie występowania, opadów deszczu. w przypadku danych zawartych w tabeli 1.2, gdzie mogliśmy przewidzieć, że przy całkowicie zachmurzonym niebie na pewno będzie padało (10 na 10). Jeśli niebo jest czyste, padać na pewno nie będzie. Przy częściowym zachmurzeniu mieliśmy 50% szans na deszcz i była to jedyna kategoria, która nie pozwalała na idealną prognozę opadów. Zatem w przypadku częściowe go zachmurzenia mieliśmy jednakowe prawdopodobieństwopostawienia trafnej i błędnej prognozy co do wystąpienia opadów. Inaczej
było
Informacje zawarte w tabeli 1.3 nie mają dla nas żadnego znaczenia prognostycznego - w każdy dzień jest pół na pół szans na deszcz, niezależnie od stopnia zachmurzenia nieba. Ten stosunek pół na pół wynika z faktu, że w badanym okresie wystąpiło 15 dni z opadami i 15 dni bez opadów (czyli jednakowa liczba). Aby uznać, że badany związek nie istnieje, nie musi być zachowana taka symetryczność rozkładu poszczególnych kategorii. Na brak związku wskazuje bowiem proporcjonalnośćrozkładu w poszczególnych polach tabeli w stosunku do liczebności brzegowych. Przypuśćmy, że w ciągu 30 badanych dni padało przez 24 dni, tj. 80% badanego czasu. Jeśli dla każdej kategorii stanu zachmurzenia nieba padało przez 80% czasu, to również nie ma związku między badanymi zmiennymi. Oznaczałoby to, że na 10 dni każdego stanu zachmurzenia 8 dni byłoby deszczowych (tabela 104).
Zachmurzone
Częściowo
Suma
zachmurzone
Czyste
Pada Nie pada
8 2
8 2
8 2
24 6
Suma
10
10
10
30
Informacje zawarte we wszystkich prezentowanych do ~ej po~y t~belach nazywamy danymi. Dane zawarte w tabeli 1.2 potwierdz~Ją .moJą hIpote~ę, da~e z tabel 1.3 i 1.4 nie potwierdzają jej. Czasami zdarza SIę, ze dane potw:erdzaJą zakładany przez nas związek ale nie w przewidywanym przez nas kIerunku. Przyjrzyjmy się tabeli 1.5. Tabela 1.5.
Niebo Deszcz
Zachmurzone
Częściowo
zachmurzone
Czyste
Suma
Pada Nie pada
10
5 5
10 O
15 15
Suma
10
10
10
30
O
Związek w tym przypadku istnieje i jest wysoce prognostyczny ale nie jest logicznie zgodny z zakładanym w hipotezie: przy czystym niebie pada, przy zachmurzeniu nie pada. Podobnie jak w przypadku tabel 1.3 i 1.4 hipoteza nie została zweryfikowana, jednak związek między zmiennymi istnieje, tylko jest on odwrotny od zakładanego.
Można by powiedzieć, że zależność przedstawiona w tabeli 1.3 jest zbyt ide-
alistyczna - w rzeczywistości nigdy nie mamy do czynienia z tak klarowną strukturą danych. Załóżmy wobec tego, że tylko w 8 z 10 zachmurzonych dni padało - dwa bezdeszczowe dni są więc niezgodne z oczekiwanymi wynikami (tabela 1.6).
Dla częściowego zachmurzenia i czystego nieba wyniki pozostają bez zmian. Moja hipoteza może być w dalszym ciągu uznawana za trafną, nawet przy braku idealnej prognostyczności dla zachmurzonych dni. Możemy dojść do wniosku, że zachmurzenie występuje przed opadami (występuje tu następstwo czasu), zatem występowanie zachmurzenia jest warunkiem koniecznym ale nie wystar-
Jak
czającym aby padało. Nie będzie padało jeśli nie ma chmur, ale nie z każdej chmury pada deszcz.
Tabela 1.6.
Deszcz
Niebo Zachmurzone
Częściowo
zachmurzone
Czyste
Suma
Pada Nie pada
8 2
5 5
O 10
13 17
Suma
10
10
10
30
Powinniśmyzwracać szczególną uwagę na rozróżnienie tego co konieczne, od tego co wystarczające. Warunek konieczny to taki, który musi być spełniony aby zaszło oczekiwane zjawisko. Jego obecność nie gwarantuje tego jednak w stu procentach. Natomiast jeśli zajdzie warunek wystarczający - oczekiwane zjawisko na pewno nastąpi. Przy badaniu hipotez zawierających więcej niż dwie zmienne, określenie tego, co konieczne a co wystarczające, jest niezbędne (choć czasem bardzo trudne). Możemy też mieć do czynienia z sytuacją badawczą, w której wskażemy wiele warunków koniecznych ale żaden z nich nie będzie warunkiem wystarczającym. Taką sytuację David Hume określił mianem stałej koniunkcji.
tabeli ' roz kł a d war t" OSCI w posz czególnych , .polach " poszukując jakiegoś wzorca dla każdej klasy pochodzenia. Załozmy, ze hIpot.eza dotycząca związku pomiędzy klasą pochodzenia a osiąganym wykszt~łcemem znajduje potwierdzenie w naszych danych.. Jeśli ~espo.nd~nt PO~hO~ZI. z .kl.asy wyższej, na ogół osiąga wyższe wykształceme,cho~ znaJduJ~myr.a':"~lez mehczne wyjątki od tej reguły. Jeśli respondent pochodzI z klasy sredmeJ, Jego szanse na wyższe wykształcenie są prawie takie same, jak osób pochodzących z klasy wyższej. Natomiast jeśli ktoś pochodzi z klasy niższej, to prawie nie ma szans na osiągnięcie wykształceniainnego niż podstawowe. Taka obserwacja pobudza nas do dalszego badania. Staramy się bardziej precyzyjnie ustalić skład badanych klas społecznych. Zastanawiamy się nad koncepcją dziedziczenia kapitału kulturowego i ekonomicznego, nad strategiami wychowawczymi obecnymi w badanym społeczeństwie, nad istniejącym systemem szkolnictwa itp. Jeżeli uda się nam sformułować sieć powiązanych ze sobą hipotez, z których każda będzie częściowo wyjaśniała badaną zależność podstawową, to będ~ie mo~na p0.w iedzieć że rozwinęliśmy teorię pionowej mobilności społecznej. Teona powmna zawi~rać również wskazania co do istniejących wyjątków od zweryfikowanej reguły. Oczywiście dobra teoria powinna tych wyjątków zawierać jak najmniej. .
Wyższe
Średnie
Podstawowe Suma
26
Wyższa
rodziców
Średnia
Niższa
.,
przykład:
Istniejący system edukacji jest oparty o system wartości klasy średniej i wyż szej, dlatego dzieciom z tych klas łatwiej jest zdobywać kolejne szczeble wykształcenia.
W podobny do opisanego powyżej sposób można przeprowadzić badania dotyczące jednej z zaprezentowanych wcześniej hipotez odnoszących się do zagadnień społecznych. Przedmiotem naszego zainteresowania może być związek mię dzy pochodzeniem społecznym a osiągniętym poziomem wykształcenia. W celu przeprowadzenia badań ułożymy ankietę i roześlemy ją do losowo wybranych osób. Jedno z pytań kwestionariusza ankiety powinno dotyczyć poziomu wykształcenia respondenta a inne jego pochodzenia społecznego. Odpowiedzi na te pytania moglibyśmy przedstawić w następującej tabeli: społeczna
,
Do teorii pionowej mobilności społecznej moglibyśmy dołączyć szereg obserwacji i hipotez, z których jedne byłyby już znane a inne jeszcze nie odkryte. Na
1.5. Od hipotez do teorii
Klasa
badaczem?
Następme porownywahbysmy
III
Wy kształcenie
być
Suma
III
III
III
Rodzice z klasy średniej silnie pobudzają aspiracje edukacyjne swoich dzieci, upatrując w wyższym wykształceniu najbardziej efektywny sposób na podniesienie ich pozycji klasowej. Do klasy niższej należą głównie osoby ze środowisk wiejskich oraz robotniczych z ośrodków miejskich o dużej stopie bezrobocia, gdzie występuje zjawisko dziedziczenia biedy. Reforma systemu oświaty osłabiła możliwości osiągania wyższych szczebli edukacji przez dzieci ze środowisk wiejskich.
O ile pierwsze trzy stwierdzenia znajdują potwierdzenia w materiałach z badań nad stratyfikacją społeczną, to ostatnie jest czysto hipotetyczne (tylko w momencie pisania tego podręcznika, bo badania nad tą problematykąjuż trwają)· Jeśli jednak na podstawie naszych badań i wiedzy na temat obecnej struktury społecznej udałoby się nam określić, jak ta struktura będzie się zmieniała w ciągu najbliższych lat i jakie czynniki będą miały na to wpływ, to teorię mobilności pionowej mielibyśmy gotową·
~(!IfI'
Tabela 1.7.
Taki sam sposób postępowania możemy zastosować nawet do analizowanego przykładu o opadach deszczu. Przy testowaniu postawionej uprzednio hipotezy moje badania można rozwinąć i pogłębić. Stan zachmurzenia nieba można przedstawić za pomocą zmiennej, która została uprzednio zdefiniowana, jako zmienna przyjmująca własności takie jak: zachmurzenie, częściowe zachmurzenie i czyste niebo, lub określić to w inny bardziej specjalistyczny sposób (np. cumulus, cumulonimbus, cirrus, itd.). Przypuszczalnie można też badać temperaturę, wilgotność powietrza i inne warunki atmosferyczne, w celu ustanowienia szeregu powiązanych ze sobą hipotez, które będą wyjaśniały występowanie opadów atmosferycznych w postaci deszczu. Mogłabym więc skonstruować teorię "deszczopadu" (meteorologia na pewno taką teorią dysponuje i na pewno ma ona swoją fachową nazwę). Nawiązując do danych z tabeli 1.6, potrzebna by była hipoteza wyjaśniającawyjątek w postaci 2 dni bez opadów przy całkowitym zachmurzeniu nieba. Musimy zatem odpowiedzieć na pytanie, co jeszcze jest konieczne oprócz chmur do wystąpienia opadu? Ta i inne hipotezy wyjaśniałyby naturę "deszczopadu" .
1.6. Typy
zależności
Przeformułujmypostawioną hipotezę w następujący sposób: "Istnieje zależność między stopniem zachmurzenia a występowaniem opadów deszczu polegająca na tym, że zachmurzenie jest związane z występowaniem opadów a czyste niebo jest związane z brakiem opadów" .
Określone mamy dwie zmienne i naturę ich zależności. Ponieważ obie zmienne s~.mierzone w kategoriach ilościowych - raczej jako natężenie cechy anie jej roznorodna własność - jest możliwe uproszczenie zależności w mojej hipotezie. Obie zmienne muszą więc być mierzone w kategoriach określających natężenie od "więcej" do "mniej". Innymi przykładami takiej konstrukcji zmiennych może być dochód: wysoki, średni, niski (bądź mierzony w złotówkach); wiek: starość wie~ średn.i, m~odoś~, dzieciństwo, niemowlęctwo (bądź mierzony w latach): Zrn.Iennyml, ktore mIerzą raczej własności niż ilość danego zjawiska są pleć, relzgza, orzentacja polityczna. Zilustrujmy powyższe rozważania, ujmując dane z 30-dniowych obserwacji w tabeli 1.7. Teraz stopień zachmurzenia waha się od całkowitego zachmurzenia do braku ch~ur, a wielkość opadów od ulewy do braku opadów. Kategorie obu zmiennych
oplsan: s~ przez stopień natężenia ilości danej zmiennej w porządku malejącym (od najWIększego natężenia do naj mniejszego).
Wielkość
opadów
Zachmurzenie Całkowite
Ulewa Deszcz
N ależy
Suma
Częściowe
Brak chmur
7
1
2
O O O
8 6 5
Mżawka
1
4 4
Brak opadu
O
1
10
11
Suma
10
10
10
30
zauważyć, że większość
przypadków z 30-dniowej próby położona jest na tabeli 1.7 (tak jak to zaznaczono w tabeli) od lewego górnego rogu do prawego dolnego, wskazując, że większy opad jest związany z większym zachmurzeniem, a mniejszy opad z mniejszym zachmurzeniem (brak opadu, brak chmur). przekątnej
Jeśli obie nasze zmienne posiadałyby równą liczbę kategorii (mielibyśmy równą liczbę
kolumn i wierszy w tabeli) rozkład wartości na przekątnej byłby bardziej widoczny, podkreślając związek "większego" z "większym" i "mniejszego" z "mniejszym". Taki związek określamy jako zależność pozytywną. Teraz moja hipoteza może przybrać postać: "stopień zachmurzenia i wielkość opadów są zależne pozytywnie". Oznacza to, że "im więcej zachmurzenia, tym więcej opadów" a "im mniej zachmurzenia, tym mniej opadów". Przeciwieństwo do zależności pozytywnej występuje wówczas,
gdy związek pozmiennymi polega na tym, że im "więcej jednej zmiennej" tym "mniej drugiej". Gdybyśmy założyli, że więcej chmur oznacza mniej opadów, a mniej chmur więcej opadów, to nasze dane mogłyby wyglądać jak w tabeli 1.8.
między
Tabela 1.8. Wielkość
opadów
Zachmurzenie Całkowite
Częściowe
Brak chmur
Suma
Ulewa Deszcz
O
1
10
11
1
Mżawka
Brak opadu
2 7
4 4
1
O O O
5 6 8
Suma
10
10
10
30
Tabela 1.10.
W tym przypadku liczebności w polach tabeli skupione są na przekątnej od dolnego lewego rogu do górnego prawego rogu. Taki typ związku będziemy
Płeć
nazywać zależnością negatywną·
Jeżeli założylibyśmy pierwotnie, że występowanie zachmurzenia jest związane z brakiem opadów, to naszą hipotezę moglibyśmy zapisać jako: "Stopień zachmurzenia i występowanie opadów są zależne negatywnie" . Proszę zwrócić uwagę na to, że istotą zależności pozytywnej jest związek między kategoriami zmiennych taki, iż "więcej" łączy się z "więcej" a "mniej" z "mniej" . Przy zależności negatywnej związek między kategoriami zmiennych jest taki, że "więcej" łączy się z "mniej" a "mniej" z "więcej". Układ liczebności w tabeli jest w takim wypadku elementem pomocniczym, ale czasem może być mylący.
Tabela 1.9. Wielkość
opadów
Zachmurzenie Suma
Całkowite
1 4 4 1
7 2
1
5
Brak opadu
O O O 10
O
11
Biorąc
Suma
10
10
10
30
opisać
Mżawka
III
Gdyby nasza tabela wyglądała jak tabela 1.9, to związek między stanem zachmurzenia nieba i występowaniem opadów byłby w dalszym ciągu pozytywny, choć liczebności w polach tabeli układałyby się od dolnego lewego rogu do górnego prawego rogu. Przy konstrukcji tabel trzeba więc zwracać uwagę na kolejność kategorii.
III
III
III
Związek pomiędzy dwiema zmiennymi można określić jako pozytywny lub negatywny tylko wtedy, gdy zmienne te opisują ilość jako natężenie danej cechy
(gdy ilość jest wyrażona za pomocą wartości liczbowych np. opady w mililitrach na centymetr kwadratowy, to związek pozytywny może być związkiem proporcjonalnym, a związek negatywny - związkiem odwrotnie proporcjonalnym). Kiedy kategorie opisują własności badanego obiektu taka typologia zależności nie ma sensu. Załóżmy hipotetycznie, że płeć jest zależna od koloru włosów tak, że kobiety częściej niż mężczyźni są blondynkami a mężczyźni częściej niż kobiety mają włosy ciemne. Wyniki badań przeprowadzonych na grupie stu osób zestawia tabela 1.10.
Jasne
Kobieta
35 15
15 35
50 50
Suma
50
50
100
Ponieważ 70 ze stu osób ma obie cechy o takich własnościachjak zakłada nasza hipoteza, można powiedzieć, że w przeprowadzonych badaniach hipoteza ta została zweryfikowana pozytywnie. Nie można jednak stwierdzić, że płeć i kolor włosów są "zależne pozytywnie". Do badanych tu zmiennych nie ma sens~ używanie określeń "więcej" i "mniej". Mężczyzna i kobieta to ~w~ typy płCI; żaden z nich nie jest "więcej" lub "mniej" płcią. To samo odnOSI SIę do ~olo:~ włosów: jasny czy ciemny nie jest "więcej" czy "mniej" kolorem (p~zyna!~meJ do czasu, kiedy nie zaczniemy ich traktować z fizycznego punktu wldzem~ Ja~o częstości w wiązce światła). Zatem relacja między płcią a kolorem włosow me może być opisywana jako zależność pozytywna.
Częściowe
8 6
Suma
Ciemne
Mężczyzna
Brak chmur
Ulewa Deszcz
Włosy
pod uwagę wyżej poczynione zastrzeżenia możemy w podobny sposób szereg hipotez dotyczących zjawisk społecznych. Na przykład:
Status zawodowy i stopień wykształcenia są zależne pozytywnie. Poparcie dla istniejącego systemu politycznego i oczekiwanie podniesienia własnego standardu życia są zależne pozytywnie. Czas poświęcony na oglądanie telewizji i na czytanie książek są zależne negatywnie. Dochód i poparcie dla związków zawodowych są zależne negatywnie.
1.7.
Zależność a związek
przyczyno-skutkowy
Podejmując
badania na ogół poszukujemy przyczyn zjawiska, które jest ich przedmiotem. Poszukujemy takiej zmiennej, której zmiana wartości przyniesie również zmiany wartości zmiennej badanej. Pytamy: jakie czynniki wpływają na wielkość opadów? Jeżeli stopiell zachmurzenia nieba jest związany z wielkością opadów (i zakładamy w danym momencie, że inne czynniki takie jak temperatura i wilgotność powietrza nie mają bezpośredniego wpływu na ten związek), to skłonni jesteśmy zakładać związek przyczynowo-skutkowy między tymi zmiennymi. Możemy przypuszczać, że zmiany w poziomie zachmurzenia
31
przynoszą zmiany w wielkości opadów. W końcu możemy powiedzieć, że chmury są przyczyną deszczu. Mając pewną wiedzę
o meteorologii i klimacie, logicznym wydaje się powyższe stwierdzenie. Jeśli takiej wiedzy nie posiadalibyśmy, równie dobrze moglibyśmy powiedzieć, że deszcz jest przyczyną chmur. To, jak określimy kierunek związku między dwiema zmiennymi, zależy od naszej znajomości problematyki i od czasowego następstwa zmiennych. Punktem wyjścia naszych rozważań o związkach przyczynowo-skutkowych (zanim zajmiemy się ich kierunkiem) powinno być ustalenie, czy zależność w ogóle istnieje. Jeśli nie ma zależności, bez sensu jest poszukiwanie przyczynowości. Występowanie zależności jest warunkiem koniecznym wystąpienia związku przyczynowo-skutkowego. Z naszych wcześniejszych obserwacji wiemy, że stopień zachmurzenia nieba i wielkość opadów pozostają w zależno ści. Gdy zależność zostanie ustalona, możemy poszukiwać kierunku związku przyczynowo-skutkowego między zmiennymi. Prostym sposobem na ustalenie kierunku związku jest ustalenie następstwa czasowego. Jeśli jedna ze zmiennych zmienia się wcześniej niż druga, to możemy przypuszczać, że pierwsza zmienna jest przyczyną drugiej. W przypadku opadów możemy zaobserwować że zachmurzenie występuje wcześniej niż deszcz. Czasami gdy deszcz przestani~ padać, przejaśnia się. Ponieważ zachmurzenie poprzedza opad zakładamy, że chmury są przyczyną deszczu - przyczyna bowiem poprzedza skutek. Niestety nie zawsze możemy być pewni co do następstwa czasu zmiennych. Przykładowe badanie płci i koloru włosów dobrze ilustruje ten problem. Obie cechy dziedziczymy zanim się urodzimy. Z tej perspektywy jest zupełnie nielogiczne założenie, że płeć warunkuje kolor włosów, lub na odwrót, że kolor wło só:", ,,:arun~uje p~e~. Na,;et )eśli znaleźliśmyzależność pomiędzy tymi zmiennymI, me mozemy jej okreslac w kategoriach związku przyczynowo-skutkowego.
Jeżeli. nie ist~iej~ ~ożliwość określenia, która zmienna jest przyczyną, a która skutkIem, najlepIej pozostać przy stwierdzeniu ich zależności. W wielu procedurach ~tat'ystyc~nych ~tosow~nych w analizie danych wymagane jest wstęp ne, okreslem~, ktora zm18nna jest przyczyną, a która skutkiem. Dokonujemy wo,:czas ar.bltralneg~ wskazania jednej ze zmiennych jako przyczyny (badanie takIego zWIązku. mozemy przeprowadzić w "dwie" strony, uznając raz jedną a raz drugą zmIenną za przyczynę). W przykładzie dotyczącym płci i koloru włosów, jeśli przedmiotem naszego zainteresowania byłby kolor włosów to wówczas płeć uznalibyśmy za przyczynę. Natomiast jeśli celem naszego bad;nia byłoby zróżnicowanie płci, to kolor włosów byłby jedną z przyczyn.
Jeśli. ~usimy dokonać zróżnicowania zmiennych na przyczynę i skutek - niezalezme od tego, czy dokonujemy tego podziału na podstawie logicznych prze-
słanek,
czy też w sposób arbitralny - zwykle zmienną wYjasmającą, którą za przyczynę nazywamy zmienną niezależną a zmienną wyjaśnianą, którą uważamy za skutek - zmienną zależną. Zmiany w wartościach zmiennej zależnej zależą od zmian w wartościach zmiennej niezależnej, np. nasilenie opadów zależy od wielkości zachmurzenia. uważamy
Jeżeli zakładamy, że społeczne nierówności prowadzą do rewolucji, to wystą pienie rewolucji zależy od wcześniejszego nasilenia się społecznych nierówności. Wystąpienie rewolucji jest więc zmienną zależną (skutkiem) a społeczne nierówności są zmienną niezależną (przyczyną). Jeżeli zakładamy, że zanieczyszczenie powietrza wywołuje pewne formy nowotworów, to stopień zanieczyszczenia powietrza jest dla nas zmienną niezależną, a poziom zachorowań na nowotwory jest zmienną zależną. Oczywiście, jednocześnie zakładamy brak oddziaływaniaw drugą stronę np., że poziom zachorowań na nowotwory wpływa na stopień zanieczyszczenia powietrza.
1.8. Jednostka analizy Przedmiot naszych zainteresowań badawczych -- to co mierzymy, to do czego odnosi się nasza hipoteza - jest jednostką analizy. To nie jest zmienna ale obiekt, który ta zmienna charakteryzuje - osoba, instytucja, obszar itp. W naszym przykładzie "meteorologicznym" jednostką analizy były dni - dla każdego z 30 dni rejestrowaliśmy stan zachmurzenia nieba i występowanie opadów, mierzyliśmy dwie zmienne. W przykładzie dotyczącym płci i koloru wło sów jednostkami analizy były osoby. Dla każdej osoby mierzyliśmy dwie zmienne, płeć i kolor włosów. Jeśli prowadzilibyśmy badania nad zależnością występowania rewolucji z powodu narastania nierówności społecznych, to jednostkami naszej analizy byłyby państwa. Dla każdego państwa będącego przedmiotem naszych badań określa libyśmy poziom występującychnierówności społecznych i fakt zaistnienia, bądź nie, rewolucji w określonym przedziale czasowym.
W badaniach nad wpływem zanieczyszczenia powietrza na wzrost zachorowalności na nowotwory moglibyśmy brać pod uwagę wielkie miasta. W każdym mieście (jednostce analizy) oznaczalibyśmy stopień zanieczyszczenia powietrza i poziom zachorowań na określone typy nowotworów. Ponieważ
dotyczy postaw i zachowań spoanalizy są osoby. W dalszych rozdziałach posługiwać przykładami pochodzącymi z Polskiego Generalnego
w naukach
społecznych wiele badań
łecznych, więc najczęściej jednostkami
będziemy się
T' Sondażu Społecznego (PGSS), gdzie jednostkami analizy są respondenci tego sondażu. Nie należy jednak zapominać, że równie dobrze jednostkami analizy mogą być np. klasy szkolne, przedsiębiorstwa, miasta, państwa, partie politycz-
ne, stowarzyszenia
międzynarodoweitd. 11l1li11
Nasze rozważaniadotyczące metody naukowej w następnych rozdziałach zostaną wsparte wiedzą o technikach analizy ilościowej. W jaki sposób liczby mówią nam o faktach? Jak sprawić by liczby miały dla nas sens? Zagadnienia dotyczące badania i opisu zjawisk oraz dokonywania indukcji na podstawie danych
należą do dziedziny nauki zwanej statystyką.
Ćwiczenia Ćwiczenie 1.1.
Które z poniższych zdań ma charakter normatywny, a które empiryczny: 1. Rodzice powinni
opiekować się dziećmi.
2. W roku 1999 w Polsce zostało porzuconych 41 noworodków. 3. Prawo głosu jest istotą wolnego społeczeństwa. 4. W wyborach parlamentarnych wzięło udział 52% uprawnionych do głosowania. 5. Prawo pracy powinno być przestrzegane. 6. Jedna piąta pracodawców zatrudnia nielegalnych pracowników. 7. Mężczyzna zdolny do służby wojskowej powinien móc wstępować w związek małżeński.
8. W tym państwie mężczyźnimogą być powołani do służby wojskowej w wieku 18 lat a związek małżeński mogą zawrzeć, gdy ukończyli 21 lat. Ćwiczenie 1.2.
Utwórz cztery pary zagadnień, którymi
stwierdzeń (normatywnych się
i empirycznych) w stosunku do
interesujesz.
Ćwiczenie 1.3.
1. Postaw hipotezę w stosunku do interesującegoCiebie problemu społecznego. Użyj odpowiedniej formy słownej. 2. Zidentyfikuj zmienną zależną i niezależną. Uzasadnij swoje wskazanie. 3. Przedstaw logiczne kategorie dla każdej zmiennej. Określ ich charakter. 4. Jaka jest jednostka analizy Twojego badania? 5. Narysuj tabelę zawierającą badane zmienne i w jej pola wpisz takie liczebności, które potwierdziłybypostawioną hipotezę.
Ćwiczenie 1.4Dla hipotez z ćwiczenia.
34
podrozdziału
1.3 (str. 22) powtórz kroki 2, 3 i 4 z poprzedniego
i
!
Ćwiczenie
1.5.
Sformułuj hipotezy użyteczne dla wyjaśnienia, czy zmierzenia, postępu w kieru~~u o~iągnięcia .nas~ęp~jący~h celów ~ormatywnych. Dla każdej hipotezy naZWIJ zmIenną zalezną I mezalezną, okresl ich kategorie i jednostki analizy.
1. Mężczyźni i kobiety powinni otrzymywać taką samą płacę na porówn walnych stanowiskach. y 2. Broń biologiczna i chemiczna powinny być wyeliminowane. 3. Wszyscy chorzy powinni mieć zapewnioną opiekę medyczną. 4. Nie powinno się stosować kary śmierci. 5. Reklamowanie alkoholu powinno być zabronione. 6. Każda placówka edukacyjna powinna mieć pracownię komputerową.
Pojęcia podstawowe
Ćwiczenie 1.6.
Określ ~ ,miarę jak najbardziej szczegółowojednostkę analizy dla następujących
zagadmen:
2. Menedżerowie chętniej uczestniczą w imprezach firmow ch .. . y mz szeregowi pracowmcy. 3. Stany Zje?nocz~ne posiadają więcej okrętów podwodnych o napędzie atomowym mz RosJa. 4. Dochód ~ojew~d~tw ze "ściany wschodniej" jest 5. Meksyk Jest najwIększym miastem na świecie.
niższy niż pozostałych.
6. W Afryce jest najwięcej osób zarażonych wirusem HIV. 7. Stopień uzwiązkowienia ciągle się obniża.
Literatura
częstość/liczebność
III
III
poziom
pFrankf~rt-Nac~mias l
Ch., Nachmias D.: Metody badawcze w naukach S-ka 2001.
3. Mokrzycki E.: Filozofia nauki a socjologia. Warszawa, PWN 1980. 4. Nowak S.: Metodologia
badań społecznych. Warszawa, PWN 1985.
społecznych
.
III
III III III
poziom ilorazowy zero absolutne szereg statystyczny, każda wartość stanowi kategorię szereg statystyczny, kategorie stanowią przedziały wartości
III
rozwartość przedziału
fil
definicja operacyjna
III
trafność
interwałowy III rzetelność
Prowadząc badania metodą naukową, dokonujemy obserwacji, zbieramy informacje, kolekcjonujemy dane. Dane te, to zestaw cech jakościowych i ilościowych charakteryzujących każdą jednostkę analizy. W trakcie badania dokonujemy pomiaru tych cech. Pomiar polega na sprawdzeniu, jaką własność, czy też ilość danej cechy posiada określona jednostka analizy. Ze względu na różnorodność mierzonych charakterystyk, narzędzia pomiaru muszą być również zróżnicowa ne. Będziemy zatem używać zróżnicowanych poziom~w pomiaru.
Określenie
1. Malikowski M ., Niezgod aM. (oprac.: ) B ad ' emplryczne . ama w socjologii T I Tyczyn, WSS-G 1997. . . . oznan, Zysk
!II
III
III
1. W klasie IIb w zeszłym tygodniu 1/3 uczniów była nieobecna z powodu grypy.
2.
III
pomiar poziom pomiaru poziom nominalny dychotomia poziom porządkowy skala Likerta
III
I
poziomu pomiaru, w jakim możemy mierzyć daną cechę, jest o tyle istotne, iż determinuje metody analizy statystycznej, jakie będziemy mogli zastosować w naszych badaniach. Ważnym problemem staje się więc operacjonalizacja zmiennych (również poprzez określenie poziomu ich pomiaru) oraz określenie jej rzetelności i trafności.
2.1. Pomiar Kiedy używamy słowa pomiar, zwykle myślimy o pewnej specyficznej czynności mierzenia, np. długości za pomocą metra, czy też ciężaru za pomocą wagi.
Mierzonemu zjawisku przypisujemy liczbę wskazaną przez narzędzie pomiaru. Dzięki temu możemy powiedzieć, że blat stołu jest długi na 1,2 metra a szeroki
w tym przypadku rolę działań algebraicznych.
W naukach społecznych pomiar oznacza czynność opisaną powyżej, ale znacznie uproszczoną, polegającą na przypisaniu określonej kategorii zmiennej do każdej jednostki analizy.
Symboliczne oznaczenia liczbowe używan~ są d? k?dowani~ danych przy zakła daniu komputerowych baz danych, ale me mają zadnego mnego (arytmetycznego) znaczenia, niż to, które nadają werbalne etykiety.
Jeśli zmienną możemy wyrazić za pomocą liczb, nasze porównania są bardziej
Innym przykładem zmiennej mierzonej na poziomie no~inalny~j~st. wyz~aw~~ na religia, np.: katolicyzm, protestantyzm, prawosławIe. Tu rowmez koleJnosc wymienianych kategorii nie ma znaczenia.
na 0,7 metra, natomiast jabłko waży 0,17 kilograma.
precyzyjne - osoba która zarabia 2000 złotych miesięcznie, osiąga dochody wyższe od średniej krajowej o 123 złote. W przypadku, gdy osoba ta mieszkałaby w województwie Mazowieckim a inna w Wielkopolskim, to dokonywalibyśmy "pomiaru" zmiennej województwo poprzez przypisanie każdej badanej osobie odpowiedniej kategorii (jednej z 16) tej zmiennej. W zależności od właściwości i możliwości pomiaru interesujących nas charakterystyk (jednostek analizy) wybieramy określony wzorzec dokonywania pomiaru. Dostępne nam wzorce pomiaru nazywamy poziomami pomiaru lub skalami pomiaru. Mamy cztery podstawowe poziomy pomiaru: II
nominalny,
II porządkowy, II
interwałowy,
II
ilorazowy.
można
na nich
dokonywać żadnych
przykładowe zmienne możemy przedstawić jako:
Płeć
1.
nie
mężczyzna
2. kobieta
Religia 1. prawosławie 2. katolicyzm 3. protestantyzm
Przyjrzyjmy się teraz warunkom wyczerpywalnościi.rozłączno~cikategory~acji zaprezentowanych powyżej zmiennych. Co do tego, .ze .warunkl..te są speł~lOne przez zmienną płeć, nie mamy wątpliwości - w kazd~J sytuacJ~ ?adawczeJ. dla tej zmiennej wystąpią tylko wymienione dwie kategor:e..InaczeJ Je~t ze zml,en~ ną opisującą wyznawaną religię. Mogłoby się zdarzyc, ze w grupIe, w ktorej prowadzimy badania byliby muzułmanie i osoby niewierzące. Nasza kategoryzacja przynależności religijnej powinna wówczas z poniższych postaci:
2.2. Poziom nominalny
A. Religia
Poziom nominalny jest naj niższym poziomem pomiaru.
Dokonując pomiaru na określonej kategorii zmien-
tym poziomie, przypisujemy jednostkę analizy do nej. Kategorie opisują właściwości danej zmiennej. Podział na kategorie musi speł~iać dw~ warun~i: być wyczerpujący i rozłączny, tzn. że każdą jednostkę analIzy nalezy przypIsać do określonej kategorii, co więcej - tylko do jednej kategorii.
PrzYk~adem zmiennej
Zatem
symboliczną i
mierzonej na poziomie nominalnym jest płeć. Zmienna ta posIada dwie kategorie: kobieta lub mężczyzna, opisujące dwie różne właści woś~i. ~olejność,. w jakiej wymieniamy kategorie tej zmiennej nie jest istotna, gdyz me P.azost~Ją one w stosunku do siebie w żadnej zależności natężenia cechy. AI~ me posIada ani więcej ani mniej płci od Janka. Możemy oznaczać te kategone za pomocą liczb: l - kobieta, 2 - mężczyzna, ale liczby te pełnią
B. Religia
przyjąć jedną
C. Religia
1.
prawosławie
1.
prawosławie
1.
prawosławie
2. 3. 4. 5.
katolicyzm protestantyzm islam ateizm
2. katolicyzm 3. protestantyzm 4. inne 5. żadna
2. 3. 4. 5.
katolicyzm protestantyzm islam inne lub żadna
Jeśli
jedna z badanych osób określi się jako bud~ysta, to kate~oryzacja~ okaże nieodpowiednia ale B i C nadal będą prawI~ło,,:e. Wybor ~ategorn badanej zmiennej zależy czasami od środowiska, ktore Jest przedmlOtem naszego zainteresowania. się
Gdybyśmy prowadzili
badania w Indiach, to sensowna kategoryzacja zmiennej
określającej wyznawaną religię wyglądałaby następująco:
38 39
( rr
Religia
Symbol ni będzie oznaczał liczebność kategorii, natomiast N ogólną liczbę badanych obiektów. Suma liczebności poszczególnych kategorii powinna być równa liczebności ogólnej (2:: ni = 6 + 4 = 10 = N).
1. hinduizm
2. islam 3. dżinizm 4. buddyzm 5. chrześcijaństwo 6. żadna 7. inne
Zatem do kategorii danej zmiennej będziemy wł czać takie
Zmienne, które mają tylko dwie kategorie nazywane są dychotomicznymi. Pleć jest właśnie przykładem takiej zmiennej mierzonej na poziomie nominalnym. Zmienna określająca wyznawaną religię miała w naszych przykładach różną liczbę kategorii (3, 5 i 7). Jeśli analizowana zmienna nie jest dychotomiczna, to w zasadzie nie ma większego znaczenia ile ma ona kategorii. ",
~~~~~~~:~~:Zs:~ z~a:Źtć w ~ad~nej ~rupie: mając ~a uwadze w~::~:~~~~a~~:;~ a egona "Inne pOWInna byc stosunkowo mało liczna.
,
Są
l
dwa podstawo,:e sposoby prezentacji zebranych danych. Pierwszy z . h po ega na utworzemu tzw k d l ' b ' . mc r' k' . re or u, dory ędzIe zawIerał identyfikacjęjednostki ana IZy I wszyst Ie charakteryzujące ją zmienne. Na
przykład:
Imię
i nazwisko
Ewa Kowalska Jan Nowak Jacek Stopa Zofia Tym
Płeć
kobieta mężczyzna mężczyzna
kobieta
Kierunek studiów historia socjologia filozofia socjologia
Stypendium socjalne żadne
naukowe naukowe
~~;:;:~~O~~::::d~:~c~n~:~dualn~e,.dlałk~żd~j jednostki analizy) są na ogół owama I za ozema bazy danych w komputerze.
;a~~~~~;~:z:l:~;rowa~zenia
jesteśmy
analizy statystycznej nie zaintereso' d wymIarem zgromadzonego materiału badawczego dlatego tez' p rezen tujemy ane w 'b d ' sposo uporzą kowany w szeregu statystycznym.
:r~mieniamy każdą kategorię zmiennej
oraz jej liczebność tore w naszym badaniu taką własność posiadają).
(liczbę jednostek,
Jeśli w naszym badaniu brało udział 10 osób z któr ch 4 t . ,. kobiety, szereg statystyczny dla zmiennej ple:: będzi:następou:~;~zyzm a 6 to
2.3. Poziom
porządkowy
Określenie porządkowy w porządku
nazwie poziomu odnosi się do kolejności, czy właśnie jego kategorii, który dla tego poziomu pomiaru ma znaczenie.
Kiedy dokonujemy klasyfikacji poprzez ustalenie następstwa (porządku) kategorii to zakładamy, że istnieje pewne continuum natężenia danej zmiennej, które ten porządek odzwierciedla. Jeżeli dokonamy klasyfikacji państw ze względu na liczbę zamieszkujących je osób, to na pierwszym miejscu będą Chiny, na drugim Indie, na trzecim Stany Zjednoczone. Czyli mamy pewien porządek, zgodnie z którym wiemy, że najludniejszym państwem świata są Chiny, nie wiemy jednak, ile dokładnie mają mieszkańców, ani o ile więcej od Indii. Dokonując
pomiaru na poziomie porządkowym dokonujemy nie tylko przypisania jednostki analizy do określonej kategorii własności, ale do kategorii pozostających między sobą w pewnym porządku. Gdyby rekordy danych o studentach zawierały zmienną określającą ich wzrost, to moglibyśmy utworzyć następującąkategoryzację na poziomie porządkowym: Imię
i nazwisko
Jan Nowak Ewa Kowalska Jacek Stopa Zofia Tym
Wzrost najwyższy (pierwszy najwyższy) druga najwyższa trzeci najwyższy naj niższa (czwarta naj wyższa)
Płeć
kobieta mężczyzna
6 4
N= 10
Z rankingu tego wiemy, że Jan jest najwyższy ale nie wiemy o ile jest wyższy od Ewy, od Jacka i od Zofii. Nie wiemy również o ile Ewa jest wyższa od Jacka itd. W rzeczywistości gdybyśmy dokonywali pomiaru takiej zmiennej, staralibyśmy się dokonać tego jak najbardziej precyzyjnie, w tym przypadku np. w centymetrach.
(-(Iim
W analizie statystycznej posługujemy się uporządkowanymi zmiennymi a nie indywidualnymi rekordami. Szereg statystyczny dla zmiennej wzrost w badaniu grupy studenckiej mógłby przyjąć postać: VVzrost
ni
1. bardzo wysoki
3 7 10 6 4
2. wysoki
3. średni 4. niski 5. bardzo niski
.
Poszczególne kategorie prezentują natężenie badanego zjawiska od najwyższego do naj niższego, przy czym odwrócenie tego porządku w kierunku od naj niższego do najwyższego nie zmienia postaci rzeczy - zmienna nadal jest mierzona w skali porządkowej. następstwa
kategorii
spowodowałaby obniżenie
Poziom porządkowy Status ekonomiczny
Poziom nominalny Status ekonomiczny
1. 2. 3. 4. 5.
1. biedny
2. 3. 4. 5.
wystarczający średni więcej niż średni
dochód bogaty dochód dochód
po-
średni
więcej niż średni wystarczający
Aby przywrócić zmiennej nominalnej status zmiennej porządkowej należy przywrócić logiczną kolejność jej kategorii (w porządku rosnącym lub malejącym).
2.4. Skala Likerta
przykład:
Stwierdzenie: Kara
42
śmierci
?
powinna
Taka forma pytania i odpowiedzi nazywa się skalą ocen lub ,pyt~~iem tyPnu Likerta w skrócie skalą Likerta. Pozwala ona nie tylko po~nac opml~ ~esp~ ..j dentów' na dany temat, ale również ocenić ich zdecydowallle w,?ane . w~s 1.1; " ..,. da" a zgoda to WIęcej lllZ Po nieważ "zdecydowana zgoda to WIęcej lllZ k"zgo ., , ,u porządkowego. Kabrak zgody" itd. to skala Likerta ma chara ter pOzlOm . . tralną " ' k 'l" . h poglądów jest opcją neu tegoria tych, którzy nie umieją o res lC SWOIC , . . .. .. wobec pozostałych. w środku skali. Wazne jest jej mIejSCe To jest poziom
porządkowy:
l. zdecydowanie zgadzam się
2. 3. 4. 5.
zgadzam się trudno powiedzieć nie zgadzam się zdecydowanie się nie zgadzam
Ci, którzy nie są pewni to "mniej" niż poparcie ale jednak ciwstawianie się prezentowanym poglądom.
.
."
"WIęcej
niż
prze-
To nie jest poziom porządkowy: 1. zdecydowanie zgadzam się
2. zgadzam się 3. nie zgadzam się 4. zdecydowanie nie zgadzam się 5. trudno powiedzieć
W badaniach zjawisk społecznych, zwłaszcza tych prowadzonych za pomocą różnego typu kwestionariuszy, często możemy spotkać pytanie w formie stwierdzenia, z prośbą o ustosunkowanie się do tego stwierdzenia. Na
2. zgadza się 3. trudno powiedzieć
z tym stwierdzelllem.
Tak jak w przypadku zmiennych mierzonych na poziomie nominalnym ni oznacza liczebność poszczególnych kategorii a N liczebność ogólną badanej grupy.
biedny dochód dochód dochód bogaty
l. zgadza się zdecydowanie
4. nie zgadza się 5. nie zgadza się zdecydowanie
N=30
Dopiero zmiana logicznego ziomu pomiaru zjawiska.
Czy Pan(i):
być
przywrócona.
, . k t .. zmienna zatraca swój W momencie zakłócenia logicznej kolejnoscl a egofll "porządkowy" charakter.
. 'ennych na podoW naukach społecznych często tworzy się kategoryz~~je Z~lll .' bieństwo skali Likerta. Na przykład badanie or~ent~cJl pohtyczn~~h moze byc przeprowadzone za pomocą zmiennej o następującej kategoryzacJI.
Poglądy
polityczne
1. zdecydowanie lewicowe
2. 3. 4. 5.
lewicowe centrowe prawicowe zdecydowanie prawicowe
Traktujemy wówczas zmienną nominalną jako zmienną porządkową- wynika to z natury opisywanych własności. Podobny sztuczny zabieg stosowany jest niekiedy w stosunku do nominalnych zmiennych dychotomicznych. Popatrzmy na następujące dychotomie: Płeć
1.
mężczyzna
2. kobieta
Dochód 1. wysoki 2. niski
Obie zmienne są dychotomiami (mają tylko po 2 kategorie), pleć jest zmienną nominalnąa dochód zmienną porządkową. Jeżeli zmienna mierzona na poziomie porządkowym ma tylko 2 kategorie, to nie jest możliwa sytuacja zakłócenia logiki kolejności kategorii, czyli pozbawienia zmiennej charakteru porządkowego. Możemy kategorie dochodu przedstawić jako wysoki/niski bądź niski/wysoki, innej możliwości nie ma, a obie formy zachowują charakter porządkowy.
Ponieważ możliwości dalszej analizy statystycznej są różne dla zmiennych mierzonych na poziomie nominalnym i dla zmiennych mierzonych na poziomie porządkowym czasami dokonuje się sztucznego założenia o traktowaniu nominalnych zmiennych dychotomicznych, tak jakby miały charakter porządkowy. Oba poziomy nominalny i porządkowy określane są jako poziomy słabe lub jakościowe, gdyż za ich pomocą możemy dokonać tylko rozróżnienia własności którymi charakteryzuje się jednostka analizy. Poziom porządkowy jest jednak trochę wyższym poziomem pomiaru niż poziom nominalny ze względu na moż
liwość określenia natężenia własności.
2.5. Poziom interwałowyi ilorazowy Jedynymi liczbami, z jakimi do tej pory mieliśmy do czynienia były liczby okr.eślaj~ce li.czebność ogólną oraz liczebności poszczególnych kategorii danej ~~~enn.eJ: Juz przy okazji przykładu o pomiarze wzrostu wspomniałam, że jesIl IstmeJe taka możliwość, to powinno się dokonywać pomiaru w sposób jak
najbardziej precyzyjny, np. w centymetrach. Wówczas liczby będą określały nie tylko liczebność kategorii ale również wartość, jaką może przyjąć zmienna (np. Jan Nowak 192 cm, zamiast najwyższy). Kolejnym poziomem pomiaru, pozwalającym nam na wprowadzenie wartości liczbowych, jest poziom interwałowy. Na tym poziomie każdej jednostce analizy przypisywana jest wartość liczbowa, a nie własność określonej zmiennej. Wróćmy do omawianej wcześniej czwórki studentów. Dopiszmy Imię
następne
i nazwisko
Jacek Stopa Zofia Tym Ewa Kowalska Jan Nowak
zmienne do ich rekordów.
Wiek
Rok urodzenia
najstarszy druga najstarsza trzecia najstarsza
1976 1979 1980 1982
najmłodszy
Możemy dokonać
porównania dokładności pomiaru za pomocą poziomu poi poziomu interwałowego. Na zmiennej interwałowej możemy wykonywać działania algebraiczne. Wiemy więc dokładnie, że Jacek nie tylko jest najstarszy ale jest starszy o 3 lata od Ewy, a różnica wieku pomiędzy osobą naj starszą i naj młodszą w tej grupie wynosi 6 lat. rządkowego
Na tym poziomie pomiaru określamy nie tylko kolejność ale i dystans pomiędzy poszczególnymi jednostkami. Pomiar w tym przypadku zbliżony jest do tego, co potocznie jesteśmy skłonni uważać za taką czynność. Uzupełnijmy dalej Imię
i nazwisko
Jacek Stopa Zofia Tym Ewa Kowalska Jan Nowak
rekordy naszych studentów: Wiek (w latach)
Wzrost (w cm)
24 21 20 18
176 157 178 192
Zmienne przedstawione powyżej są zmierzone na poziomie ilorazowym. Poziom ilorazowy są prawie identyczne. Na czym polega różnica między nimi, dlaczego rok urodzenia jest zmienną interwałową a wiek liczony w latach interwałowy i
zmienną ilorazową?
W skali interwałowej punkt zerowy jest przyjęty w sposób umowny, arbitralnie. To, że studenci mają wpisany rok urodzenia 1976, 1980 itp., wynika z przyjętej konwencji określania czasu (konkretnie z kalendarza gregoriańskiego, w którym
za rok zerowy przyjęto rok urodzenia Chrystusa). Gdyby studenci ci mieszkali w Izraelu lub Chinach, ich data urodzenia wyglądałaby zupełnie inaczej. Innymi przykładami zmiennych interwałowych mogą być wysokość geograficzna, gdzie punkt zerowy ustanowiony został na poziomie morza lub temperatura, mierzona w skali Celsjusza lub Fahrenheita. Poziom ilorazowy natomiast charakteryzuje się występowaniem absolutnego zera - oznacza to, że jeśli zmienna ilorazowa przybiera wartość zero jest to. równoznaczne z brakiem jej występowania. Liczba przeżytych lat, wys~kość mIerzona w centymetrach (lub w calach), temperatura mierzona w skali Kelvina to zmienne ilorazowe. ' Rozróżnienie na interwałowy i ilorazowy poziom pomiaru ma swoje istotne matematyczne konsekwencje, które dla badacza społecznego mogą pozostać nie w pełni rozpoznane.
Poziom interwałowy i ilorazowy będziemy określać jako silne lub ilościowe poziomy pomiaru i w dalszym ciągu naszych rozważań będziemy je traktować w sposób jednorodny. Dobrze jest mieć świadomość różnicy między nimi wie?ząc że wszystkie char~kterystyki i właściwości odnoszące się do zmie~nych mterwał.owych zachowują moc w przypadku zmiennych ilorazowych, oraz że :vszystkIe metody analizy statystycznej, które można zastosować do zmiennych mterwałowychsą tak samo dobre dla zmiennych ilorazowych ale nie odwrotnie. Dokładność pomiaru w~rasta wraz z przechodzeniem od poziomu nominalnego,
~rzez porządk?wy, do mterwałowego i ilorazowego. Na tych ostatnich każdej Jednostce analIzy przypisujemy wartość liczbową mierzonego zjawiska np.:
.. wiek (w latach), .. wykształcenie (w latach ukończonej edukacji), .. dochód (w odpowiedniej walucie) itp.
~l~ charaktery~t~ki,jedn?stek analizy nie będących osobami, używa się szerokIeJ gamy wskazmkow mIerzonych na poziomach silnych, np.: II stopa bezrobocia, .. współczynnik przyrostu naturalnego, .. dochód narodowy brutto na głowę mieszkańca, .. procent osób zatrudnionych w rolnictwie itp.
Używając danych ~ochodzących z sondaży, czy z istniejących spisów, często tworzymy nowe zmIenne o wartościach na poziomie interwałowym lub ilorazowym. 46
Procedura ta polega na tworzeniu indeksów pozwalających na poziomie silnym postawy np.: tolerancji religijnej, postawy wobec kary śmierci, aborcji, używania narkotyków itp. Konstrukcja takich indeksów zostanie opisana w dalszej części tego rozdziału. Trzeba pamiętać jednak o tym, że nie wszystkie proste indeksy sumaryczne prowadzą do podniesienia poziomu pomiaru. opisać
Przy tworzeniu zmiennych interwałowych lub ilorazowych w oparciu o zmienne mierzone na niższych poziomach pomiarów, szereg reguł matematycznych zostaje naruszonych. Pomimo to, postępowanie takie jest w naukach społecznych stosowane, gdyż w stosunku do zmiennych interwałowych zakres możliwej do zastosowania analizy statystycznej jest o wiele szerszy i bardziej wyrafinowany, niż dla zmiennych nominalnych, czy porządkowych. Dlatego też, jeśli w badaniach mamy zmienne ilorazowe np. dochód (mierzony w złotówkach) i dla klarowniejszej ilustracji przedstawiamy go jako zmienną porządkową (wysoki, średni, niski), to w dalszej analizie powinniśmy posługiwać się pierwotną "ilorazową" wersją tej zmiennej. Zmienne interwałowe i ilorazowe możemy prezentować indywidualnie dla każ dej jednostki analizy, tak jak to zostało zaprezentowane na przykładzie czwórki studentów. Najczęściej jednak dążymy do uporządkowania ich w szeregu statystycznym, tak jak czyniliśmy to w odniesieniu do zmiennych nominalnych i porządkowych. Różnica w przypadku zmiennych mierzonych na poziomach silnych będzie polegała na tym, że kategorie będą odzwierciedlaływartości liczbowe jakie może przybrać zmienna, a nie jej własności. Załóżmy, że uczniów 30-osobowej klasy licealnej ostatniego roku szkolnego przeczytali książek.
Oto odpowiedzi jakie
zapytaliśmy
o to, ile w
ciągu
uzyskaliśmy:
21, 14, 16, 17, 19,
12, 29, 28, 26, 22,
19, 20, 12, 14, 16,
19, 18, 21, 20, 20,
25, 20, 23, 15, 17,
11, 10, 18, 21, 20.
Jedyne, co z takiego ciągu liczb udałoby się nam wydobyć, to być może informacja, że największa liczba przeczytanych książek to 29 a najmniejsza to 10. Zmienną liczba przeczytanych w ciągu roku książek uporządkowaliśmy w szeregu statystycznym. Zaczęliśmy od wypisania wartości liczbowych, jakie ta zmienna może przyjąć w naszym badaniu (Xi) a następnie przyporządkowaliśmy im odpowiadające liczebności (ni).
47
Xi
ni
Każdy z utworzonych przez nas przedziałów wartości ma określoną dolną gra-
10 11
l l
nicę (tu: 10; 15; 20; 25) i górną granicę (tu odpowiednio: 14,9; 19,9; 24,9; 29,9).
12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
2 O 2 1 2 2 2 3 5 3 1 1 O 1 1 O 1 1
Różnica pomiędzy górną i dolną granicą przedziału nazywa się rozwartością przedziału lub jego rozpiętością. Aby taki szereg statystyczny, w którym kategorie tworzą przedziały wartości zachował charakter zmiennej interwałowej
(dotyczy to oczywiście również zmiennych ilorazowych, jako zmiennych mierzonych na poziomie silniejszym niż interwałowy - dlatego też w dalszym ciągu wywodów należy przyjąć, że uwagi do zmiennych interwałowych stosują się również do zmiennych ilorazowych) muszą być spełnione dwa kryteria. Po pierwsze rozwartość wszystkich przedziałów wartości musi być jednakowa. W powyższym przykładzie warunek ten jest spełniony, bowiem dla każdego przedziałuwartości różnica między górną i dolną granicą wynosi 4,9 (14,9-10 = = 4,9; 19,9 - 15 = 4,9 itd.). Gdybyśmy jednak uporządkowali naszą zmienną w następujący
N=30
1. 2. 3.
Xi
ni
10-14,9 15-24,9 25-29,9
6 20 4
sposób:
N= 30
Taki typ szeregu nazywamy szeregiem statystycznym, w którym każda war-
tość stanowi kategorię.
Innym sposobem uporządkowaniatej samej zmiennej może być utworzenie szeregu statystycznego, w którym kategorie stanowią przedziały wartości. Takie, uporządkowanie jest użyteczne zwłaszcza wtedy, gdy mamy dużą liczebność og~l~ą ~r~z występuje możliwość znacznego zróżnicowania przyjmowanych wartOSCI (me Jak w przykładzie od 10 do 29, ale powiedzmy dla dochodów od 350 zł do 25000 zł). Zmienna liczba przeczytanych w ciągu roku książek mogłaby po uporządkowaniu w przedziały wartości przybrać postać:
10-14,9 15-19,9 20-24,9 25-29,9
6 10 10 4 N= 30
to niezależnie od tego, iż wartości określone są liczbowo, poziom pomiaru w tym przypadku jest porządkowy. Kategorie zapisane jako przedziały różnej rozwartości można zastąpić opisem słownym: mało, przeciętnie, dużo. Drugim kryterium, jakie musi
spełniać szereg
statystyczny, w którym kategorie charakter zmiennej interwałowej jest domknięcie wszystkich przedziałów. Oznacza to, że dla każdego przedziału musi być określona dolna i górna granica tego przedziału. stanowią przedziały wartości,
Poniżej
przedstawiam
przykłady,
A 1. 2. 3. 4.
aby
zachować
które nie
spełniają
tego kryterium.
B Xi
ni
10-14,9 15-19,9 20-24,9 25 i więcej
6 10 10 4 N= 30
1. 2. 3. 4.
Xi
ni
14,9 i mniej 15-19,9 20-24,9 25-29,9
6 10 10 4 N=30
Niezależnie od tego, czy niedomknięty będzie naj niższy, .czy najwyższy przedział wartości, zmienna straci swój interwałowy charakter i będziemy musieli traktować ją jak zmienną porządkową.
Czasami świadomieobniżamy poziom pomiaru przy prezentacji danych, zwłasz cza jeśli w dalszej analizie statystycznej będziemy korzystać z danych pierwotnych.
Przypuśćmy, że zmienna liczba przeczytanych w ciągu roku książek zamiast wartości, które znalazły się w najwyższym przedziale (25, 26, 28 i 29) przyjmuje wartości 29, 36, 55 i 72. Szereg statystyczny spełniający oba powyższe kryteria musiałby wyglądać tak: Xi
ni
10-14,9 15-19,9 20-24,9 25-29,9 30-34,9 35-39,9 40-44,9 45-49,9 50-54,9 55-59,9 60-64,9 65-69,9 70-74,9
6 10 10 1 O
1 O O O
1 O O
1 N=30
Wówczas, dla większej przejrzystości prezentowanych danych, skorzystalibyśmy zapewne z możliwości pozostawienia najwyższego przedziału wartości otwartego, tak jak w przykładzie A.
Pozostała nam do omówienia jeszcze jedna istotna kwestia związana z tworzeni,em przedziałów wartości. Dolna i górna granica przedziału powinny być okreslone na tyle precyzyjnie, aby było możliwe przypisanie każdej jednostki analizy, która przybiera pewną wartość liczbową, do jednego z przedziałów. Zmienna liczba przeczytanych w ciągu roku książek przybiera wartości liczb całkowitych, dopuszczalny wobec tego byłby następujący zapis tego szeregu statystycznego:
Xi
ni
10-14 15-19 20-24 25-29
6 10 10 4 N=30
Gdyby dane liczbowe określały np. stopę bezrobocia w wybranych do badania 30 gminach, to moglibyśmy z powodzeniem założyć, że prezentowanie takiej zmiennej w postaci liczb całkowitych jest wynikiem zaokrąglenia danych, a więc poprzednia forma zapisu szeregu uwzględniającawielkości po przecinku byłaby tu stosowniejsza. Liczba miejsc po przecinku zależeć będzie od dokładności pomiaru cechy. Można też zastosować zapis określający granice przedziałów za pomocą nawiasów: Xi
ni
(10-15) (15-20) (20-25) (25-30)
6 10 10 4 N= 30
Nawias ostry (przy dolnej granicy przedziału) oznacza, że wartość ta jest zawarta w danym przedziale, natomiast nawias okrągły (przy górnych granicach przedziałów) oznacza, że wartość ta nie zawiera się w danym przedziale, ale zawierają się wszystkie wartości od niej mniejsze. Taki zapis szeregu statystycznego jest równoznaczny ze stosowanym poprzednio zapisem, określającym granice przedziałów z dokładnością do dziesiętnych. Niestety od czasu do czasu można znaleźć szereg statystyczny zapisany tak jak powyżej, ale bez nawiasów przy granicach przedziałów. Taki zapis jest mylący, ponieważ wówczas nie wiadomo dokładnie, do którego przedziału wartości zaliczyć np. 15. Należy unikać takiego nieprecyzyjnego zapisu.
2.6. Definicje operacyjne Załóżmy, że sformułowaliśmy kilka
hipotez badawczych. Każda z nich odnosi co najmniej do dwóch zmiennych, z których jedna jest zmienną zależną a druga zmienną niezależną. Analizując te zmienne powinniśmy być w stanie podać ich własności lub wartości liczbowe dla każdej jednostki analizy. Zatem, zanim zaczniemy gromadzić dane, musimy wiedzieć, co i jak chcemy mierzyć? Tworzymy więc definicje operacyjne.
się
W każdym kwestionariuszu badającym postawy czy preferencje indywidualnych respondentów możemy znaleźć pytanie o wiek osoby uczestniczącej w badaniach. Na ogół wystarcza nam odpowiedź z wpisaną liczbą ukończonych lat - zakładamy przy tym, że respondenci udzielają informacji zgodnej z prawdą· Jeśli nasze badania dotyczyłyby sprawności intelektualnej uczniów zapisanych do pierwszej klasy szkoły podstawowej, to mogłoby się okazać, że różnica kilku miesięcy lub czasem prawie roku w ich wieku jest dla wyników badań istotna. Wówczas wiek określalibyśmy w oparciu o dokładną datę urodzenia. W obu przypadkach dokonywalibyśmy innego operacyjnego zdefiniowania tej samej zmiennej.
Jeśli raz określimy, na jakich zasadach definiujemy daną zmienną, to nie powinno być później problemów z przypisaniem jednostce analizy własności lub wartości liczbowej tej cechy. W badaniach społecznych problem operacyjnego zdefiniowania zmiennych bywa czasem bardziej skomplikowany. Badając osoby możemy mieć do czynienia z konfliktem pomiędzy własnościami (kim jesteśmy według siebie?), postawami (co sądzimy, myślimy, czujemy?) i zachowaniami (jak postępujemy w rzeczywistości?).
Załóżmy, że prowadzimy badania nad postawami społecznymi w wymiarze liberalizmu czy konserwatyzmu społecznego. Jedno z pytań brzmi: Czy uważa się Pan(i) za osobę: 1.
liberalną?
2. 3.
umiarkowaną? konserwatywną?
Jako odpowiedź respondent zakreśla wariant 1.
Następnie zadajemy serię pytań, o których sądzimy, że pozwalają uchwycić istotę różnic między powyżej określonymi wymiarami. Pytania dotyczą takich kwestii, jak postawy wobec aborcji, kary śmierci, eutanazji, pornografii itp. Analiza odpowiedzi tego samego respondenta na szczegółowe pytania prowadzi
do wniosku, że jest to osoba konserwatywna.
Zakładając, że pytania szczegółowe prawidłowo odzwierciedlają podstawowe różnice pomiędzy postawą liberalną a konserwatywną, mamy do czynienia ~ konflik.tem pomiędzy własnością (samodeklaracja respondenta jako osoby lIberalneJ) a. pos~awą (ujawnionym w pytaniach szczegółowych konserwatyz~em). Projektując badania musimy sobie odpowiedzieć na pytanie, co bę dZIe dla nas bardziej istotnym i użytecznym wskaźnikiem wymiaru libera-
lizm/konserwatyzm: własności, czy postawy?
Podobny konflikt może mieć miejsce pomiędzy własnościami a zachowaniami. Weźmy respondenta, który w badaniach nad orientacjami politycznymi określa
siebie jako osobę o poglądach prawicowych. Ustalamy następnie, że we wszystkich dotychczasowych wyborach osoba ta głosowała na kandydatów partii lewicowych. Co zatem weźmiemy pod uwagę w naszych badaniach: własność (samoidentyfikacjępolityczną) czy zachowania wyborcze. Oba przykłady konfliktów są oczywiście sytuacjami skrajnymi, ale pokazują cymi realny problem. W rzeczywistej sytuacji badawczej często mamy do czynienia z brakiem spójności w prezentowanych przez respondentów poglądach, szczególnie gdy przedmiot naszych zainteresowań badawczych dla respondentów nie wydaje się być istotny. Musimy więc nauczyć się podejmować w takich warunkach decyzje dotyczące tego, czego w badaniach chcemy się dowiedzieć i co z tą informacją zamierzamy zrobić. Jeśli np. celem naszych badań jest prognoza wyborcza, to lepszą podstawą dla jej dokonania wydają się dotychczasowe zachowania wyborcze niż samoidentyfikacja polityczna (jeśli pozostają ze sobą w konflikcie). Trudności
w tworzeniu definicji operacyjnych niejednokrotnie poprzedzają problemy z precyzyjnym, konceptualnym określeniem zjawisk, których owe definicje mają dotyczyć. Weźmy termin demokracja. Demokracją nazywamy system polityczny, w którym władza wykonawcza i ustawodawcza wyłaniane są na drodze wolnych wyborów. Z tego punktu widzenia Niemcy Zachodnie były przed zjednoczeniem bardziej demokratyczne niż Niemcy Wschodnie. Zauważmy jednak, że Niemcy Wschodnie nazywały się Niemiecką Republiką Demokratyczną i w kategoriach ideologii marksistowskiej Niemcy Wschodnie były demokratyczne, gdyż reprezentanci robotników i chłopów poprzez partię komunistyczną sprawowali kontrolę nad rządem. Mamy więc dwa różne spojrzenia na termin demokracja i jakakolwiek operacjonalizacja tego pojęcia oparta na zachodniej koncepcji demokracji będzie się różniła od tej opartej na interpretacji marksistowskiej. niezgodność podstawowych pojęć konceptualnych występuje rzadko. Czę kontrowersje dotyczą tego, które z wymiarów pojęcia podstawowego są jego istotą i powinny być poddane operacjonalizacji. Spróbujmy dokonać operacjonalizacji takiego pojęcia jak wolność (rozumiana w kategoriach praw obywateIskich) .
Taka ściej
Jeśli pytamy, czy w danym kraju obywatele posiadają wolność, i jeśli tak, to w jakim stopniu, to pojęcie wolności możemy badać poprzez badanie posiadanych wolności i praw obywatelskich. Czym są prawa obywatelskie? Które z nich powinny być włączone do definicji operacyjnej?
Przyjmijmy na początek cztery podstawowe prawa obywatelskie: liII
II II li
wolność
wyznania i sumienia, wypowiadania się, wolność prasy,
Stwierdzenie: Aborcja powinna
Ii!ll
III iii
Po a~alizie dokumentów różnych organizacji międzynarodowych moglibyśmy do~ac do tego zestawu np. prawo mniejszości narodowych do używania swoje~o Języka l~b prawo o~y,,:ateli ~o ~inimalnego ekonomicznego standardu życia Itp. To, ktory z wymIarow pOJęcIa podstawowego uwzględnimy w naszej definicji operacyjnej zależy od naszej wiedzy, przyjęcia określonej perspektywy teoretycznej oraz celu badawczego.
:<.i~~y usta.limy, ~o.i dlaczego włączamy do definicji operacyjnej, musimy okreslrc ~a~ najbardzIej precyzyjnie, co przez poszczególne wymiary będziemy rozumIec. Czy wolność wyznania i sumienia oznacza, że w danym kraju nie istnieje oficjalna, pa~stwo,:,~ re:i~ia, czy też jeśli taka istnieje (Wielka Brytania) ale obywa:e.l.e mają mozlrwosc wyboru innego wyznania i uczestniczenia w praktykach rel.I~IJnych, to wolność ;vyznania i sumienia jest zachowana? Nawet najbardZIeJ de.mokraty.czne ~anstwa regulują zakres wolności. Nie wszystkie związki ",:yznamowe ~,aJą takie same prawa, a niektóre rytuały czy praktyki są zabromone. Wolno~c d~ wypowiadania się nie obejmuje prawa do okrzyku "pali się!" zatłocz~neJ salr koncertowej, gdy takie zagrożenie nie istnieje. Wolność prasy J~st ogramczana przez ustawyantypornograficzne. Zorganizowanie zgromadzema wym~g~ zgo.d~ :vład~ lokalnych. Nasza definicja operacyjna powinna więc uwzględmac mozlrwIe naJ dokładniej rzeczywiste wymiary wolności.
:r
Ostatn~ą kwestią przy tworzeniu definicji operacyjnych, jaką musimy brać pod uwagę J:st fakt: na ile jesteśmy w stanie zebrać informacje odzwierciedlające wszystkIe wyr~l1ary tej definicji dla każdej jednostki analizy. Czy istnieje dostę~na ~a~ WIedza do w~lności zg::omad~eń w interesujących nas krajach? Byc moze Jedynym zrodłem mformacJI będZIe dla nas opinia ekspertów.
:0,
legalna.
Odpowiedzi:
wolność
wolność zgromadzeń.
być
III
łlI
zdecydowanie zgadzam się zgadzam się trudno powiedzieć nie zgadzam się zdecydowanie się nie zgadzam
Możemy
uzyskane odpowiedzi zakodować jako (1) zdecydowanie się zgadzam, (2) zgadzam się, aż do (5) zdecydowanie się nie zgadzam, tworząc porządkową skalę opozycji wobec legalizacji aborcji. Odwracając kolejność kategorii: (5) zdecydowanie się zgadzam do (1) zdecydowanie się nie zgadzam, tworzymy porządkową skalę poparcia legalizacji aborcji. Powyższe
pytanie może służyć jako pojedyncza miara postawy wobec aborcji zjawisko to jest bardziej złożone i jeśli staje się przedmiotem badania, do jego analizy używa się wielowymiarowych wskaźników) lub może być traktowane jako jeden z wymiarów zmiennej złożonej, mierzącej społeczny konserwatyzm. W szerszym sensie postawa konserwatywna przejawia się w niechęci do zmian, w kategoriach społecznych wiąże się ona z określonymi poglądami na pewne kwestie społeczne. Zamiast zatem pytać respondenta, czy uważa się za konserwatystę (proszę przypomnieć sobie konflikt własności i postaw), zadajemy mu szereg pytań o kwestie społeczne, które są dla nas wyznacznikiem postawy konserwatywnej. Te kwestie szczegółowe muszą być bardzo uważnie dobrane, aby były znaczące dla obecnego społecznego i politycznego kontekstu. Kilkadziesiąt lat temu, prawdopodobnie większość osób o postawie konserwatywnej byłaby przeciwna szkołom koedukacyjnym, dziś zapewne większość konserwatystów uznaje to za stan normalny. (choć
Przypuśćmy, że pięć kwestii uznaliśmy za stanowiące dobrą podstawę do rozróż nienia we współczesnej Polsce społecznej postawy konserwatywnej od liberalnej. Respondent powinien udzielić odpowiedzi w skali Likerta (od "zdecydowanie zgadzam się" do "zdecydowanie nie zgadzam się") na każde z następujących stwierdzeń:
2.7. Tworzenie indeksów W prz!padku zn:iennych
określających postawy, definicje operacyjne tworzy się
n~. ogoł w.oparcIU o odpowiedzi respondentów na szereg pytań, ilustrujących rozne .:VY~Iar~~a~anych postaw. Przypomnijmy, że badając np. postawę wobec
aborcjI naJczęscIeJ robimy to w oparciu o skalę Likerta.
1. 2. 3. 4. 5.
Aborcja powinna być zakazana. "Wartości rodzinne" powinny być nauczane w szkołach. Kara śmierci powinna być przywrócona. Pornografia powinna być zakazana. Narkomani powinni być poddawani przymusowemu leczeniu.
Ze względu na formę słowną przedstawionych stwierdzeń możemy się spodziewać, że osoba o postawie bardzo konserwatywnej odpowie na wszystkie pytania zdecydowanie zgadzam się", natomiast osoba o bardzo liberalnej (najmniej konserwatywnej) postawie z większością stwierdzeń "zdecydowanie się nie zgodzi". Jeśli każdej kategorii odpowiedzi przypiszemy określoną liczbę punktów, to suma punktów dla wszystkich stwierdzeń da nam indeks społecznego konserwatyzmu. Załóżmy następującą punktację odpowiedzi: III III III III lIlI
zdecydowanie zgadzam się - 20 punktów, zgadzam się - 15 punktów, trudno powiedzieć - 10 punktów, nie zgadzam się - 5 punktów, zdecydowanie nie zgadzam się -
W naszym przykładzie mogłoby to wyglądać następująco (należ! pa:niętać, że zapisana tu punktacja odpowiedzi służy celom dydak~ycz~ym l w zadnym wypadku nie należy jej umieszczać w prawdziwym kwestlOnanuszu): Polecenie: Proszę dla każdego stwierdzenia zakreślić odpowiedź, która jes~ najbliższa Pańskim poglądom w danej kwestii. W nawiasie podano punktaCję odpowiedzi. 1. Aborcja powinna być legalna. III zdecydowanie zgadzam się (O) III zgadzam się (5) !li trudno powiedzieć (10) III nie zgadzam się (15) III zdecydowanie się nie zgadzam (20)
Wartości rodzinne" powinny być nauczane w szkole.
O punktów. 2.
Jeżeli
respondent udzielił najbardziej konserwatywnych odpowiedzi ("zdecydowanie zgadzam się") na wszystkie pięć pytań, to wartość jego indeksu wynosi 100 (5·20 = 100). Dla osoby skrajnie liberalnej wartość indeksu powinna wynosić O (5· O = O), dla osoby niezdecydowanej - 50 (5·10 = 50). Wartości tak utworzonego indeksu społecznego konserwatyzmu są traktowane jak interwałowy poziom pomiaru. Niewątpliwie narusza to szereg matematycznych założeń, odnoszących się do poziomu interwałowego. Nie mamy bowiem żadnych podstaw aby różnice pomiędzy odpowiedziami na poziomie porządko wym (skali Likerta) oceniać np. na 5 punktów. Jest to nasza arbitralna decyzja, nie dająca się w rzeczywistości zweryfikować. Jest to jednak dość powszechnie stosowana praktyka w naukach społecznych, gdyż manipulacja taka pozwala na dalsze prowadzenie analizy statystycznej na wyższym poziomie. Warto przy tym zaznaczyć, że zwykle w badaniach indeks tworzy więcej niż pięć stwierdzeń (tak jak w naszym przykładzie), oraz że im więcej jest stwierdzeń badających jednostkowe opinie, tym indeks złożony jest bliższy interwałowemu poziomowi pomiaru (zakładając, że wartość indeksu zawiera się w przedziale od O do 100, im więcej wskaźników na ten indeks się składa, tym większa jest "ciągłość" wszystkich wartości indeksu). Zaczęliśmy konstrukcję
indeksu społecznego konserwatyzmu od takiego sformułowania pojedynczych stwierdzeń, że osoba o najbardziej konserwatywnej postawie na wszystkie pytania powinna odpowiedzieć "zdecydowanie zgadzam się". W praktyce prowadzenia badań staramy się unikać takiej konstrukcji kwestionariusza pytań aby uniemożliwić respondentom rutynowe odpowiadanie na postawione pytania.
zdecydowanie zgadzam
"11
się (20)
zgadzam się (15) trudno powiedzieć (10) nie zgadzam się (5) zdecydowanie się nie zgadzam (O)
l1li
lIIl 1'1 l1li
3. Zniesienie kary śmierci powinno być utrzymane. III iii III
III liII
zdecydowanie zgadzam się (O) zgadzam się (5) trudno powiedzieć (10) nie zgadzam się (15) zdecydowanie się nie zgadzam (20)
4. Pornografia powinna być zakazana. III zdecydowanie zgadzam się (20) l1li zgadzam się (15) III trudno powiedzieć (10) III nie zgadzam się (5) l1li zdecydowanie się nie zgadzam (O) 5. Narkomani powinni być przymusowo leczeni. zdecydowanie zgadzam się (20) zgadzam się (15) III trudno powiedzieć (10) III nie zgadzam się (5) III zdecydowanie się nie zgadzam (O)
I!II
l1li
Osoba o bardzo konserwatywnych poglądach odpowie "zdecydowanie zgadzam się" na pytania 2, 4 i 5 (w sumie 60 punktów) oraz "zdecydowanie się nie zgadzam" na pytania l i 3 (w sumie 40). Jej indeks społecznego konserwatyzmu w dalszym ciągu będzie wynosił 100 punktów.
2.8.
Trafność
W momencie, w którym mamy gotowe narzędzie badawcze zwykle wykonujemy badania pilotażowe. Badania te służą określeniu trafności i rzetelności zoperacjonalizowanych zmiennych. O trafności stanowi stopień zgodności pomiędzy ideą, koncepcją, którą zamierzaliśmy zmierzyć, a tym, co mierzą w rzeczywistości poszczególne zmienne i indeksy. Czy konkretna zmienna mierzy interesujące nas zjawisko w takim wymiarze, jak zakłada to nasza hipoteza? Czy operacjonalizacjajest zgodna z ogólnie przyjętą definicją badanego zjawiska? Gdybyśmy np. przyjęli, że dochód uzyskiwany z pracy będzie dla nas miarą ubóstwa, tzn. im ktoś uzyskuje mniejszy dochód z pracy, tym jest bardziej biedny, to w większości przypadków byłaby to miara trafna. Jednak według tego kryterium biedny byłby również milioner, który nie podejmuje pracy (nie ma więc dochodu) i żyje z odziedziczonego majątku. Prowadząc badania w społeczności, w której taki przypadek jest możliwy, nie moglibyśmy przyjąć wysokości dochodów uzyskiwanych z pracy za trafną miarę ubóstwa. Jest szereg strategii pozwalających nam określić trafność zmiennych. Jedna z nich opiera się na subiektywnym poczuciu badacza (osoby studiującej daną problematykę) logicznego związku pomiędzy zjawiskiem w kategoriach konceptualnych i jego operacjonalizacją - jest to trafność fasadowa. Moim zdaniem indeks społecznego konserwatyzmu jest trafny. Każde pytanie szczegółowe pozwala dokonać istotnego rozróżnienia między osobą bardziej lub mniej konserwatywną· Jeśli przedstawię ten indeks innym badaczom zajmującym się tą problematyką i uzyskam ich akceptację, mogę uznać skonstruowaną miarę za trafną. Jeśli zaś do któregoś stwierdzenia mieliby oni zastrzeżenia, muszę się jeszcze raz zastanowić, czy odpowiedzi będą naprawdę różnicować ludzi pod względem stopnia konserwatyzmu. Kolejną strategią oceny trafności jest sprawdzenie, na ile definicja operacyjna odzwierciedla ogólnie przyjęte znaczenie badanego pojęcia - jest to trafność teoretyczna. W takim wypadku możemy też skorzystać z oceny ekspertów. Załóżmy, że uznali oni iż 5 zaprezentowanych stwierdzeń ilustruje różnice w postawach, ale wielu z nich niezależnie od siebie wskazało na brak pytania o polityczną rolę Kościoła. Według ich opinii, mój indeks społecznego konserwatyzmu nie
jest w pełni trafny. Uznając ich rację m~s~ałabym uzup~łnić zestaw .st~ierdzeń np. o stwierdzenie: "Polityczna rola KosclOła w Polsce Jest zbyt duza. Jeszcze innym sposobem oceny trafności jest ocena zdolności prog~~sty~znych miary - jest to trafność empiryczna. Przypuśćmy, że skonstruowahsmy I~deks oceny zdolności menedżerskich, za pomocą którego badaliś.my kan.d~datow na menedżerów. Po pewnym czasie przeprowadziliśmy badama ocemaJące ~racę tych osób na stanowiskach menedżerskich. Jeśli istnieje zależność p.omlędzy wartością indeksu zdolności menedżerskich a oceną pracy na stanowIsku menedżera, taka że im większa wartość indeksu tym lepsza ocena pracy, to nasza miara jest trafna. Trafność można także oceniać poprzez zmienne teoretyc~nie po~iąz~ne z naszą
miarą - jest to również trafność empiryczna. Wyobrazmy ~obIe, ze utworzt liśmy indeks ogólnej satysfakcji życiowej: Prz!' t.ym sposobIe ~ceny trafnoscl szukamy charakterystyk związanych z ogolną ZYClOWą satysf~cJą. ~akładamy, że osoba zadowolona z życia będzie mniej skłonna do naduz~wama alkoholu i stosowania przemocy w rodzinie. Jeśli zależność między t~ml charak~eryst~ karni a ogólną satysfakcją życiową faktycznie. istn.ieje, to będ:l~.ona empIryczme weryfikowalna. Istotność tego związku będzle mIarą trafnoscl mdeksu. Dwa ostatnie sposoby oceny trafności mogą być mierzone za pomocą korelacji.
2.9.
Rzetelność
Miara jest rzetelna, jeżeli jest wolna od błędów pomiar~, tzn. jest. ,wewnętrz nie spójna i stabilna. Wewnętrzną spójność indeksu mozemy ocemc w ~r~sty sposób. Jeżeli indeks opiera się np. na 20 pytaniach szczegółowych, to d~l~hmy go losowo na dwa indeksy po 10 pytań. Następnie sprawdz~my wartoscl obu połowicznych indeksów dla każdej z osób - jeśli są one tak.le same, to całko~ wity (oparty na 20 pytaniach) indeks jest rzetelny w wymIarze wewnętrzneJ spójności.
Stabilność dotyczy spójności poglądów responde.ntów w ~zasie ..AbY j~ określić,
należałoby badania powtórzyć po pewnym czaSIe, n~ teJ sarr:eJ grupIe r~spon~
dentów. Jeśli wyniki dla każdej osoby pozostaną takle same, md~ks będzl~ rze teIny w wymiarze stabilności; jeśli wyniki będą się różniły - mIara stracI rzetelność. Może to oznaczać np., że poszczególne pytania były tak sformułowane, iż dopuszczały pewną dowolność interpretacji i za każdym razem res~onde~t odpowiadał w pewnym sensie na inne pytania. Nim jednak zadecyduJe~y, ze indeks jest nierzetelny, musimy sprawdzić, czy mi~dzy pierwszym a,drugIm badaniem nie nastąpiły jakieś wydarzenia (np. pubhczna debata wokoł problemu
będącego tematem jednego ze stwierdzeń, bądź pojawienie się inicjatywy ustawodawczej dotyczącej jednej z poruszanych kwestii), które mogły mieć wpływ
na postawy respondentów. Takim wydarzeniem w przypadku indeksu społecz nego konserwatyzmu mógłby być proces w sprawie, lub sam fakt popełnienia szczególnie okrutnego morderstwa. Dobra miara powinna być zarazem trafna i rzetelna. Jest to trudne do osią gnięcia, biorąc pod uwagę fakt, że pojęcia będące przedmiotem zainteresowania nauk społecznych są trudno definiowalne, a więc łatwo podatne na błędy pomiaru oraz inne łudzkie błędy. Dodatkowo istnieje pewne napięcie między trafnością a rzetelnością. W dążeniu do zwiększenia trafności skłonni jesteśmy zakres pojęć poszerzać, natomiast dla zwiększenia rzetelności powinniśmy postępować odwrotnie. Rozwiązaniem jest jak zwykle znalezienie złotego środka.
Ćwiczenia Ćwiczenie 2.1.
Dla każdej z poniższych zmiennych określ poziom jej pomiaru: 1. Dochód na osobę w rodzinie:
Rozumienie istoty definicji operacyjnych oraz umiejętność operacjonalizacji poteoretycznych jest jednym z najtrudniejszych problemów przy projektowaniu i prowadzeniu badań społecznych. Błędy popełnione na tym etapie mają daleko idące konsekwencje, mogą prowadzić do zakwestionowania rezultatów przeprowadzonych badań. Zagadnienia te w znacznie szerszym zakresie są przedmiotem rozważań metodologii badań społecznych oraz metod i technik badawczych dla nich odpowiednich, dlatego też w podręcznikach z tego zakresu należy szukać bardziej szczegółowej wiedzy na ich temat. Statystyka pozwala na wykrycie błędów popełnionych na wcześniejszych etapach badawczych, lub - jeśli pozostaną one nieodkryte - pada ich ofiarą.
250 (250-500) (500-750) (750-1000)
III
l!i
zł
III 1000 i powyżej 2. Stopa bezrobocia w powiatach w roku 1999:
(0-5) (5-10) (10-15) (15-20) III (20-25) III (25-30)
II
lIIl
II!IIIIlIII
jęć
poniżej
III
zagwarantować wszystkim obywatelom minimalny do-
3. Państwo powinno chód: 1II zdecydowanie zgadzam się zgadzam się III trudno powiedzieć fil nie zgadzam się III zdecydowanie nie zgadzam się 4. Kolor oczu: lIll niebieskie III szare III zielone lIlI piwne 5.
Wykształcenie: III III
podstawowe zawodowe
Ił średnie III
niepełne wyższe
III wyższe
6.
Wykształcenie: III III II!
humanistyczne ekonomiczne techniczne
7.
Religijność:
3.
.. głęboko wierzący .. wierzący .. wierzący ale nie praktykujący I!II nie wierzący
III
.. .. .. ..
8. Wiek: II! 18 i mniej lat .. (19-25) .. (25-40) .. (40-65) III 65 i powyżej
4.
9. Pora roku: II wiosna III lato .. jesień II zima
III w związku małżeńskim .. w separacji .. rozwiedziony .. wdowiec
Najwięksi
producenci zboża w 1994 r.: .. Chiny - 1 .. Stany Zjednoczone - 2 !III Indie 3 III Rosja 4 III Francja 5
Ćwiczenie 2.3.
Dokonaj operacjonalizacji poniższych pojęć i zapisz je tak, w kwestionariuszu ankiety:
Ćwiczenie 2.2.
2. Uczniowie klasy Ub według wyników za I semestr: l1li 1. Kołecka pierwsza III A. Nowacka druga l1li J. Środa trzeci .. G. Wilga - czwarta
rzeki: Nil - 6695 km Amazonka - 6516 km Jangcy - 6380 km Missisipi z Missouri - 6019 km Ob z Irtyszem - 5570 km
5. Miejsce zamieszkania: III A. Firlej miasto powyżej 500 tys. mieszkańców .. L. Nocoń - miasto od 50 do 100 tys. mieszkańców III P. Kulej -- wieś .. N. Piątek - miasto do 50 tys. mieszkańców III F. Jarocki miasto od 100 do 250 tys. mieszkańców
10. Stan cywilny: III wolny
Dla poniższych zmiennych określ poziom pomiaru oraz 1. Dochód: II W. Kowalski 950 zł .. E. Nowak - 516 zł III K. Kwiatkowski 800 zł III A. Wolna '- 1250 zł
Najdłuższe
jednostkę analizy:
jakbyś zamieścił je
1. Wiek 2. Wykształcenie 3. Religia 4. Sympatie polityczne
5. 6. 7. 8. 9. 10.
Postawa wobec ochrony środowiska Postawa wobec mniejszości narodowych Postawa wobec reformy służby zdrowia Postawa wobec prywatyzacji przedsiębiorstw państwowych Ocena działalności rządu Postawa wobec reklamowania alkoholu
Ćwiczenie 2.4.
Utwórz indeks dla następującychpojęć: 1. Polityczna tolerancja
2. Prawa mniejszości seksualnych 3. Wolność prasy 4. Wyuczona bezradność 5. Wolność wyznania i sumienia
Co
może zrobić
za nas komputer
Przekształcaniezmiennych
W PGSS wiek respondentów jest zmienną ilorazową, której wartość jest mierzona w latach. Jej rozkład częstości przedstawiony w szeregu statystycznym, gdzie każda wartość stanowi odrębną kategorię zająłby kilka stron (proszę spróbować to zobaczyć na ekranie komputera). Możemy przekształcić ten szereg w taki, w którym kategorie stanowią przedziały wartości (rys. 2.1). WIEK RESPONDENTA: 8 KATEGORII
Częstość Ważne
Procent Procent
ważnych
Procent skumulowany
<15-25)
265
11,6
11,6
11,6
<25-35)
325
14,2
14,2
25,9 46,2
<35-45)
464
20,3
20,3
<45-55)
447
19,6
19,6
65,8
<55-65)
321
14,1
14,1
79,8 92,9
<65-75)
298
13,1
13,1
<75-85)
130
5,7
5,7
98,6
<85-95)
32
1,4
1,4
100,0
Ogółem
2282
100,0
100,0
Rysunek 2.1.
Tak przekształconazmienna jest nadal mierzona na poziomie ilorazowym. Moglibyśmy jednak inaczej określić granice przedziałów wartości (rys. 2.2). WIEK RESPONDENTA: 3 KATEGORIE
Częstość Ważne
mniej
niż
30
<30-55) 55 i więcej Ogółem
Procent Procent
ważnych
Procent skumulowany
437
19,1
19,1
19,1
1064
46,6
46,6
65,8 100,0
781
34,2
34,2
2282
100,0
100,0
Rysunek 2.2.
Teraz, pomimo tego, iż wiek nadal jest wyrażany w wartościach liczbowych (latach) zmienna jest mierzona na poziomie porządkowym. Przedziały wartości są niedomknięte i mają różną rozwartość. Opisy liczbowe kategorii tej zmiennej możemy zastąpić opisami słownymi. Będą one trochę mniej precyzyjne ale istota zmiennej wyrażonej za pomocą trzech kategorii pozostanie taka sama (rys. 2.3).
WIEK RESPONDENTA: OPIS SŁOWNY NAUKA: zbyt często ufamy nauce... IEN4a Ważne
osoby młode osoby w średnim wieku osoby starsze Ogółem
Procent
Częstość
Procent
ważnych
Procent skumulowany
437
19,1
19,1
19,1
1064
46,6
46,6
65,8
781
34,2
34,2
100,0
2282
100,0
100,0
Ważne
Rysunek 2.3.
zdecydowanie zgadzam się
ważnych
59
5,1
5,2
5,2
430
37,5
37,6
42,7
ani się zgadzam ani nie zgadzam
354
30,9
30,9
73,7
nie zgadzam się
152
13,3
13,3
87,0
11
1,0
1,0
87,9 100,0
zdecydowanie nie zgadzam się Ogółem
Braki danych
Procent
zgadzam się
TRUDNO POWIEDZIEĆ
W analizach statystycznych najlepiej jest używać zmiennej wiek respondenta jako zmiennej ilorazowej. Jednak w celach prezentacji lub w określonych celach analitycznych mamy możliwość dokonywania przekształceń tej zmiennej, np. tak jak zostało to zaprezentowane powyżej.
Procent skumulowany
Procent Częstość
138
12,0
12,1
1144
99,7
100,0
BRAK DANYCH
Ogółem
Rysunek 2.4.
3
,3
1147
100,0
Rozkład CZęStOŚCI odpowiedzI na pytanie
1.
NAUKA: więcej złego niż dobrego... IEN4b
Konstruowanie indeksu Procent Częstość
W PGSS znajduje się kilka pytań badających stosunek respondentów do nauki. Ich konstrukcja jest oparta na skali Likerta. Cztery z nich posłużą nam jako zmienne wskaźnikowe do budowy indeksu sceptycyzmu naukowego. Opisują stosunek respondentów do następujących stwierdzeń: 1. Zbyt często ufamy nauce, a zbyt rzadko uczuciom i wierze. 2. Ogólnie biorąc, współczesna nauka przynosi więcej złego niż dobrego. 3. Należy się spodziewać, że każda ingerencja człowieka w przyrodę _ nawet oparta na badaniach naukowych - przyniesie pogorszenie stanu rzeczy. Współczesna nauka rozwiąże problemy ochrony środowiska naturalnego bez 4. uszczerbku dla naszego życia.
Rozkład częstości odpowiedzi na wiony na rysunkach 2.4-2.7.
~_-
zdecydowanie zgadzam się zgadzam
się
19
1,7
1,7
1,7
130
11,3
11,4
13,0
235
20,5
20,5
33,5
nie zgadzam się
596
52,0
52,1
85,6
zdecydowanie nie zgadzam się
82
7,1
7,2
92,8
TRUDNO POWiEDZIEĆ
83
7,2
7,2
100,0
1145
99,8
100,0
2
,2
1147
100,0
Ogółem
Braki danych
Procent skumulowany
ani się zgadzam ani nie zgadzam
BRAK DANYCH
Ogółem
Rysunek 2.5.
Rozkład częStOŚCI
odpOWiedzI na pytanie 2.
NAUKA: pogarsza stan przyrody ... IEN4c
każde wskaźnikowe twierdzenie jest przedsta-
Procent Częstość Ważne
zdecydowanie zgadzam się
Przy konstruowaniu indeksu będziemy brać pod uwagę tylko odpowiedzi merytoryczne, tzn. indeks będziemy konstruować dla osób, które mają wyrobione zdanie w kwestiach, o które pytamy.
zgadzam
Osoby sceptyczne wobec nauki będą zdecydowanie zgadzać się ze stwierdzeniami l, 2 i 3 oraz zdecydowanie nie zgadzać się ze stwierdzeniem 4.
TRUDNO POWIEDZIEĆ
Aby indeks miał wartość najniższą dla osób najbardziej sceptycznych wobec nauki, a wartość najwyższą dla najmniej sceptycznych, musimy odwrócić porządek odpowiedzi na stwierdzenie 4.
l,
Ważne
ważnych
Procent
ani
się
się
zgadzam ani nie zgadzam
nie zgadzam
się
zdecydowanie nie zgadzam Ogółem
Braki danych
BRAK DANYCH
Ogółem
Rysunek 2.6.
się
Procent
ważnych
Procent skumulowany
73
6,4
6,4
6,4
370
32,3
32,3
38,7
233
20,3
20,3
59,0
312
27,2
27,2
86,3
35
3,1
3,1
89,3
122
10,6
10,7
100,0
1145
99,8
100,0
2
,2
1147
100,0
Rozkład częStOSCI odpowiedzI na pytame
3.
Wówczas wartość najniższa indeksu wynosiłaby 4 (suma odpowiedzi nr l na każde stwierdzenie) a naj wyższa - 20 (suma odpowiedzi nr 5 na każde stwierdzenie).
INDEKS SCEPTYCYZMU NAUKOWEGO Procent Częstość Ważne
NAUKA: rozwiąże problemy ochrony środowiska... IEN4d
Ważne
zdecydowanie zgadzam się zgadzam się ani się zgadzam ani nie zgadzam nie zgadzam się zdecydowanie nie zgadzam się TRUDNO POWIEDZIEĆ Ogótem
Braki danych
BRAK DANYCH
Ogółem
Częstość
Procent Procent
ważnych
Procent skumulowany
33
2.9
2,9
2,9
272
23,7
23,8
26,7 55,2
326
28,4
28,5
328
28,6
28,7
28
2,4
2,4
86,3
157
13,7
13,7
100,0
1144
99,7
100,0
2
,2
,2
,2
6,00
5
,6
,6
,8
7,00
8
,9
,9
1,7
8,00
30
3,3
3,3
5,0
55
6,1
6,1
11,1
10,00
123
13,7
13,7
24,8
11,00
134
14,9
14,9
39,7
12,00
187
20,8
20,8
60,4 73,1
13,00
114
12,7
12,7
14,00
138
15,3
15,3
88,4
15,00
63
7,0
7,0
95,4
3
,3
16,00
20
2,2
2,2
97,7
100,0
17,00
13
1,4
1,4
99,1
18,00
6
,7
,7
99,8
19,00
2
,2
,2
100,0
900
100,0
100,0
Ogółem
Zmienną współczesna nauka rozwiąże problemy środowiska naturalnego bez uszczerbku dla naszego życia trzeba rekodować w następujący sposób: I!l
Illl
Rysunek 2.8.
zdecydowanie zgadzam się (5); zgadzam się (4); ani się zgadzam, ani nie zgadzam (3); nie zgadzam się (2); zdecydowanie nie zgadzam się (l).
INDEKS SCEPTYCYZMU NAUKOWEGO: 5 KATEGORII Procent Częstość Ważne
Najniższą wartość indeksu (5) uzyskało dwóch respondentów. Wartość najwyż szą (19) uzyskała taka sama liczba osób. Nowo utworzoną zmienną możemy różnie wykorzystywać analitycznie, np. możemy ją przekształcać (czego przykłady znajdują się poniżej). Program SPSS pozwala nam zbadać rzetelność
tego indeksu za pomocą metody alfa Crombacha.
Najpierw kategoryzacja indeksu została zmieniona takiej zmiennej zamieszczony jest na rysunku 2.9):
III III III
l1li
Ite_....
według schematu (rozkład
(4-7) - bardzo negatywny stosunek do nauki; (8-10) - negatywny stosunek do nauki; (11-13) - ani pozytywny, ani negatywny stosunek do nauki; (14-16) - pozytywny stosunek do nauki; (17-20) -- bardzo pozytywny stosunek do nauki.
-..........~-
bardzo negatywny stosunek do nauki negatywny stosunek do nauki
Teraz można utworzyć indeks jako sumę czterech wskaźników; jego rozkład częstości przedstawiony jest na rysunku 2.8.
llII
Procent skumulowany
1147
Rysunek 2.7. Rozkład częstości odpowiedzi na pytanie 4.
III
ważnych
5,00
g,OO
83,8
Procent
Procent
ważnych
Procent skumulowany
15
1,7
1,7
1,7
208
23,1
23,1
24,8
ani pozytywny, ani negatywny stosunek do nauki
435
48,3
48,3
73,1
pozytywny stosunek do nauki
221
24,6
24,6
97,7 100,0
bardzo pozytywny stosunek do nauki Ogółem
21
2,3
2,3
900
100,0
100,0
Rysunek 2.9.
Na koniec kategoryzację indeksu zmieniono według PO~~lzszego schematu ze na ciągle niewielką liczebność skrajnych kategorn (rys. 2.10):
względu
III II1II
mniej niż 11 - negatywny stosunek do nauki; (11-13) - ani pozytywny, ani negatywny stosunek do nauki; 14 i więcej -- pozytywny stosunek do nauki.
' h h'potez operacYJ'nych W zależności od celu ana l·lZy l. post aWlOnyc l korzystać z każdej postaci skonstruowanego indeksu.
możemy
INDEKS SCEPTYCYZMU NAUKOWEGO; 3 KATEGORIE
Ważne
Częstość
negatywny stosunek do nauki ani pozytywny, ani negatywny stosunek do nauki pozytywny stosunek do nauki Ogółem
Procent Procent
ważnych
Procent
skumulowany
223
24,8
24,8
24,8
435
48,3
48,3
73,1 100,0
242
26,9
26,9
900
100,0
100,0
Rysunek 2.10.
Pro~e~ury u~yskiwania za pomocą programu SPSS zaprezentowanych w że' wymkow moznaznaleźć w książce Jarosława Górniaka i Janusza Wachnickieg ; SPS~ PL for Wzndows - pzerwsze kroki w analizie danych (część I rozdz 5 6 Krakow, SPSS Polska 2000). ' '"
Literatura 1. Blalock M. H: Statystyka dla socjologów. Warszawa, PWN 1977. 2.
Brzeziński J.: Metodologia badań psychologicznych. Wyd. 3. Warszawa, PWN
1999.
3. Malikowski M ·' Niezgoda M . (oprac.: ) B ad ' , ama empzryczne w sociologii T I T yczyn, W SS-G 1997. "J '" 4. Mayntz R., Holm K., Hlibner P.: W d prawa zenie do metod socjologii empiryczne')'. Warszawa, PWN 1985. 5.
~::~~,r~~~c~~_i:= ;O~l.Nachmias
Pojęcia podstawowe
miary tendencji centralnej miary dyspersji III średnia arytmetyczna iII mediana III liczebność skumulowana III dominanta III wielobok liczebności III histogram iii zmienna skokowa .. zmienna ciągła III jedno-, dwu-, trój modalny
iii
III
Illl
III III III III
III rozstęp
6. Nowak S.: Metodologia badań społecznych. Warszawa, PWN 1985. 7. Sułek A.: Sondaż polski. Warszawa, IFiS PAN 2001.
II
symetryczny
odchylenie
III
wartość bezwzględna
III
rozkład częstości
średnie
III
III
III skośność
D.: Metody badawcze w naukach spolecznych.
asymetria prawostronna asymetria lewostronna kwartyle decyle percentyle
wariancja odchylenie standardowe
III współczynnik zmienności III
statystyka opisowa
rozkład częstości
Zanim przejdziemy do porównań między zmiennymi oraz do poszukiwania związku między nimi, zajmiemy się miarami, charakterystykami jednej zmiennej. Przystępując do analizy statystycznej, zebrane dane porządkujemy w szeregi statystyczne, które pozwalają nam ocenić rozkład wartości, jaki przyjmuje każda ze zmiennych.
Aby ocena ta była czymś więcej niż tylko opowiadaniem na temat szeregu statystycznego, używamy do tego celu szeregu specyficznych miar, za pomocą których nasz opis staje się precyzyjny i wyrażony fachowym językiem. Pierwszą kwestią jaką staramy się ustalić, jest to, czy da się w sposób syntetyczny opisać rozkład danej zmiennej? Poszukujemy zatem tego, co charakterystyczne, typowe, właściwe dla badanego rozkładu zmiennej.
Miary, które pozwalają nam opisać szereg statystyczny z tej właśnie perspektywy nazywają się miarami tendencji centralnej.
Grupa A
Grupa B
9 9 9 8 8 8 7 7 7
8 8 7 7 6 5 5 5 5 4 4
Analizując zmienne opisujące jednostki analizy (przedmiot naszego zainteresowania badawczego) jesteśmy zainteresowani nie tylko ustaleniem tego co typowe dla danej zmiennej (czyli tego, co pozwalają nam ocenić miary tendencji centralnej), ale także ustaleniem wewnętrznej różnorodności rozkładu każdej zmiennej.
Interesować nas będzie zatem położenie poszczególnych pomiarów względem siebie oraz ich położenie w stosunku do miar tendencji centralnej. Miarami, które pozwalają nam to określić są miary dyspersji, nazywane również miarami rozproszenia lub miarami zmienności.
3.1. Średnia arytmetyczna
Suma: 72
Przypuśćmy, że przedmiotem naszego zainteresowania badawczego będzie fakt, jak studenci socjologii oceniają trafność wyboru swojego kierunku studiów. Badania będziemy prowadzić w jednej z grup ćwiczeniowych, co oznacza, że jednostkami analizy będą wszyscy studenci zapisani do tej grupy - 21 osób.
Każdą z tych osób poprosimy o to, aby trafność wyboru swego kierunku studiów oceniła w skali od O ("zupełnie nie o to mi chodziło" - całkowicie nietrafiony)
do 10 ("dokładnie o to mi chodziło" -- w 100% trafiony).
Zakładamy, że im lepsze ktoś osiąga wyniki w studiowaniu, tym bardziej jest skłonny uznać swój wybór za trafny. Wobec tego, im
wyższa średnia ze studiów danej osoby, tym wyższe powinno
być jej wskazanie na skali trafności wyboru kierunku studiów. W celu weryfikacji postawionej hipotezy podzielmy grupy:
badaną grupę na dwie pod-
illI
grupę A, do której zaliczymy osoby uzyskujące średnią ze studiów 4,0 i wyżej
l!Il
grupę B, do której zaliczymy studentów o średniej poniżej 4,0 (12 osób).
(9 osób w naszym przykładzie);
Wskazania dla obu grup na skali
4
4
trafności wyglądają następująco:
Suma: 68
P stym porównaniem różnic w skali trafności będzie dodanie do si~bie ,:"szystro wartości zaznaczonych na skal'l dl a kaz.d' kich ej z g r up i podzieleme ,, . tej sumy . , r bę osób w grupie. Dla grupy A tak obliczona wartosc będ:le w~noslprzez ICZ: 9 = 8), a dla grupy B - 5,7. (68 .. 12 _ , 56(6)) . Zatem sredma dla ła 8 (72 grupy A jest wyższa niż średnia w grupIe B. Średnia, którą właśnie obliczyliśmy nazywa się średnią arytmetyczną i jest jedną
z miar tendencji centralnej.
W matematyce znane są jeszcze inne średnie: geometryczna, h.annoniczna, k:adratowa, my będziemy używać tylko śred~iej ~rytmetyczneJ, dlatego czasem będziemy stosować jej skróconą nazwę - sredma. Jeżeli zmienną tmfno.~ć
wyboru kierunku studiów ozn~czymy jako x; to warwszystkich jednostkowych wskazań na skali będz~emy ?znaczac Xi; Jes~ to równoznaczne z przypisaniem każdej osoby (jednostkI anah.zy) ~o okreslo~eJ kategorii wartości - takiej, którą osoba ta zakreśliła w odpowle~z~. P~szcz:gol nych wartości Xi dla każdej z grup będzi: tyle, ile ?adan!'ch w mej OSO~:IC;ą~ średnią dodawaliśmy wszystkie wskazama w danej gruple.--: sumowah~ . y u~. stępujące wartości. Dla oznaczenia sumy w matematyce .uzYJemy greck18,] d N J litery sigma I;, liczbę jednostek analizy w dany~ badamu oznaczymy przez , a średnią arytmetyczną oznaczymy symbolem X.
tości
Definicyjny wzór na średnią arytmetyczną przedstawia pomiarów przez ich liczbę:
wartości
-
X =
:L Xi ----y;:r =
Xl
+ X2 + ... + X n N
.
się
jako iloraz sumy
W popr~ednim rozdziale został zaprezentowany sposób porządkowania dan ch w ~zeregI statystyczne. N~ ogół przystępując do liczenia miar tendencji cent;alnej, dane mamy w postacI uporządkowanej. Zapiszmy więc w te' t' d ] pos aCI ane dl a grupy A : Grupa A
7 8
3 3
9
3 N=9
W
taki~ przypad~u dodaw~nie wart~ści w kolumnie Xi
nie tylko jest nieprawi-
dłowe, jest zabromone! MusImy przecież uwzględnić każdą wartośc' x. t l '1e ws k ' na to l'Iczebność w kolumnie azuje
l
ni.
2
Y e razy,
Jak widać, używając wzoru operacyjnego dla szeregu statystycznego, w którym każda wartość stanowi odrębną kategorię analizowanej zmiennej, uzyskaliśmy taką samą wartość średniej arytmetycznej, jak ta policzona ze wzoru definicyjnego. Użycie takiego szeregu statystycznego jest możliwe przy założeniu, że wartości zmiennej są wartościami liczb całkowitych. Wobec tego z interpretacją średniej dla grupy B mamy kłopot, gdyż nie jest ona liczbą całkowitą. Możemy wybrnąć z tej sytuacji na dwa sposoby. Po pierwsze, do interpretacji możemy średnią zaokrąglić do całości, zwłaszcza w przypadku, gdy zmienna na pewno nie może przybrać wartości innych niż liczby całkowite - np. liczba osób w gospodarstwie domowym. Po drugie, naszą skalę możemy potraktować jako skalę ciągłą od O do 10, a występujące wartości, jako pewne miejsca symboliczne na tej skali, pamiętając, że równie dobrze respondent mógł zaznaczyć miejsce 6,8 lub 7,5 na tej skali. W zależności od charakteru zmiennej dobierzemy stosowną interpretację jej średniej.
Aby to, ~robić, mnożymy każdą wartość zmiennej przez odpowiadającą jej liczebnosc, tworząc d~d~tkową k~lum~ę, którą oznaczamy Xini. Następnie liczym~ ~umę t~ch ~yrazen.~ Xini l dopIero tę sumę dzielimy przez ogólną liczeb~osc Uzywa]ąc takiej formuły powinniśmy otrzymać identyczną wartość sredmej arytmetycznej jak za pomocą wzoru definicyjnego.
)~dzIale został
przedstawiony sposób na porządkowa danych w szeregach statystycznych, gdzie kategorie y wartości. Dla tak uporządkowanych danych rówoperacyjne na liczenie miar, opierają się one jednak nych założeniach, które sprawiają, że tak obliczona lnych miar jest tylko szacunkowa. Stosowanie techch (dla większych zbiorów danych) lub kalkulatora ozwala korzystać z danych rzeczywistych (pochodzą kh pomiarów), dla których prezentowane tu techniki arczające, dlatego wzory odnoszące się do szeregów k+.,An.rf'h kategorie stanowią przedziały wartości zostakO]tlc(mt,ru.jerny się na rozumieniu istoty poszczególnych
!1.'
Sprawdźmy to na przykładzie obu podgrup studenckich. Grupa A Xi
ni
xini
7 8 9
3 3 3
2l 24 27
N=9
LXini
= 72
Grupa B Xi
ni
xini
4 5 6 7 8
3 4 1 2 2
12 20 6 14 16
N= 12
LXini
Średnia arytmetyczna jest najczęściej używanąmiarą tendencji centralnej. Moż na też powiedzieć, że jest matematycznie najbardziej "wyrafinowana". Z algebraicznego punktu widzenia średnia arytmetyczna jest miarą spełniającą następującą własność:
= 68
która mOWI, że suma rozmc pomiędzy pomiarami a średnią równa się zero. Oznacza to, że jeśli od każdego pojedynczego pomiaru odejmiemy wartość śred niej a następnie dodamy wszystkie tak obliczone różnice, to powinniśmy otrzymać zero. Przywołajmy jeszcze raz przykład dla grupy A.
Grupa A
Xi
X
Xi-X
7 7 7 8 8 8
8 8 8 8 8 8 8 8 8
-l -l -l
liczeniu mediany jest pomylenie pozycji mediany na to rozróżnienie zwrócić szczególną uwagę.
O O O
r;;eintereSującej nas zmiennej, porządkujemy jej wartOŚCI od naJmdnłleJszeJ t o
g g g
LXi
= 72
największej. Następnie wyznaczamy pozycJę . me d'lany (poz . M) we
+1 +1 +1
pującej formuły:
N
Jeżeli własność ta nie jest spełniona, to istnieje duże prawdopodobieństwo,że popełniliśmy błąd w liczeniu średniej arytmetycznej. Inną istotną własnością średniej jest fakt, że suma kwadratów odchyleń pomiędzy pomiarami a średnią jest mniejsza od sumy kwadratów odchyleńpomiędzy pomiarami, a jakąkolwiek inną liczbą· Własność ta zostanie wykorzystana przy konstrukcji miar dyspersji. Do własności średniej i warunków jej stosowalności wrócimy jeszcze w tym
...l slm l'l trafnOSCI " wy boru kierunku studiów. do studentów socjologu dA l . g osób jakie te osoby, W grupIe takiego kujemy od ne J \ w tego szeregu wania), następme poszu uJemy oso y, W·' ,
locm~
ł z~a a~ ~ Sl~
naJI~meJszeJkd~
(wyznaczamy
przykładach i w podsumowaniu.
pozycję
Wartość na
należy do
miar pozycyjnych i aby jej
II III II
uporządkowanie danych,
wyznaczenie pozycji mediany, obliczenie wartości mediany.
~tóra znalazła się środku
porzą uporządko
+ l -_ = N-2-
g + l = 10
2
2
= 5.
. .t a °8s0 'ba szeregu ijest wartoW w skali trafności, jaką ~aznaczył a 'p lą kolumnie zaznaczyd' Dl y A medIana wynOSI WIęC . SClą me lany. a g~up, , .' A edług wartości zaznaczonych liśmy kolejnoś~ ~omla~ow .( o~ob). w gr ~p~e do 'i~ntYfikacji osób użyliśmy cyfr; na skali trafnoscl (zamlast ImIon l nazwls ł ... wartość w odpowiedzi i tak: cyfra l oznacza °ds~,bę, któr~r:a~nacz~s~~~aJ~~z;;:zaznaczyła najwyższą o trafność wyboru stu 10W, a cy , ' .
taką wartość).
Licząc średnią nie musieliśmy porządkować pomiarów rosnąco lub malejąco. Czyniliśmy tak dla przystępniejszej ilustracji rozkładu tych wartości w badanej grupie. Aby policzyć, a właściwie wyznaczyć medianę, wartości muszą być
Xi
l
2 3 4
pozycję prawi-
dłowo wyznaczyć, trzeba rozpocząć od uporządkowaniawartości np. w kolejności rosnącej. Obliczenie mediany składa się z następujących po sobie trzech etapów:
Wartości zaznaczyły a'~iksze' (dokonaliśmyjuż
mediany):
poz. M
Kolejną miarą tendencji centralnej jest mediana. Mediana jest wartością środkowego pomiaru - oznacza to, że połowa pomiarów ma wartości mniejsze niż mediana i połowa pomiarów ma wartości większe od niej. Inaczej mówiąc, mediana jest wartością, jaką przyjmuje zmienna dla takiej jednostki analizy, która znajduje się w środku szeregu statystycznego. Medianę oznaczamy dużą literą M.
Mediana
ę-
Na końcu sprawdzamy, jaką wartość zmiennej ma pomiar na wyznaczonej przez nas pozycji.
3.2. Mediana
uporządkowane.
ug nas
+l
poz.M= - 2 - '
L(xi-X)=O
rozdziale w prezentowanych
. . me d'lany luo k po l(ro k u'. Po dokonaniu śledźmy procedurę lIczema . . .pomia. d
P
poz. M
5 6 7 8 g
7 7 7 8 8 8 g g g
M
Wyznaczyliśmy pozycję mediany według wzoru, ustalając, że będzie to osoba
piąta i =5, a następnie sprawdziliśmy, jaką wartość na skali trafności zaznaczyła
ta osoba, było to 8 -
i to jest szukana mediana.
Grupa A Xi
ni
7 8 9
3 3 3
Przechodząc do podgrupy B, napotykamy na pewne komplikacje przy liczeniu mediany. W grupie tej znalazło się 12 osób. Pozycję mediany wyznaczamy, tak jak poprzednio, ze wzoru:
N=9
N +1 12 + 1 13 poz. M c= - 2 - = - 2 - = "2 = 6,5.
W grupie B nie mamy osoby 6,5 (nie mamy jednego środkowego pomiaru). Mamy więc kłopot. Jeśli liczba elementów w grupie jest parzysta, czego konsekwencją jest fakt, że pozycja mediany nie jest liczbą całkowitą, wartość mediany obliczamy jako średnią arytmetyczną dwóch środkowych pomiarów. W naszym przykładzie będzie to średnia z wartości wskazanych przez osoby 6 i 7. Xi
poz. M
= 6,5
1 2 3 4 5 6 7 8 9 10
11 12
_ N +1 = 9+1 poz. M 2' 2
= 10 = 5. 2
ak 'ednak w powyższym szeregu statystycznym odn~leźć 5. ~ ~olejności wskazan OSCl . Aby J ,Jwar t" to obliczamy hczebnosc
osobę
było możliwie
skumulowaną.
Liczebność skumulowana mówi nam o tym, ile jednostek ana~iz.y{rzy~mu~:
4 4 4 5 5
wartość zmiennej równą i mniejszą od wskazanej przez nas wartoscl. tę
oznaczamy
Mamy
dużą literą
lcze nosc
F.
więc:
5 M
5
=
(5
+ 5) /2 = 5
Xi
ni
F
733
6
7 7 8 8
Dla obu podgrup wyznaczyliśmy poznane miary tendencji centralnej. Dla grupy A średnia arytmetyczna i mediana są sobie równe i wynoszą 8, natomiast w grupie B średnia arytmetyczna wynosi 5,7 a mediana 5. Dotychczasowe rozważania na temat obliczenia, czy też wyznaczenia mediany prowadziliśmy na danych uporządkowanych, ale tylko w takim sensie, że wszystkie empirycznie otrzymane wartości zmiennej zapisywaliśmy w kolejności rosnącej. Wiemy jednak, iż uporządkowanie danych oznacza w statystyce utworzenie szeregu statystycznego, który również spełnia kryterium rosnącego
następstwa wartości.
Wróćmy zatem do naszego przykładu.
,I
W wyznaczaniu pozycji mediany nic nie uległo zmianie. W dalszym ciągu dla grupy A jest ona następująca:
. .ze wart~sc " 7 l. mme . J' (wiemy' że W kolumnie F zawarta jest informacJa, . _nikt w tej grupie nie zaznaczył mniej) na skali trafnoścI zaznaczyły trzy osoby (z - 1, i=2,i=3). Nast Za
n
wartością skali zaznaczoną przez członk~w b~daneł grupy było 8.
i:~'e~ t wartość we właściwej kolumnie, wpisujemy Ile osob z~z~aczyło,t~ wa~toś~ i ~ l;czebność kategorii dodajemy do poprzedniej wielkoścI hczebnoscl
skumulowanej. Xi
ni
F
733 8 3 6
Teraz z kolumny F wynika, że sześć osób zaznaczyło na skali 8 i mniej (i i = 2, i = 3, i = 4, i = 5, i = 6). Ostatnią wartością, o jaką uzupełniamy szereg, jest 9.
=
1,
Xi
ni
F
733 8 3 6 9 3 9
Z takiego zapisu wynika, że osoby i wartość 8.
= 4, i =
5 oraz i
=
6, zaznaczyły na skali
Ponieważ pozycja mediany jest przypisana do osoby i = 5, która zaznaczyła wartość 8 na interesującej nas skali, zatem mediana dla tej grupy wynosi 8, czyli tyle samo ile wyznaczyliśmy na podstawie listy pomiarów wartości ułożonej
w
porządku rosnącym.
Popatrzmy jak to wygląda dla grupy B: Xi
ni
F
4 5
3 4
3 7
Rozpoczynamy od utworzenia szeregu statystycznego, do które~o d~pisuje~~ kolumny wyrażeń niezbędnych do wyznaczenia poszukiwa~yc~ mIar \h~~ebnosc kumulowaną dla wyznaczenia mediany oraz iloczyny kazdeJ wartoscl l odpojej dla obliczenia
:iadającej
ni
F
O
5 10 30 10 5 5 10 20 40 20 10
5 15 45 55 60 65 75 95 135 155 165
1 2 3 4 5 6 7 9 10
2:= ni = N Obliczamy
Wiemy, że pozycja mediany nie ulega zmianie i w tym przypadku wynosi 6,5; szukamy zatem osób i = 6 oraz i = 7; obie te osoby wskazały wartość 5 na skali, podobnie jak osoby i = 4 oraz i = 5; średnia arytmetyczna z wartości dwóch środkowych pomiarów wynosi 5; mediana wynosi 5; tak jak przy rozpisaniu na jednostkowe pomiary.
średniej).
Xi
8
618 7 2 10 8 2 12
liczebności
=
Xini
O 10
60 30 20 25 60 140 320 180 100
2:= Xini
165
-
średnią arytmetyczną:
- _ 2:= x i n i =
X Obliczamy
945
pozycję
N
945 = 5 (72). 165 '
mediany:
N + l _ 165 + l = 166 = 83. poz. M = ~2- 2 2
Życie badacza niesie nam jednak większe wyzwania niż te zaprezentowane w po-
wyższych przykładach. Spróbujmy więc choć częściowo się do tego przygotować.
Wartość jaką na skali trafności zaznaczyła 83 osoba bę~zie warto~:iilm:dia~y:
Wartość'6lub mniej zaznaczyło na skali 75 osób, natomIast wart~sc Załóżmy, że w naszym badaniu dotyczącym oceny trafności wyboru socjologii jako kierunku studiów nie ograniczamy się do uczestników jednych zajęć, ale badania prowadzimy wśród wszystkich studentó:w studiów dziennych naszego Instytutu. Liczebność ogólna badanej grupy znacznie wzrasta do
165. Interesująca nas zmienna trafność wyboru studiów pozostaje tak samo zoperacjonalizowana, w postaci skali od O do 10. Tym razem pomiary występują na całej rozciągłości skali. Naszym zadaniem jest obliczenie i zinterpretowanie średniej arytmetycznej i mediany. N
=
zaznaczyło
na skali 95 osób. Wszystkie osoby od 76 do 95, a zaznaczyły 7 na skali trafności. Zatem
WIęC
,u .m.n~e~ rowmez
M=7. '" mozemy pOWIe . d Zl'eć " Interpretując uzyskane wymkl
że studenci . .socjologii . t f są " raczej zadowoleni z wybranego kierunku studiów. Sredmo ocel~laJ~ .r)a nosl~ tego wyboru na prawie 6 (w skali od O - naj niżej do 10 - najwyzej, czy ~ średnia trafność znajduje się na pozyt~,:nej części skali oc~n. ~o~w~ba~:t~~h studentów wskazuje wartość 7 lub mmeJ, a połowa 7 lub WIęceJ. yc os możemy określić jako zadowolonych ze swego wyboru.
3.3. Dominanta
a)
Trzecią miarą tendencji centralnej jest dominanta, nazywana też wartością modalną· Dominanta jest wartością najliczniejszej kategorii zmiennej.
b)
c 45
"o 'Ul Ol N
:J
c 45 '0
•
o 40 c .o 35
'Ul
o 40 c
•
30
.g
35
:::;<>
30
N
25
25
•
20
'1aJrtOIŚCJlą zmiennej, jaką wskazuje największa liczba nie liczbą tych jednostek. Aby można było ją wyznaczyć, musimy zmienną uporządkować w szereg statystyczny, czyli wypisać wartości, jakie przyjmuje badana zmienna i odpowiadające im liczebności. Następnie sprawdzamy, która z tych liczebności jest największa. Odpowiadająca jej wartość jest poszukiwaną dominantą. O ile dla danego szeregu statystycznego mamy jedną średnią i jedną medianę, to dominant możemy mieć kilka (jedną, dwie lub więcej). Warunkiem jednak prawidłowego określenia rozkładu liczebności w badanej grupie (a więc również występującej(ych) dominanty) jest stosunkowo duża liczebność ogólna.
Graficznej prezentacji rozkładu danej zmiennej dokonujemy na podstawie szeregu statystycznego w układzie współrzędnych, gdzie na osi poziomej zaznaczamy wartości, jakie zmienna może przyjąć (Xi), a na osi pionowej liczebności poszczególnych kategorii (ni)' Zaczniemy od zaznaczenia dla każdej wartości zmiennej odpowiadającej jej liczebności. W miejscu tym postawimy kropkę. Powinniśmy mieć tyle kropek, ile mamy kategorii wartości. Wynik takiego postępowania prezentuje rysunek 3.1a.
Jeżeli następnie połączymy te kropki odcinkami prostymi, to całość przybierze
postać krzywej łamanej, zwanej
wielobokiem
graficznej prezentacji danych (rysunek 3.1 b).
liczebności. Jest to jedna z form
20
15
•
10
o
Dominantę oznaczamy dużą literą D.
W zaprezentowanym w poprzednim podrozdziale przykładziemieliśmy do czynienia z rozkładem dwumodalnym. Najliczniejsza była kategoria osób, które na skali zakreśliły wartość 8 (Xi = 8, ni = 40), a więc dominanta dla tego szeregu wynosiła 8 (Dl = 8). Nie jest to jednak jedyna bardzo liczna kategoria w tym szeregu. Trochę mniej, ale wciąż dużo osób zakreśliło wartość dwa (Xi = 2, ni = 30). Jest to druga, lokalna dominanta dla tego szeregu (D = 2). Ta 2 pierwsza była dominantą globalną. Rozkład zmiennej wyboru trafności kierunku studiów jest wśród studentów socjologii rozkładem dwumodalnym. Fakt ten staje się dużo lepiej widoczny gdy przedstawimy rozkład zmiennej w sposób graficzny.
•
15
• • •
o
•
10
9
o
10
Wartości
o
x
C)
9
10
Wartości
x
d)
c 45 'c:;
c 45 'c:;
'~ 40
'~ 40
.o 35 Ol
.o 35 Ol
c
c
N
N
<> :::; 30
:::;<>
30
25
25
20
20
15
15
10
10
O
O O
9
10
Wartości
x
O
9
10
Wartości
x
Rysunek 3.1. Przykłady graficznej ~rezen,tacji danych: a) wykres punktowy; b) wielobok liczebnoścI; c) histogram; d) krzywa ciągła
Inną formą graficznej prezentacji danych jest histogra.m. W histogramie yczebności poszczególnych kategorii wartości są przedsta~lane za pomocą pol figu~ płaskich. Najczęściej spotykanym histogramem, ~a~leszczanym popularnyc _ blikatorach jest histogram kołowy (liczebnosclOm poszczegolnych katego
v: ~i~ zmiennej odpowiadają proporcjonalne do nich wycinki ko~a). W opracowa-
niach ekonomicznych stosuje się histogramy prostokątne, u~lle~zczane ~ ukł~ dzie współrzędnych - takie histogramy najczęś~iej ~:osuJe SIę w ~~cJolo~~. (W pakietach komputerowych stosowanych W. sO~Jologll do prezent~cJI grafi nej zmiennych jakościowych najczęściej stosuJe SIę ~y~r.esy kołowe I słupkowe, a histogramy prostokątne w przypadku zmiennych IIOSClOWych.) W prezentowanym przykładzie zmienna trafno~ci wyboru kie~unku studió~ przyjmuje tylko określone wartości z zastosowanej prz~z nas. skalI, dlate~o naJ_ lepiej odpowiadającą tej sytuacji "figurą płaską" będzIe odcm~k. Kr~pkl Zt ~y. kresu punktowego połączymy teraz odcinkami prostopadłymI do OSI war OSCI
(rys. 3.1c) i w ten sposób powstanie histogram dla analizowanego przez nas przy interpretacji średniej, ze Jest to skala cIągła, to wowczas zamiast odcinków byłyby prostokąty _ taki też histogram "zrobiłby" program SPSS.)
~r~ykładu. (Gd~byśmy prz~jęli takie założenie jak
Zmienną, .która przybiera wyłącznie wartości ze zbioru liczb całkowitych nazy-
wamy zmle~ną skokową (taka jest analizowana w naszym przykładzie zmienna), natomIast zmie.nną, kt?ra przybiera wartości ze zbioru liczb rzeczywistych nazywamy zm',enną ciągłą. Zmienne ciągłe porządkujemy w szeregach ~tatystycznych, ktorych kategorie stanowią przedziały wartości. Rysując histogr~m dla t.aklego szeregu stosujemy prostokąty (zamiast odcinków) oparte o taki .prz~dzl~l .wartoŚci na osi Xi, jaki występuje w szeregu i o wysokości odpowIadającej hczebności ni danej kategorii. Jeśli zmienna ma charakter cią gły, to ~o~kład.jej wartości w szeregu statystycznym przedstawiamy za pomocą krzywej cIągłeJ.
:v
,tV ~~dani.ach s?ołecznych przy~muje się czasem trochę naciągane założenie cią głOSCI. zmIenneJ, .?~arte .n~ takim rozumowaniu, jakie zostało zaprezentowane
prz~ mterpre,tacJI. sredllleJ. To "naciąganie" bywa uzasadnione, jako przykład mo~na podac zm~enną wiek, która na ogół podawana jest w latach, a więc w
hcz~ach c~łkowltych (liczba ukończonych przez respondenta lat w momencie
~adallla). ~l€my ?rzecie~, ż.e respondent oprócz skończonej liczby lat przeżył
Jeszcze ~lcreslo~ą hc~bę ~leslęcy, dni, godzin, minut i sekund do naszego z nim spotkallla., a WIęC WI~k Jest zmienną ciągłą, którą symbolicznie wyrażamy za pomocą h:z~ całl~owltych. Rozkład takiej zmiennej przedstawiamy za pomocą krz~weJ. cIągłeJ, a precyzyjnie mówiąc do danego rozkładu dopasowujemy OdpOWlCd~1 model funkcji ciągłej. Dla naszego przykładu krzywa taka została pr.zedstawlOna.~arysunku 3.1d. Zaznaczmy teraz na takim wykresie obliczone miary tendencjl centralnej (rys. 3.2). .~
45
r------
_
'~ 40
W analizowanym przykładzie mamy dwie dominanty, wobec tego ten typ rozkładu nazywa się rozkładem dwumodalnym (bimodalnym).
Gdyby w szeregu statystycznym występowała jedna dominanta, to byłby to rozkładjednomodalny,gdyby dominanty były trzy, rozkład byłby trójmodalny (trimodalny) itd. Zatem przez modalność będziemy rozumieć liczbę dominant występujących w danym rozkładzie częstości.
3.4.
Skośność
Skośność, to taka charakterystyka rozkładu częstości, która odnosi się do kształtu krzywej będącej obrazem tego rozkładu oraz do wzajemnego położenia
miar tendencji centralnej. Jeżeli przez krzywą ciągłą możemy poprowadzić prostą prostopadłą do osi wartości Xi, względem której ta krzywa będzie symetryczna, to będzie to rozkład symetryczny. Jeśli będzie to dodatkowo rozkład jednomodalny, to prosta ta będzie wyznaczała wartość średniej arytmetycznej, mediany i dominanty tego rozkładu -
tak jak na rysunku 3.3. n
Rysunek 3.3. Rozkład symetryczny:
X
= M = D, Ms = O
"
~ 35
E
Wszystkie odstępstwa od idealnego typu rozkładu przedstawionego powyżej bę dą wyrazem asymetryczności.W kategoriach modelowych przesunięciat~ ~o~ą nastąpić w jedną bądź drugą stronę od linii symetrii. Zobaczmy, co dZIeJe SIę z krzywą i miarami tendencji centralnej, gdy odchylenie to następuje w ki:runku malejących wartości Xi - jest to rozkład asymetryczny prawostronme (asymetria dodatnia). Sytuacja taka została przedstawiona na rysunku 3.4.
30
25
20 15 10
10 Wartości x
Rysunek 3.2. Miary tendencji centralnej
Dominanta znajduje się w punkcie o największej liczebności, czyli tam gdzie jest maksimum krzywej. Na osi wartości dominanta przyjmuje wartość najmniejszą z miar tendencji centralnej.
n
pewną prawidłowość. Mediana zawsze występuje w środku szeregu i między pozostałymi miarami. Asymetria rozkładu ma najmniejszy wpływ na jej poło
M
D
Rysunek 3.4.
X
żenie, znacznie natomiast wpływa na położenie dominanty i średniej arytmetycznej. Dlatego też do określenia asymetrii rozkładu stosuje się osobną miarę, zwaną miernikiem skośności. Oznaczamy go jako Ms i obliczamy na podstawie następującego wzoru:
x
Rozkład asymetryczny prawostronnie: D
< M < X, Ms > O
Ms=X-D.
Mediana znajduje się w połowie zakresu w "" . . dk arto~cI, Jaki obejmuje krzywa - wynika to z jej definicii W t J • ym przypa u medIana przy'm . t " . od dominanty Na wielkość' d . . J Uje war osc wIększą . sre mej arytmetyczneJ' któr r . o wszystkie wartości J'akie prz" I' ' a ICZona Jest w oparciu ' Y J m u J e ana IZowana zmienna w b d ' . wp ł yw mają wartości skra'ne w . a aneJ grupIe, odchyla się w kierunku tY~h w Ytst~~uJWące w szeregu, w taki sposób, że średnia ar OSCl. tym przypadk t ' . k . ~tęp~ją po prawej stronie szeregu statystycznego i t u k~ar oSkCI s raJne Y Jest srednia. w ym Ierun u przesumęta
:v
~~:~ar::~Z~j~: teraz, jak o?~hylenie ~rzy~ej od osi symetrii w kierunku wartuację tak: ~rze;~;w~:~~~~e~s~~~~t I ułozenie miar tendencji centralnej. Sy-
Wartość, jaką przyjmuje miernik skośności w zależności od typu rozkładu, została zaznaczona przy rysunkach ilustrujących te rozkłady (zero dla rozkładu symetrycznego, wartości większe od zera dla rozkładu asymetrycznego prawostronnie, wartości mniejsze od zera dla rozkładu asymetrycznego lewostronnie).
Miernik skośności określa nam tylko symetrię, bądź asymetrię oraz kierunek tej ostatniej. Wielkość asymetrii określamy na podstawie współczynnikaskośności W s, który na ogół (choć w przypadkach skrajnej asymetrii nie musi to mieć miejsca) zawiera się w przedziale (-1, 1). Im wartość współczynnika skośności jest bliższa zera, tym asymetria jest mniejsza, a im jego wartość oddala się od zera, niezależnie od kierunku (ujemnego czy dodatniego), tym asymetria jest większa. Współczynnik ten
n
obliczamy na podstawie wzoru: X-D
W s =---, s gdzie s oznacza odchylenie standardowe w dalszej części tego rozdziału. X Rysunek 3.5.
M
D
x
Rozkład asymetryczny lewostronnie:
D > M >
X,
Ms < O
Dominanta znajduje się w miejscu w któ k . biera wartość największ ze wsz' . ry~ rzywa posIada maksimum i przyznajduje się w środku z~kresu ~~~~~~~ t~n?en~ji central~e~. Mediana sza od dominanty. Średnia ar tmet cz ,J. I o eJmuJ: krzywa I Jest mniejekstremalnych w tym przypad~ :r: d ~a Jest przesumęta w stronę wartości tystycznego. J~st to rozkład u znaj uJących się po lewej stronie szeregu sta'. asymetryczny lewostronnie (asymetria ujemna). Przyglądając SIę uważnie wzajemnemu ł" . wszystkich przedstawionych po " ~zenlU mIar tendencji centralnej we wyzeJ sy uacJach modelowych, możemy dostrzec
r:::::
to
miarę dyspersji, którą zajmiemy się
Współczynnik skośności jest miarą względną i służy do porównań asymetrii rozkładów tej samej zmiennej mierzonej w różnych grupach badawczych lub też
do
porównań rozkładów różnych
skos:noi"Ć
zmiennych.
obliczana jest
według
innej
formuły.
Miernik i współczynnik skośności są bardzo użyteczne przy precyzyjnym określaniu asymetrii kiedy rozkład częstości jest jednomodalny. W przypadku wielomodalności badanie skośności jest bardziej skomplikowane. Aby to zilustrować, na rysunku 3.6 zostały przedstawione idealne modele rozkładów dwumodalnych.
a)
b)
c)
n
n
Kolejnym podziałem jest po.d ~la ' . czy,li percentyle. Z jego uży. ł na st O. CZęSCl,
teczności będziemy jeszcze meJednokrotme korzystac.
Rozstęp
3.6. DXMD
x
rozkładów
x
D
MXD
x
Rysunek 3.6. Idealne modele dwumodalnych: a) asymetria lewostronna; b) symetria; c) asymetria prawostronna
oparciu o tę dominantę, która pozostaje w pokazanej na rozkładzie jednomodalnym zależności w stosunku do mediany i średniej arytmetycznej (X > M > D lub X < M < D). Trzeba pamiętać jednak o tym, że rzeczywistość badawcza rzadko przystaje do takich modeli.
W takich przypadkach
skośność określamy w
Jedne. z zajęć ze statystyki zostały poświęcone bu~U\:ani~ indel~csów i zostały rzeprowadzone w następującej formie. Grupa podzlehła s~ę na tl.zy zespoły osób. swojego moderatora. Zadamem kazdego a rupy było zbudowanie indeksu konserwatyzmu społecznego. Moderatorzy _ iwa Zosia i Adam -- mieli do dyspozycji go utworzony przez ek sper to'w . W trakcie l ' ' mleh tak prowadzlc . h ł h aby na jej podstawie każda osoba była zdo na utworzyc w SWOlC zespo ac , k . k' d moderator miał indeks konserwatyzmu społecznego. Na omec az y . ' " 'kali od O brak do 10 zgodnosc), ocemc, w s . d k 'k ertów zgodność indeksów członków danej grupy z lD e sem e sp .
~
i,0
Każdy zespół wybrał
człon i~d,eks.k~nserwatyzmu.~połeczn:-
zaJęc
włas~:
(całkowity
zgodności)
dyskUSję
(całkOWIta
A oto wyniki jakie uzyskali studenci:
3.5. Inne miary pozycyjne
Grupa Ewy
G rupa ZoS·l
Grupa Adama
Xi
Xi
Xi
8 8 8
7 8 8
8
9
6 6 10 10
rozważaniach nad rozkładem wartości w szeregu statystycznym często odwołujemy się do koncepcji miar pozycyjnych. Jedną z miar pozycyjnych już poznaliśmy, jest nią mediana. Przypomnijmy, że ma ona tę własność, iż dzieli W
szereg statystyczny na dwie części. Inne miary pozycyjne na części, tylko w inaczej określony sposób.
również dzielą szereg
Gdybyśmy prowadzili
badania dotyczące zawodowych losów najlepszych absolwentów socjologii, to porządkując grupę absolwentów według ocen na dyplomach, do badań moglibyśmy włączyć górne 25% osób z takiej listy. Podzielilibyśmy wówczas grupę absolwentów według kwartyli. Kwartyle to miary pozycyjne, które dzielą szereg na cztery części: kwartyl pierwszy w stosunku 1/4 do 3/4, kwartyl drugi (mediana) w stosunku 1/2 do 1/2, kwartyl trzeci w stosunku 3/4 do 1/4. Absolwenci, którzy staliby się jednostkami analizy, to ci, dla których kryterium selekcyjne przybrałoby wartość większą od kwartyla trzeciego.
podziału
podział
dziesiąte części,
Kolejnym sposobem szeregu jest na czyli dePodział ten jest wykorzystywany np. w badaniach poziomu życia ludności, gdzie - dla określenia poziomu nierównościspołecznych _ porównuje się róż nice w poziomie życia najniżej sytuowanych 10% społeczeństwa z kolejnymi dziesiątkami lub też z 10% najlepiej sytuowanych. cyle.
L
Xi
= 32
32 = 8 X- E = 4'
L
Xi
= 32
X z -;J1 - 4
= 8
LXi
XA
= 32
= ~ = 8
Okazało się że dla wszystkich grup średnia zgo d nosc . ,z ekspertami " ł " s t u dentów b ła taka sama ale rozproszeme . . zm18ma .o ' " wartoscl. poszczególnych ,.pomlarow Sl'ę grupIe y od braku zróżnicowal1la , . w grupIe . E wy, przez pewne zrozmcowal1le . , t w ,.. o Zosi, do dużego w grupie Adama. Zobaczmy, Ja m lerzyc o zrOZl1lC . l( mozemy . wanie.
Pierwszą najprostszą miarą dyspersji jest rozst~p. Jesb't to ró.żnica .PeomMioę~~: " " " . ka wy stąpIła w a d aneJ wartością najwIększą l' naJml1le.Jszą, .Ja " ,. .grupl k' .rz .J'mu-
. t . ' ć za pomocą sformułowal1la, ze wartoscI, .Ja le p y WIęC rozs ęp WylaZl . l d d lub w sposób je zmienna w badaniu zawierają się w przedzla e o ... o... , algebraiczny:
R = x max
-
xmin,
jako różnicę pomiędzy wartością maksymalną l. mlDllna .. lną w badanym zbiorze danych.
Zaletą tej miary jest jej prostota i łatwość interpret~cyjna, wa~ą natom~ast to, że
rzy jej obliczaniu bierzemy pod uwagę tylko dwa l to szczegolne, skrajne po-
mi~ry. Zatem, o ile średnia nie wynosi tyle, ile któryś ze skrajnych pomiarów (co
zdarza się niezwykle rzadko), to na podstawie wielkości nic powiedzieć na temat różnic pomiędzy wszystkimi pozostałymi pomiarami a średnią. Powróćmy do grup studenckich i zróżnicowania ich pomiarów: nie jest
niemożliwe ale
rozstępu nie możemy
II III III
grupa Ewy - R = 8 - 8 = 0, grupa Zosi - R = 9 - 7 = 2, grupa Adama - R = 10 - 6 = 4.
potwierdza naszą wstępną obserwację o braku zróżnicowa nia wartości w grupie Ewy, o pewnym zróżnicowaniu w grupie Zosi i najwięk szym zróżnicowaniu w grupie Adama. Spróbujmy teraz ocenić to zróżnicowanie w sposób bardziej precyzyjny.
Ponieważ naszym celem jest zmierzenie "odległości" pomiędzy pomiarem a średnią, nie jest dla nas istotne, w którą stronę następuje to odchylenie (w kierunku rosnących czy malejących wartości na osi), ważne jest zaś o ile jednostek.
To co nas interesuje, to Wartość tę
wartość bezwzględna odległości pomiarów
od
średniej.
oznaczamy za pomocą pionowych nawiasów a - zgodnie z definicją - wielkość wyrażenia ujętego w taki nawias ma znak
wartości bezwzględnej
dodatni. Teraz wzór definicyjny na odchylenie
średnie będzie miał następującą postać:
Wielkość rozstępu
3.7. Odchylenie
średnie
Bardziej precyzyjny pomiar zróżnicowaniazakłada określenie (zmierzenie) róż nic pomiędzy każdym pomiarem a średnią. Na tej idei oparta jest istota odchylenia średniego, nazywanego również odchyleniem przeciętnym. Rozpoczynamy więc od obliczenia różnic pomiędzy każdym pomiarem a średnią. Następnie dodajemy wszystkie te różnice, aby otrzymać ogólną sumę odchyleń. Jeśli tę ogólną sumę podzielimy przez liczbę pomiarów, to uzyskamy odchylenie średnie. Wielkość rozstępu
wanie pomiarów
dla grup studenckich wskazywała, że największe zróżnico grupie Adama. Policzmy dla niej odchylenie
występowało w
średnie.
Xi
X
Xi-X
6 6 10 10
8 8 8 8
-2 -2 2 2
2:>i
= 32
pewien problem. Nie możemy tak po prostu dodać wszystkich pomiarami a średnią, gdyż według własności średniej poznanej poprzednio, taka suma zawsze powinna wynosić zero. Tak jest w naszym
Tu pojawia
się
różnic pomiędzy przykładzie:
90
gdzie d (tak oznaczamy odchylenie średnie) jest względnych różnic pomiędzy pomiarami a średnią. Sprawdźmy
rzona za
zatem, jak przedstawia
się wielkość
pomocą odchylenia średniego, w
X
Xi-X
6 6 10 10
8 8 8 8
-2 -2 2 2
lXi
-xl 2 2 2 2
Llxi -XI
LXi = 32 X=?f=8
=8
d=~=2
Grupa Zosi
Xi
X
7 8 8 9
8 8 8 8
LXi = 32 X=?f=8
Xi-1 O O 1
X
bez-
rozproszenia pomiarów, mieposzczególnych grupach studenckich.
Grupa Adama
Xi
średnią arytmetyczną
lXi-xi 1 O O 1
Llxi -XI =2 d = ~ = 0,5
Grupa Ewy Xi
X
Xi-X
lXi-Xi
8 8 8 8
8 8 8 8
O O O O
O O O O
LXi = 32
Llxi -XI = O
X=:3;f =8
d=~=o
Wyniki są zgodne z naszymi oczekiwaniami i precyzyjnie wyrażone. Brak zróż nicowania wartości pomiarów w grupie Ewy został potwierdzony przez odchylenie średnie o wartości zero. Niewielkie zróżnicowanie wartości pomiarów w grupie Zosi potwierdza ułamkowa wartość odchylenia średniego (d = 0,5). Największe jest zróżnicowanie wartości pomiarów w grupie Adama (d = 2).
3.8. Wariancja i odchylenie standardowe Dotychczasowe nasze rozważania dotyczące rozproszenia wartości pomiarów w badanej grupie miały za zadanie przybliżenie samego pojęcia dyspersji i sposobów jej pomiaru, gdyż na ogół w badaniach posługujemysię zupełnie innymi miarami dyspersji. Formuła określania odległości wartości pojedynczego pomiaru od średniej za pomocą wartości bezwzględnej, która została zastosowana przy definiowaniu odchylenia przeciętnego, zostaje zastąpionainną formułą. Zamiast "pozbywać" się znaku ujemnego dla różnic między pomiarami a śred nią za pomocą wartości bezwzględnej, stosuje się w tym celu podnoszenie do kwadratu. Tak zdefiniowaną miarę dyspersji nazywamy wariancją 82: 8
2
=
L (Xi _X)2 N
Wielkość wariancji będzie zawsze większa niż odchylenia średniego, można nawet powiedzieć, że wariancja mierzy "podwójną" (ze względu na podnoszenie do kwadratu) sumę różnic między pomiarami a średnią. Aby miarę tę uczynić bardziej porównywalną do odchylenia średniego, wyciągamy pierwiastek kwadratowy z wariancji, obliczając odchylenie standardowe 8:
Interpretacja odchylenia standardowego jest zbliżona do tej, jaką stosujemy dla odchylenia średniego - poprzez analogię.
. ' d h l . 'rednie jest łatwiejsze do obliczenia i bardziej "przyTak WlęC, choc o c .y.eme s d' badaniu dyspersji posługujemySlę od.eJ' wspomniane kwestie techjazne" interpretacYJ me, to zasa mczolw . d d tak ze wzg ę d u na wyz ar owym, . anall'tyczne odchylenia standardowego chylemem . kstan . b'd .stotne znaczeme niczne, Ja l a~ zo, l. . . h t ów idealnych rozkładów zmiennych dla jednego z naJczęscleJ występuHcyc yp d' . w późniejszych rozdzia_ rozkładu normalnego (wrócimy do tego zaga mema
łach).
, .
Zmierzmy teraz za pomocą nowo poznanyc~ miar stopień rozproszenia wartosCl pomiarów w omawianych grupach dyskusYJnych. Grupa Adama Xi
X
Xi- X
(Xi - X)2
6 6
8 8 8 8
-2 -2 2 2
4 4 4 4
10 10
L(Xi- X )2- l6
LXi - 32
Grupa Zosi (Xi- X
Xi
X
Xi -X
7 8 8 9
8 8 8 8
-1
1
O O
O O
1
1
LXi - 32
L(Xi- X
)2
)2=2
Grupa Ewy
!li
Xi
X
Xi -X
(Xi - X)2
8 8 8 8
8 8 8 8
O O O O
O O O O
I!i
8
2
= L(Xi-X/ N
8=
8 =
2,0.
Zróżnicowanie wartości
pomiarów w tej grupie jest największe, co oznacza, iż w ocenie indeksów poszczególnych studentów były największe wśród wszystkich grup dyskusyjnych. Wiemy, że dyspersja jest największa w grupie Adama, ale nie wiemy, czy jest ona duża w kategoriach ogólnych. różnice
L (Xi _X)2 = O
LXi = 32
wariancja - 8 2 = 4,0, odchylenie standardowe -
Narzędziem, pozwalającym nam porównywać stopień rozproszenia wartości w różnych grupach jest współczynnik zmienności - jest to stosunek odchylenia standardowego do średniej arytmetycznej:
°
- -4--O ,
VL (X; X)2 l =
8
v= X.
=VO=o.
Spróbujmy dokonać podsumowania badania dyspersji w grupach dyskusyjnych.
Pozornie jest on skonstruowany jak wskaźnik z zakresu od może przybierać wartości większe niż 1.
°
do 1 ale faktycznie
Grupa Ewy: - R = 0, odchylenie średnie - d = wariancja - 8 2 = 0, odchylenie standardowe -
III rozstęp
III III III
Wartość
° ,
= o.
8
N~e ma ża~nego zró~nicowaniapomiędzy wartościami, jakie przyjmują poszczegolne p~mIary tej ~rupie - indeksy społecznego konserwatyzmu wszystkich studentow ~ tej grupIe zostały ocenione na 8 punktów w porównaniu z indek-
:v
sem ekspertow. Grupa Zosi:
- R = 2,0, odchylenie średnie - d = wariancja - 8 2 = 0,5, odchylenie standardowe -
II rozstęp III III III
°, , 5
8
= 0,7.
od od od od od
V
O do 0,2 0,21 do 0,39 0,4 do 0,6 0,61 do 0,7 0,71 do 0,9 powyżej 0,91
Rozproszenie małe
mniej
niż średnie
średnie
więcej niż średnie duże
bardzo
duże
W grupie Ewy i Zosi rozproszenie jest małe (w grupie Ewy nie ma go wcale) a w grupie Adama jest mniej niż średnie. W rzeczywistej sytuacji badawczej na ogół występuje zróżnicowanie wartości pomiarów (inaczej niż w grupie Ewy) i na ogół wielkość odchylenia standardowego jest nieznacznie wyższa niż odchylenia średniego (tak jak to jest w grupie Zosi). Weźmy teraz pod uwagę przykład, który będzie bliższy takiej sytuacji.
Z~kr~s z:óżnicowani~ po~ię.dzy wartościami poszczególnych pomiarów jest niewIelkI, .lIczba p~nktow, JakIe za swoje indeksy otrzymali studenci różniła się tylko meznaczme.
~~.~~~.~~..~.~.
Grupa Adama:
Powróćmy do badania przeprowadzonego wśród studentów socjologii na temat
- R = 4,0, odchylenie średnie -
III rozstęp II
d
°
= 2, ,
ich indywidualnej oceny trafności wyboru kierunku studiów. Poprzednio obliczyliśmy miary tendencji centralnej dla zbioru danych pochodzących z badań. Teraz zajmiemy się miarami dyspersji.
Obliczenie
d
rozstępu jest czynnością niezwykle prostą:
R = 10 ~óżnica n:iędz~ w~rtością największą cały
SI 10, czyh obejmuje
zakres
a
°
2
= 10.
s =
najmniejszą
używanej
w badanej grupie wyno-
II
odchylenie
przybiorą następującą postać:
średnie:
wariancja:
II
odchylenie standardowe:
455,5 165
= 2,8,
1534,5
W5
=9,3,
1534,5
W5
V = 3,05 = 5,7
=
J9,3 =
3,05,
°
54 ,.
Proszę pamiętać, że to tylko ćwiczenia, w prawdziwych badaniach komputer wyręczy nas w liczeniu wszystkich miar. Nam pozostanie bardziej odpowiedzialna i interesująca rola interpretatora.
Co możemy zatem powiedzieć o ocenie trafności wyboru kierunku studiów dokonanej przez studentów socjologii. Trafność wyboru studiów zoperacjonalizowaliśmy w postaci skali od (wybór zupełnie nietrafiony) do 10 (w 100% trafny). Wśród badanych studentów byli tacy, którzy uznali swój wybór za zupełnie nietrafny oraz tacy, którzy byli całkowicie ze swego wyboru zadowoleni (wartości zmiennej obejmowały cały zakres skali, co potwierdza wartość
d= Elxi-Xlni N ' lIiI
s=
skali.
Problem .... . ., y pOJaWIają SIę, g d Y przechodzImy do wyznaczenia odchyleń i warianCJI. Dane pochodząc~ z .badań uporządkowaliśmy W szeregu staty~tycznym, wobec.:ego w~ory defimcYJne musimy przystosowaćdo takiego sposobu ich prezentacJI, w ktorym mamy podaną wartość zmiennej i odpowiadającą jej liczebność. Odpowiednie wzory
=
°
rozstępu).
Średnio rzecz biorąc, studenci są raczej z wyboru studiów zadowoleni (średnia arytmetyczna) a połowa z nich nawet bardzo zadowolona (mediana). Istnieje ~abie:amy się więc
do mrówczej pracy. W poprzednim rozdziale wynosi ona 5,7.
obliczyliśmy
niezadowolonych (druga dominanta).
sredmą arytmetyczną -
Xi
ni
Xi-X
lXi-xi
IXi-Xlni
O l 2 3 4 5 6 7 8 9 10
5 la 30 10 5 5 10 20 40 20 10
5,7 -4,7 -3,7 -2,7 -1,7 -0,7 0,3 1,3 2,3 3,3 4,3
5,7 4,7 3,7 2,7 1,7 0,7 0,3 1,3 2,3 3,3 4,3
28,5 47 111 27 8,5 3,5 3 26 92 66 43
E = 455,5
(Xi -
xy
(Xi
32,5 22,1 13,7 7,3 2,9 0,5 0,1 1,7 5,3 10,9 18,5
X-)2 ni 162,5 221 411 73 14,5 2,5 l 34 212 218 185
E
widoczna polaryzacja postaw: najliczniejsza jest grupa osób bardzo zadowolonych (pierwsza dominanta), ale nie wiele mniej liczna jest grupa osób bardzo
1534,5
Rozkład wartości analizowanej zmiennej jest rozkładem dwumodalnym, asymetrycznym lewostronnie. Rozkłady dwumodalne charakteryzująsię na ogół dużym rozproszeniem wartości pomiarów, w analizowanym przykładzie jest ono średnie (potwierdzają to wartości odchylenia średniego, wariancji i odchylenia standardowego oraz współczynnika zmienności), być może ze względu na określony przez nas zakres skali trafności (gdyby był on większy, to rozproszenie byłoby prawdopodobnie jeszcze większe i być może nastąpiłoby wyraźne przesunięcie pomiarów w kierunku jednego z jej końców). Miary tendencji centralnej są bardzo użytecznym narzędziem analizy zmiennych. Aby je właściwie i w pełni wykorzystywać, trzeba sobie zdawać sprawę z istotnych różnic między nimi.
Dominanta jest miarą, którą można stosować dla wszystkich poziomów pomiaru zmiennych, zaczynając od takich mierzonych w skali nominalnej i kończąc na takich mierzonych w skalach silnych. Pamiętać należy o tym, że w jednym szeregu statystycznym może występować więcej niż jedna dominanta. Mediana jest miarą, którą możemy stosować do analizy zmiennych mierzonych w skali porządkowej lub w skalach silnych. Aby wyznaczyć medianę, pomiary muszą być uporządkowane według wartości rosnąco bądź malejąco. Jeżeli rozkład jest silnie asymetryczny, to mediana jest najlepszym reprezentantem miar tendencji centralnej. Średnia arytmetyczna jest miarą o największym znaczeniu analitycznym. W przeciwieństwie do dwóch poprzednich miar, wielkość średniej liczona jest w oparciu o wszystkie wartości pomiarów występujących w badanej grupie. Ma to pozytywną konsekwencję w postaci stabilności tej miary w porównaniu do mediany i dominanty (do znaczenia pojęcia stabilności i wagi tej własności średniej powrócimy po przejściu do zagadnień z zakresu statystyki indukcyjnej) oraz konsekwencję negatywną, w postaci dużego wpływu pomiarów ekstremalnych na wielkość średniej, co mediany i dominanty nie dotyczy. Średnią możemy stosować tylko do analizy zmiennych mierzonych w skalach silnych.
Przedstawione miary tendencji centralnej i dyspersji służą nam do analizy (opisu) jednej zmiennej. W badaniach jednostki analizy są charakteryzowane przez wiele zmiennych i każdą ze zmiennych można opisać używając poznanych miar. Dział
statystyki, w ramach którego dokonujemy tego typu analiz nazywa
się
statystyką opisową· Użyteczność
analityczna niektórych poznanych miar wykracza poza funkcje opisowe, ale to będzie przedmiotem naszych dociekań w dalszych rozdziałach.
Ćwiczenia Ćwiczenie
3.1.
Badano związek między wydatkami na zdrowie liczonymi w %PKB a wskaźni kami jakości życia. Jednym z takich wskaźników jest oczekiwana długość życia. Sprawdzono, ile wynosi ona dla dziesięciu państw wydających najwięcej na zdrowie oraz dla państw, w których wydatki te wynoszą 1% i mniej PKB. Oblicz średnią arytmetyczną i medianę dla na tej podstawie wysnuć wnioski? Państwa
o
najwyższych
Stany Zjednoczone Kanada Francja Niemcy Finlandia Szwecja Holandia Australia Austria Norwegia Państwa
grupy
państw.
Jakie
możesz
wydatkach
Długość życia
Państwo
każdej
[lata]
76,8 78,1 77,6 76,8 76,5 79,0 78,0 78,3 77,1 77,3
o naj niższych wydatkach
Państwo
Długość życia
Sudan Indonezja Zair Maroko Somalia Egipt Kamerun Laos
[lata]
55,0 65,1 51,9 65,7 49,0 66,0 58,5 53,5
Ćwiczenie 3.2.
Porównajmy zdefiniowane w poprzednim ćwiczeniu grupy państw w innym wymiarze. Teraz analizowaną zmienną jest średnia liczba osób żyjących w jednym gospodarstwie domowym.
98
Dokonaj porównania tych grup w oparciu o miary tendencji centralnej. Państwa o najwyższych Xi
ni
2,2 2,3 2,4 2,6 2,7 3,0
1 1 1 4 2 1
Państwa
wydatkach na zdrowie
2, 4, 6, 3, 3, Uporządkuj
ni
4,5 4,9 5,2 5,4 5,6 5,9
1 2 1 2 1 1
O, 2, 2, 4, 1,
1, 3, 1, 3, 2,
5, 4, 3, 2, 3,
3, 1, 1, 2, 4,
1, 2, 4, 1, 4,
2, O, 3, 1, 2,
3, 1, 6, 2, 3,
2, 2, 2, 3, 4,
1, 3, O, 1, 2.
3, 2, 3, 3,
2, 3, 2, 2,
dane i przeprowadź analizę zmiennej.
Ćwiczenie 3.5.
o naj niższych wydatkach na zdrowie
Xi
Oto surowe dane uzyskane w tych badaniach:
W stosunku do poniżej zaprezentowanych wykresów rozkładów częstości (A-F), określ typ każdego z nich i opisz znaczenie podanych na wykresach symboli
(a-i) .
c
B
n
Ćwiczenie 3.3.
Psycholog społeczny badający dzieci z pierwszej klasy gimnazjum używał mię dzy innymi indeksu ekstrawertyczności. Indeks ten oparty był na skali od O (najmniej ekstrawertyczny) do 59 (najbardziej ekstrawertyczny).
x
a
b
c
x
E
F
Oto wyniki tego badania:
żaden
29, 56, 10, 22, 37,
44, 45, 13, 28, 41,
7, 29, 44, 32, 53,
10, 30, 45, 44, 26,
11, 41, 51, 25, 48.
U porządkuj dane i dokonaj ich analizy.
a g
iii
rozkład dwumodalny asymetryczny prawostronnie ... rozkład jednomodalny symetryczny ...
III
rozkład trójmodalny asymetryczny lewostronnie
III
rozkład jednomodalny asymetryczny lewostronnie
/!II
rozkład jednomodalny asymetryczny prawostronnie rozkład dwumodalny asymetryczny lewostronnie ...
Wśród wszystkich uczniów tego gimnazjum przeprowadzono badania dotyczą
ce ich sytuacji rodzinnej. Jednym z pytań, było pytanie o liczbę rodzerlstwa pozostającego na utrzymaniu rodziców.
x
Rysunek 3.7.
lIiII
Ćwiczenie 3.4.
f
!lila ...
b ...
c ...
d ...
e ...
f ...
g ...
. . .
h ...
z nich
Co
może zrobić
.t)
za nas komputer
'DO
'<J)
~.,.
c--
N
Cl
Analiza zmiennej "wiek respondentów"
c--
Wróćmy
teraz do zmiennej wiek respondentów PGSS. Komputer policzył za nas podstawowe charakterystyki tej zmiennej (rys. 3.8). Naszym zadaniem było tylko wybranie tych miar, które powinny być wyznaczone a teraz przystąpimy do ich interpretacji.
r----
400
300
c--
~
c--
200
~
100
Statystyki WIEK RESPONDENTA
Braki danych Średnia
Mediana Dominanta Odchylenie standardowe Wariancja Skośność Błąd
standardowy
<15~25)
2282 O 47,42 47,00 41 17,52 307,07 ,193
skośności
Rozstęp
Minimum Maksimum Percentyle
rI
O Ważne
N
25 50 75
<25-35) <35-45) <45-55) <55-65) <65-75) <75-85) <85-95)
Wiek respondenta: 8 kategorii
Rysunek 3.9. Wykres słupkowy dla zmiennej wiek respondenta
,051 76 18 94 34,00 47,00 62.00
Rysunek 3.8. Statystyki opisowe dla zmiennej wiek respondenta
W roku 1999 było 2282 respondentów PGSS. Najmłodszy z nich miał 18 lat a najstarszy 94, zaś różnica między nimi wynosiła 76 lat. Średnio respondenci mieli trochę ponad 47 lat. Połowa z nich miała 47 lat lub mniej a połowa 47 lat lub więcej. Na podstawie kwartyli (tu zaznaczonych jako 25, 50 i 75 percentyl) uzyskaliśmy informację, że 1/4 respondentów miała mniej niż 34 lata i 1/4 miała więcej niż 62 lata. Najwięcej było osób w wieku 41 lat. Rozkład wieku respondentów jest rozkładem asymetrycznym prawostronnie o bardzo niewielkiej asymetrii (tu liczonej według innej reguły i określanej jako skośność). Rozproszenie pomiarów, czyli ich odchylenie od średniej jest mniej niż średnie. Pamiętając o
poprzednio stworzyliśmyróżne kategoryzacje wieku (wła nowe zmienne opisujące wiek respondentów) spróbujmy zaprezentować niektóre z nich graficznie. Zmienną, którą skategoryzowaliśmy w przedziałach wartości przedstawimy w formie wykresu słupkowego (rys. 3.9). tym,
że
ściwie stworzyliśmy
Zmienną, której ostateczna forma kategorii stanowi opis w postaci wykresu kołowego (rys. 3.10).
słowny,
przedstawimy
Rysunek 3.10. Wykres kołowy dla zmiennej wiek respondenta
Analiza zmiennej "indeks sceptycyzmu naukowego" Inną zmienną, którą już wcześniej się zajmowaliśmy (w takim sensie, że utworzyliśmy ją na zasadach indeksu) jest indeks sceptycyzmu naukowego. Podsta-
wowe charakterystyki tej zmiennej przedstawiono na rysunku 3.11. Indeks ten został utworzony na podstawie opinii 900 osób. Jego skala wartości wynosiła od 5 do 19. Średnia wartość indeksu to niewiele ponad 12 - w zaokrągleniu do całości 12. Połowa respondentów uzyskała wynik 12 lub mniej na skali a połowa 12 lub więcej. Najwięcej było takich osób, które uzyskały na
103
skali wartość 12. Rozkład wartości tych wskazań jest więc rozkładem prawie symetrycznym o niewielkim rozproszeniu pomiarów. Statystyki
'C,)
Ważne
Braki danych
o
en 900 12,0278
Mediana
12,0000
Odchylenie standardowe
2,1795 4,7501
Skośność
400
300
-
~
200
,017
standardowy skośności
Minimum
,082
100
5,00
Maksimum
19,00
Rysunek 3.11. Statystyki opisowe dla zmiennej indeks sceptycyzmu naukowego Jeśli zmienną
indeks sceptycyzmu naukowego będziemy traktować jako zmienną ciągłą, to jej obrazem graficznym będzie histogram (rys. 3.12). Na histogram ten została nałożona krzywa ciągła, tzn. do rozkładu tej zmiennej została dopasowana funkcja, która ją odwzorowuje. Proszę zwrócić uwagę na podobieństwo tej funkcji do modeli idealnych, jakie pojawiły się w tekście rozdziału . •C,)
,-----
N
12,00
Wariancja Błąd
""
O
O
Średnia Dominanta
500
·en
INDEKS SCEPTYCYZMU NAUKOWEGO N
Na kolejnych rysunkach (3.13-3.14) znajdują się graficzne obrazy zmiennych wyniku zmiany kategoryzacji indeksu.
powstałych w
O
,------,
,--.---, b. negat. stosunek
ani pozyt. ani negat
negatyvmy stosunek
b. pozyt. stosunek
pozytywny stosunek
Indeks sceptycyzmu naukowego: 5 kategorii
Rysunek 3.13. Wykres słupkowy dla zmiennej indeks sceptycyzmu naukowego; graficzna prezentacja pięciu kategorii indeksu
400-,--~~~~~~~~~~~~~-----,
·en o
en
"" U N
pozytywny stosunek
negatywny stosunek
26,9%
24,8%
300
200 ani pozyt. ani nagat
48,3% 100 Odch.8td = 2,18 Średnia = 12,03
=='---,--'~-L~---L~--'-~-L--,::o""-~ N = 900,00 6,00 8,00 10,00 12,00 14,00 16,00 18,00 20,00
Rysunek 3.14. Wykres kołowy dla zmiennej indeks sceptycyzmu naukowego; graficzna prezentacja trzech kategorii indeksu
Indeks sceptycyzmu naukowego
Rysunek 3.12. Histogram dla zmiennej indeks sceptycyzmu naukowego
Procedury uzyskiwania za pomocą programu SPSS zaprezentowanych wyżej wyników można znaleźć w książce Jarosława Górniaka i Janusza Wachnickiego
SPSS PL for Windows - pierwsze kroki w analizie danych (część II, rozdz. 2, 3, Kraków, SPSS Polska 2000).
Literatura 1. Blalock M. H.: Statystyka dla socjologów. Warszawa, PWN 1977. 2. Frankfort-Nachmias Ch., Nachmias D.: Metody badawcze w naukach spolecznych. Poznań, Zysk i S-ka 2001. 3. Sobczyk M.: Statystyka. Wyd. 2. Warszawa, PWN 1996.
Pojęcia III
podstawowe
tabela kontyngencji przyczynowa współczynnik Yula pary zgodności pary niezgodności
l1li zależność III III III
III współczynnik
l1li
III
współczynnik
I Goodmana i Kruskala
współczynnik
A Goodmana i Kruskala
III
III
111
III
III
asymetryczne miary związku symetryczne miary związku
monotoniczna niemonotoniczna zmienna kontrolna zależność pozorna modele przyczynowe zmienna pośrednicząca zmienna poprzedzająca współczynniki T Kendalla współczynnik kontyngencji C Pearsona współczynnik V Cramera
III zależność
III
III
III zależność
l1li III III
W rozdziale tym powrócimy do znanego nam już z rozdziału pierwszego sposobu prezentowania danych w tabelach. Tym razem zajmiemy się regułami, według których konstruujemy takie tabele. Poznamy sposoby takiego przekształcania danych, aby ich interpretację i ilustratywność uczynić jak najbardziej przystępnymi. Pokażemy również różne formy zapisu informacji w poszczególnych polach tabeli. Tabela jest zapisem związku dwóch zmiennych. Zajmiemy się zatem relacjami między tymi zmiennymi. Przyjmując związek dwóch zmiennych za podstawę bardziej złożonego modelu zależności, wprowadzimy do tego modelu trzecią zmienną i rozpatrzymy relacje, jakie mogą wystąpić między nimi. Mierząc związek
dwóch zmiennych chcielibyśmy mieć jak najbardziej precyna temat jego istoty. Na podstawie rozkładu liczebności w polach tabeli wnioskujemy o istnieniu zależności, bądź nie, oraz o jej charakterze. O ile jednak nie jest to związek idealny, lub zerowy, nasze oszacowania są bardzo niezyjną wiedzę
doskonałe.
Większość
programów komputerowych używanych do analizy statystycznej tworzenia tabel kontyngencji uzupełnia całym zestawem miar zależności. Miary te, to na ogół miary związku oparte na skali od O (brak związku) do l (związek idealny). Czasem mają one przypisaną wartość dodatnią (dla zależ ności pozytywnej) lub ujemną (dla zależności negatywnej). Naszym zadaniem jest z tego zestawu miar wybrać taką, która w sposób najbardziej adekwatny opisuje związek między interesującymi nas zmiennymi. opcję
4.2. Przekodowywanie danych Przekształcenie danych polegające na zamianie jednego typu kategoryzacji danej zmiennej na inny będziemy nazywać przekodowaniem danych.
Aby taki zabieg był efektywny analitycznie, przy jego przeprowadzaniu powinniśmy brać pod uwagę następujące wskazania: Ilil
4.1. Tabele kontyngencji W analizie statystycznej socjologowie obecnie znacznie częściej posługują się coraz bardziej wyrafinowanymi metodami analitycznymi. Niezależnie od tego, tabela statystyczna pozostaje wygodnym i szeroko stosowanym sposobem prezentacji danych oraz narzędziem wprowadzającym do dalszej analizy. Znajomość konstrukcji i interpretacji tabel jest zatem ciągle jeszcze "tabliczką mnożenia" badacza.
Tabela kontyngencji ilustruje istotę związku między zmiennymi niezależną i zależną. Każda ze zmiennych ma określony zakres zmienności, czyli wartości jakie może przyjąć w badaniach. Zmienne jakościowe, których kategorie opisują własności (mierzone na poziomie nominalnym lub porządkowym) mają na ogół określoną, niewielką liczbę tych kategorii. Tabele z takimi zmiennymi są więc zazwyczaj przejrzyste. W przypadku zmiennych mierzonych na poziomach silnych (a pamiętamy o tym, że w badaniach staramy się mierzyć interesujące nas zmienne na możli wie najwyższym poziomie), zakres ich wartości jest na ogół dużo większy. z występujących w badaniu wartości miała stanowić odrębną ka(np. wiek w latach każdej badanej osoby, dochód miesięczny na członka rodziny każdego badanego gospodarstwa domowego) to nie tylko tabela z udziałem takiej zmiennej ale już szereg statystyczny takiej zmiennej byłyby zupełnie nieczytelne.
Gdyby
każda
tegorię
W celu prezentacji takich zmiennych dokonujemy ich uporządkowania w innych typach szeregów statystycznych niż dokonywaliśmyich pomiarów. Na ogół wiąże się to z obniżeniem poziomu pomiaru (zmienne mierzone na poziomach silnych prezentujemy jako zmienne poziomów słabych) a więc z istotną utratą informacji o badanym zjawisku. Zatem w dalszej analizie statystycznej sięgamy ponownie do danych surowych (takich jakie zmierzyliśmy), natomiast prezentację i wstępną analizę prowadzimy na danych przekształconych.
III
l1li
ilIl
należy sprawdzić, czy istnieje jakaś ogólnie przyjęta kategoryzacja opracowywanej zmiennej; liczba nowo tworzonych kategorii powinna być ograniczona -- najlepiej do kilku; kryteria podziału na kategorie powinny być jednoznaczne i jasne; liczebność poszczególnych kategorii powinna być zbliżona.
Spróbujmy te
reguły zastosować w
praktyce.
Dane charakteryzujące20 krajów (tabela 4.1) zaczerpnięte zostały z opracowania "The Economist" pt. Świat w liczbach z 1997 roku. Dane te dotyczą poziomu rozwoju kraju i życia jego mieszkańców wyrażonych w postaci PKB na głowę mieszkańca, który to wskaźnik uznany jest ogólnie za dobre ich odzwierciedlenie. Trzy dodatkowe zmienne są również wyrazem poziomu rozwoju cywilizacyjnego badanych państw. Wstępna hipoteza badawcza dotycząca tych krajów jest taka, że poziom życia obywateli danego kraju jest zależny negatywnie do udziału rolnictwa w tworzeniu PKB.
Poziom życia obywateli jest wyznaczony przez wielkość PKB przypadającą na jednego mieszkańca. Obie zmienne są mierzone w skalach silnych i dla każde go z badanych państw przyjmują inne wartości. Gdybyśmy traktowali każdą wartość jako odrębną kategorię, to związek tych dwóch zmiennych obrazowała by tabela 20 (kolumn) x 20 (wierszy), co oznaczałoby raczej zaciemnienie niż ilustrację ewentualnego związku. Zastanówmy się zatem, jak przekształcić obie zmienne. Zmienną niezależną jest zmienna, która pozwala nam ocenić poziom rozwoju cywilizacyjnego badanego państwa i umieścić je na odpowiednim miejscu według zaawansowania tego rozwoju. Ta zmienna to wartość PKB na głowę mieszkańca, jej przekształceniem zajmiemy się w pierwszej kolejności. Najniż sza wartość jaką przyjmuje ta zmienna to 226$ (dla Bangladeszu), a najwyższa to 34629$ (dla Japonii).
Tabela 4.1. Państwo
PKB na głowę mieszkailca w $
Argentyna Australia Bangladesz Chiny Czechy Francja Hiszpania Hongkong Indie Japonia Kamerun Kenia Meksyk Niemcy Polska Rosja USA Turcja
8065 17976 226 529 3210 23474 13282 21650 305 34629 679 255 4014 25578 2468 2645 25860 2452 3839 345
Węgry
Zair
Udział
w PKB rolnictwa w %
Wskaźnik
Dorośli umiejący
płodności
czytać
6,9 7,5 30,4 20,5 5,8 2,8 3,7 0,2 31,8 2,2 28,6 29,1 7,4 1,0 6,7 6,3 1,9 15,8 7,3 30,2
2,6 1,5 3,9 2,0 1,8 1,7 1,2 1,2 3,4 1,5 5,3 5,8 2,8 1,3 1,9 1,5 2,1 3,0 1,7 6,2
i
pisać
%
95,5 99,0 36,6 80,0 99,0 99,0 98,0 90,0 49,8 99,0 56,6 70,5 88,6 99,0 99,0 98,7 99,0 81,9 99,0 74,0
Żaden z pozostałych 18 pomiarów nie przybiera takiej samej wartości, wszystkie
różnią się między sobą· Jeśli jednak przyjrzymy się poszczególnym pomiarom, to zauważymy, że daje się wyróżnić grupa krajów, gdzie dochód ten jest bardzo niski, rzędu kilkuset dolarów. Następnie mamy grupę krajów o dochodzie rzędu kilku tysięcy dolarów na jednego mieszkańca. Potem pomiary się bardziej róż nicują: dwa pomiary po kilkanaście tysięcy, cztery powyżej dwudziestu tysięcy
i jeden
powyżej
trzydziestu.
Gdybyśmy podążyli tym tropem, to tworzony szereg statystyczny przyjąłby postać: PKB/mieszkańca
ni
Poniżej
6 7 2 4 1
1000$ 1001-10 000$ 10001-20000$ 20001-30000$ Powyżej 30000$
Mamy dwie pierwsze kategorie prawie równoliczne i trzy następne z rozproszonymi pomiarami. Przy takim uporządkowaniuzmiennej obniżyliśmy poziom jej pomiaru z ilorazowego na porządkowy. Równie dobrze możemy wobec tego zastąpić opis kategorii z określającego przedziały wartości na słowny. Jeśli dodatkowo uznamy, że osiągnięcie PKB na głowę mieszkańca w wymiarze większym niż 10 000$ jest wskaźnikiem awansu na wyższy poziom rozwoju, niezależnie od różnic wewnątrz tak zdefiniowanej grupy państw, to analizowana zmienna będzie posiadać następujące kategorie: PKB/mieszkańca
ni
Zakres
Niski Średni Wysoki
6 7 7
poniżej
1000$ 1000-10000$ powyżej 10 000$
Teraz mamy trzy jasno zdefiniowane kategorie zmiennej niezależnej, które mają one łatwiejsze do interpretacji i prezentacji niż dar.e surowe.
zbliżoną liczebność. Są
Takiego samego zabiegu dokonamy w odniesieniu do zmiennej zależnej udział % rołnictwa w PKB. Patrząc na dane surowe widać wyraźnie grupę państw, dla których udział ten wynosi kilkadziesiąt procent, jedno z około 15%, wyraźna grupa z około 5% do 8%, jedno około 4% i reszta poniżej 3%. Spróbujmy tak utworzyć szereg. Udział
% rolnictwa w PKB
Poniżej 3 3,1-5,0 5,1-10,0 10,1-20,0 Powyżej 20,0
ni
5 1
7 1
6
Gdybyśmy dokonali "ściągnięcia" dwóch skrajnych kategorii, co byłoby uzasadnione merytorycznie, to zmienna zależna przybrałaby podobną formę jak zmienna niezależna. Udział
% rolnictwa w PKB
Niski Średni
Wysoki Mając
%
ni
Zakres
6 7 7
poniżej
5%
5-10% powyżej
10%
przekodowane zmienne wartość PKB na głowę mieszkańca oraz udział w PKB możemy się pokusić o utworzenie tabeli, która będzie
rołnictwa
prezentować relację między tymi dwiema zmiennymi. Zmienną, którą uznaliśmy za niezależną zamieścimy w kolumnach tabeli a jej opis pojawi się w górnej części tabeli, tzw. główce. Zmienną zależną zamieścimy w wierszach a jej opis w pierwszej kolumnie, tzw. boczku tabeli. W poszczególne pola tabeli wpiszemy liczebność jednostek analizy charakteryzujących się określonymi kategoriami jednej i drugiej zmiennej. Dokonamy sumowania liczebności po wierszach, po kolumnach oraz ogółem. Aby tabela była kompletna, musimy jej nadać tytuł i zamieścić źródło danych.
Oto efekt naszej pracy -
tabela 4.2.
Tabela 4.2. Udział % rolnictwa w PKB według wielkości PKB na głowę mieszkań ca w wybranych krajach świata. Źródło: Świat w liczbach, Warszawa, Studio EMKA 1997 Udział
PKB/1osobę
% rolnictwa w PKB
Suma
Wysoki
Średni
Niski
Wysoki Średni Niski
O 1 6
1 6 O
6 O O
6
Suma
7
7
6
20
7 7
Analogicznie liczymy procent dla ośmiu pozostałych pól tabeli. Suma procentów ze wszystkich pól tabeli (dziewięciu) powinna być równa 100%. Taki sposób procentowania stosujemy jednak niezmiernie rzadko. Z analitycznego punktu widzenia informacja, że 30% badanych państw ma wysoki PKB na jednego mieszkańca i niski udział rolnictwa w PKB nie jest dla nas naj istotniejsza. 2. Innym sposobem przeliczania liczebności na procenty jest uznanie za całość poszczególnych kategorii zapisanych w wierszach tabeli. Wówczas każda liczebność brzegowa wiersza będzie stanowiła 100%, a procent w poszczególnych polach tabeli będzie liczony w odniesieniu do niej. I tak, procent dla pola "niski - wysoki" o liczebności 6 będziemy liczyć jako procent liczebności brzegowej 7: 6: 7 = 0,857 . 100% = 85,7%.
Zatem 85,7% państw o wysokim udziale rolnictwa w PKB ma niski PKB na jednego mieszkańca. Kolejno liczymy udział procentowy państwo średnim i wysokim dochodzie w tej samej kategorii udziału rolnictwa w PKB. Dla pierwszego wiersza tabeli Państwa
z wysokim
udziałem
rozkład
procentowy
byłby następujący:
rolnictwa w PKB
o wysokim PKB na mieszkańca
0,0% 14,3%
O średnim PKB na mieszkańca O niskim PKB na mieszkańca
85,7%
Na podstawie naszej wiedzy z rozdziału pierwszego możemy powiedzieć, że związek pomiędzy wartością PKB na głowę mieszkańca a udziałem % rolnictwa w PKB jest prawie idealnie zależnością negatywną·
Analogicznie dokonujemy procentowania w
4.3. Forma prezentacji danych w polach tabeli
3. Ostatnim sposobem zamiany liczebności na procenty jest potraktowanie każ dej kategorii zmiennej kolumnowej jako 100%. Wówczas każda kolumna stano-
Do tej pory, tworząc tabelę, wpisywaliśmy w jej poszczególne pola liczbę jednostek analizy charakteryzującychsię dwiema krzyżującymi się w danym polu własnościami zmiennych prezentowanych w tabeli. Taki sposób wypełniania pól tabeli jest w pełni poprawny, ale przy dużej liczebności badanej grupy i przy braku idealnej zależności (co jest sytuacją najczęściej występującą w rzeczywistych badaniach) mało czytelny. Dlatego też najczęściej zamienia się liczebności na procenty. Czynności tej możemy dokonać na trzy sposoby. pojedyncze pole jako procent z liczebności ogólnej. Wówczas np. pole "wysoki - niski" z tabeli 4.2 o liczebności 6 liczymy jako procent z liczebności ogólnej 20:
1.
Możemy traktować każde
6 : 20
= 0,3 . 100% = 30%.
Liczebność brzegowa
7
100,0% pozostałych
wierszach tabeli.
wić będzie odrębną całość.
I tak, kraje o wysokim dochodzie na jednego mieszkańca stanowić będą 100%, a pola w wymiarze procentowym w tej kolumnie będą wyglądać następująco: Państwa
o wysokim PKB na
mieszkańca
o
wysokim udziale rolnictwa w PKB O średnim udziale rolnictwa w PKB O niskim udziale rolnictwa w PKB
Liczebność
brzegowa 7
Przyjęte założenie rozróżnienia
wzajemnego
0,0% 14,3%
85,7% 100,0%
zmiennej
zależnej
oddziaływaniaoraz przyjęty w
tym
i zmiennej
niezależnej,
podręczniku sposób
ich konstruk-
cji i prezentacji tabel (kwestia ta nie jest zestandaryzowana i różni autorzy odmienne stanowiska, dotyczy to także pakietów komputerowych, nie można więc do tej sprawy podchodzić mechanicznie, lecz zawsze trzeba sprawdzić jaka jest obowiązująca konwencja) sprawia, iż tu stosowanym sposobem zamiany liczebności na procenty jest sposób trzeci, czyli procentowanie w kolumnach. przyjmują
To, co nas bowiem najbardziej interesuje to zależność przyczynowa, czyli ocena, jaki wpływ ma zmienna niezależna na zmienną zależną, lub inaczej rzecz ujmując, czy zmiana kategorii zmiennej niezależnej będzie powodowała zmiany w rozkładzie zmiennej zależnej. Porównując ten wpływ poruszamy się po wierszach, gdyż patrzymy na zmiany kategorii zmiennej zależnej z kategorii na kategorię zmiennej niezależnej. Zapiszmy wobec tego według tych reguł utworzoną poprzednio tabelę (tabela 4.3).
Analitycy zajmujący się oceną poziomu cywilizacyjnego rozwoju państw wskazują na inne jeszcze jego miary, np. wskaźnik płodności, pozostający również w zależności negatywnej do poziomu dochodu na jedną osobę oraz procentowy udział w całej populacji dorosłych umiejących czytać i pisać, będący w zależno ści pozytywnej do poziomu dochodu. Oba te wskaźniki zawarte są w tabeli 4.1. Spróbujmy dokonać ich przekodowania a potem sprawdźmy, czy w tak małej grupie badanych państw zależności powyżej opisane są również widoczne. Wskaźnik płodności wśród badanych państw zmienia się w zakresie od 1,2 do
6,2. Jeśli jego wartość wynosi poniżej 2, to w danym społeczeństwie następuje spadek jego liczebności z pokolenia na pokolenie. Przyjmijmy takie kryterium jako określające kategorię "niski". Wartość 2 do 3 gwarantuje prostą reprodukcję liczebności populacji. Uznajmy to za kategorię "średni". Powyżej 3 mamy do czynienia z liczebnym przyrostem ludności z pokolenia na pokolenie. Niech będzie to kategoria "wysoki". Zatem zmienna
Tabela 4.3.
Udział
% rolnictwa w PKB
według wielkości
PKB na głowę miesz-
kańca w wybranych krajach świata (w %; N = 20). Źródło: Świat w liczbach, Warszawa, Studio EMKA 1997. Udział
% rolnictwa w PKB
PKB/losobę
Wysoki
Średni
Niski
Wysoki
O
Niski
14,3 85,7
14,3 85,7
100,0
Średni
Suma
100,0
Suma
O
O O
35,0 35,0 30,0
100,0
100,0
100,0
wskaźnik płodności
Wskaźnik płodności
ni
postać:
Zakres
Wysoki
5
powyżej
Średni
5 10
2,0-3,0
Niski
przybierze
poniżej
3,0 2,0
Analogiczną procedurę
zastosujemy do wskaźnika procentowego udziału doroi pisać w danym społeczeństwie. Za "wysoki" uznamy ten wskaźnik dla państw, w których więcej niż 97% dorosłych umie czytać i pisać. Standardowy błąd takich szacunków wynosi zwykle 3%, a więc możemy powiedzieć, że w tych państwach, w granicach błędu, wszyscy dorośli posiadają słych umiejących czytać
taką umiejętność. Jeśli
teraz popatrzymy na pierwszy wiersz tabeli, to widzimy wyraźnie, w jakim stopniu wysoki udział rolnictwa w PKB jest uzależniony od poziomu PKB na jednego mieszkańca: wśród państw o wysokim dochodzie na jedną osobę nie ma państw o wysokim udziale rolnictwa w PKB; wśród państwo średnim dochodzie na jedną osobę 14,3% to państwa o wysokim udziale rolnictwa w PKB; wszystkie państwa (100%) o niskim dochodzie na mieszkańca są państwami o wysokim udziale rolnictwa w PKB. Kolejno dokonujemy takiego porównania dla pozostałych kategorii zmiennej zależnej, czyli dla średniego, a następnie niskiego udziału rolnictwa w PKB. Z rozkładu liczebności (tab. 4.2) i procentowego ich udziału (tab. 4.3) widać, że zależność między poziomem PKB na jednego mieszkańca a udziałem rolnictwa w PKB ma charakter zależności negatywnej, co potwierdza wyjściową hipotezę.
W państwach, gdzie mniej niż 3/4 ludności posiada umiejętność czytania i pisania wskaźnik określimy jako "niski". Pozostałe wartości zaliczymy do kategorii "średni". Zmienna umiejętność czytania i pisania dorosłych będzie miała następujący rozkład: Umiejętność
czytania i pisania
dorosłych
ni
Zakres
Wysoka
10
powyżej
Średnia
5 5
Niska Zobaczmy, jak po przekodowaniu (tab. 4.4).
97% 75%-97% poniżej 75%
wyglądałby
zapis danych z tabeli 4.1
Tabela 4.4. Państwo
PKB na
mieszkańca
Argentyna Australia Bangladesz Chiny Czechy Francja Hiszpania Hongkong Indie Japonia Kamerun Kenia Meksyk Niemcy Polska Rosja USA Turcja
Udział
głowę
w$
%
Wskaźnik
rolnictwa w PKB
płodności
Dorośli umiejący
czytać
i
pisać
średni
średni
średni
średni
wysoki niski niski
średni
wysoki wysoki
niski wysoki
wysoki niski
średni
średni
wysoki wysoki wysoki niski wysoki niski niski średni
średni
średni
niski niski niski wysoki niski wysoki wysoki
niski niski niski niski wysoki niski wysoki wysoki
wysoki wysoki wysoki
średni
średni
średni
wysoki
niski
średni
średni
średni
średni
niski niski niski
wysoki
średni
średni
niski wysoki
wysoki wysoki wysoki wysoki
średni
średni
średni
średni
niski
wysoki
niski wysoki
wysoki niski
Węgry
Zair
średni
niski wysoki niski niski
państwo średnim dochodzie na mieszkańca, w której naj liczniejsze powinno być środkowe pole kolumny (a nie pole najniższe). Jeśli przyjrzymy się danym z tabeli 4.4, to zauważymy kilka typów państw. Po pierwsze, państwa o wysokim dochodzie na mieszkańca, niskim udziale rolnictwa w PKB niskim wskaźniku
płodności oraz
wysokiej
Tabela 4.5.
Wskaźnik płodności według
w wybranych
państwach
Wskaźnik płodności
poziomu PKB na jednego (w %; N = 20) PKB/losobę
Suma
Średni
Niski
Niski
0,0 14,3 85,7
0,0 42,9 57,1
83,3 16,7 0,0
25,0 25,0 50,0
Suma
100,0
100,0
100,0
100,0
Średni
do~osłych. Po
drugie,
na średnim poziomie rozwoju ekonomicznego (PKB na mieszkańca, udział rolnictwa w PKB) a pod względem kulturowym nie odbiegające od państw wysoko rozwiniętych (wskaźnik płodności, wskaźnik umiejętności czytania i pisania dorosłych).
Zobaczmy, czy wzorzec ten zostanie zachowany w stosunku do zależności mię dzy poziomem PKB na mieszkańca a poziomem umiejętności czytania i pisania wśród dorosłych (tab. 4.6). Tabela 4.6.
Wskaźnik umiejętności
PKB na jednego
czytania i pisania dorosłych według poziomu w wybranych państwach (w %; N = 20)
mieszkańca
PKB/losobę
czytania i pisania
Suma
Wysoki
Średni
Niski
Niski
85,7 14,3 0,0
57,1 42,9 0,0
0,0 16,7 83,3
50,0 25,0 25,0
Suma
100,0
100,0
100,0
100,0
Wysoki Średni
mieszkańca
Wysoki
Wysoki
i pisania
rosłych. Te relacje pomiędzy tymi państwami tworzą w tabeli 4.5 idealną zależ ność negatywną. To co zakłóca tę relację, to byłe państwa socjalistyczne będące
Wskaźnik umiejętności
Utworzymy teraz tabele kontyngencji dla zależności między poziomem PKB na jednego mieszkańca a wskaźnikiem płodności (tab. 4.5), a następnie z poziomem wskaźnika umiejętności czytania i pisania wśród dorosłych (tab. 4.6).
umiejętności czytania
państwa o wszystkich wskaźnikach na poziomie średnim. Po trzecie, państwa o niskim dochodzie na osobę, wysokim udziale rolnictwa w PKB, wysokim wskaźniku płodności oraz niskim wskaźniku umiejętności czytania i pisania do-
Procentowy rozkład liczebności w tabeli 4.5 wskazuje na zależność negatywną ale nie całkowicie regularną. Od idealnego wzorca odbiega w tej tabeli kategoria
Zależność między dochodem na jednego mieszkańca a poziomem umiejętności czytania i pisania wśród dorosłych jest pozytywna. Idealny charakter tej zależności również i w tym przypadku został zakłócony przez kategorię państw o średnim dochodzie na jedną osobę, gdyż naj liczniejsze powinno być środkowe pole tej kolumny (a jest najwyższe). To znów konsekwencja nierównomiernego rozwoju byłych pallstw socjalistycznych.
Mam nadzieję, że w powyższym przykładzie udało mi się pokazać zalety ilustratywne i analityczne tabel kontyngencji. Są one wykorzystywane do wstępnej analizy oraz jako podstawa do bardziej skomplikowanych rozważań i procedur. Do tej pory określaliśmy związek między dwoma zmiennymi zamieszczonymi w tabeli na podstawie rozkładu liczebności w polach tej tabeli. Podejście ta-
Tabela 4.8.
kie jest bardzo nieprecyzyjne i skuteczne tylko wówczas, gdy związek ten jest bliski idealnemu (co w warunkach badawczych zdarza się niezmiernie rzadko). Zajmijmy się zatem bardziej precyzyjnymi sposobami mierzenia siły takiego
Zwiększenie
związku.
4.4. Miary
zależności dla
tabel dwa-na-dwa
W tabelach dwa-na-dwa każda ze zmiennych ma dwie kategorie, czyli każda jest zmienną dychotomiczną. Poziom pomiaru takich zmiennych jest nominalny lub porządkowy. Jeśli obie zmienne mierzone są na poziomie porządkowym, to ich kategorie zapisujemy w takim samym porządku (rosnącym lub malejącym), tak jak np. w tabeli 4.7.
Stosunek do kary
śmierci
Dochód do uczestniczenia w akcjach charytatywnych - - - - - - - Suma Wysoki Niski
Wysoka Niska
50 O
O 50
50 50
Suma
50
50
100
W tabeli 4.7 zestawiono charakterystykę stu osób ze względu na ich poziom dochodu (określony w kategoriach "wysoki" i "niski") oraz jednocześnie ich skłonność do uczestniczenia w akcjach charytatywnych (określoną też w dwóch kategoriach jako "wysoką" i "niską"). Proszę zwrócić uwagę na fakt, że w polach tabeli zamieszczono liczebności a nie rozkład procentowy odpowiedzi. Wszystkie prezentowane w tym podrozdziale miary zależności dwóch zmiennych będą obliczane w oparciu o rozkład liczebności kategorii tych zmiennych. Sądząc po rozkładzie liczebności w tabeli 4.7 mamy tu do czynienia z zależnością pozytywną, idealną· Jeśli w tabeli zamieszczamy zmienne mierzone w skali nominalnej, to kolejność ich kategorii ustawiamy w taki sposób, aby zakładany przez nas związek uwidocznił się w rozkładzie liczebności po przekątnej tabeli od lewego górnego rogu do prawego dolnego rogu, tak jak np. w tabeli 4.8.
W tym przypadku tylko 30 na 40 badanych osób udzieliło odpowiedzi idących w kierunku zależności idealnej. Dziesięć osób udzieliło odpowiedzi, które tę zależność zakłóciły. Niemniej jednak istnieje pozytywna zależność między stosunkiem respondentów do kary śmierci i do zwiększania uprawnień policji. To co nas interesuje, to zbadanie siły tego związku.
Suma
Za
Przeciw
Za Przeciw
15 5
5 15
20 20
Suma
20
20
40
Współczynnikiem,
który nam to umożliwia jest współczynnik Yula (Kendalla). Jest to prosta i łatwa w interpretacji miara związku między zmiennymi w tabelach dwa-na-dwa, niezależnie od skali ich pomiaru.
Współczynnik Yula,
Tabela 4.7. Skłonność
uprawniell policji
podobnie jak inne miary prezentowane w tym rozdziale, oblicza się na podstawie liczebności w wewnętrznych polach tabeli (to te pola, w których przecinają się kategorie obu zmiennych). Dla wygody i przejrzystości w dalszym ciągu naszych rozważań posługiwać się będziemy tylko tą częścią tabel a nie ich całością. Pola te oznaczamy kolejnymi literami alfabetu posuwając się po kolejnych wierszach od góry tabeli. a
b
c
d
Dla tabeli 4.7 50
O
O
50
będziemy
mieli:
a = 50, b = O, c = O, d = 50. W przypadku tabeli 4.8: 15
5
5
15
a = 15, b = 5, c = 5, d = 15. Wzór na obliczenie
współczynnika Yula
jest
następujący:
Q = ad - bc. ad+ bc
Wartość współczynnika Yula pokazuje nam zarówno siłę, jak i sposób powiąza nia między kategoriami zmiennych (gdy jest on dodatni oznacza to, że pierwsza kategoria zmiennej zależnej "łączy się" z pierwszą kategorią zmiennej niezależnej a gdy jest ujemny - pierwsza kategoria zmiennej zależnej "łączy się" z drugą kategorią zmiennej niezależnej; przestawienie kolejności kategorii zmienia znak współczynnika). Wartość ta zawiera się w przedziale od - l do l, im bezwzględnawartość Q jest bliższa jedności, tym związek silniejszy, z kolei im wartość ta jest bliższa zera, tym związek jest słabszy. Przy związku idealnym Q wynosi +1 lub -l, przy braku związku - O.
Policzmy współczynnik Yula dla danych z tabeli 4.7. Rozkład liczebności w tej tabeli wskazywał na związek idealny, zatem współczynnik Q powinien mieć wartość +l (gdyż pierwsza kategoria jednej zmiennej łączy się z pierwszą kategorią drugiej zmiennej a druga z drugą):
Q
=
pomiędzy stosunkiem do kary śmierci a stosunkiem do zwiększania uprawnień policji. Założenie tkwiące u podstaw badania związku tych dwóch cech, stanowiące sprawdzanąhipotezę, jest takie, że osoby o postawie aprobującej zaostrzenie norm prawnych będą odpowiadać "za" na oba pytania, a osoby o poglądach przeciwnych, na obydwa pytania odpowiedzą "jestem przeciw". Wszystkie odpowiedzi, które znalazły się w polach "a" i "d" są parami zgodności z naszym założeniem, a odpowiedzi z pól "b" i "c" są parami niezgodności ze sprawdzaną hipotezą· Współczynnik Yula stanowi odzwierciedlenie proporcji par zgodnych do niezgodnych w próbie. W tym przypadku mamy zatem 80% szans (prawdopodobieństwo 0,8) na to, że wylosowany respondent odpowie zgodnie z naszą hipotezą·
Załóżmy teraz, że rozkład liczebności przedstawia się jak w tabeli 4.10.
Tabela 4.10.
ad - bc 50 . 50 - O. O 2500 - O ad + bc = 50· 50 + O. O = 2500 + O = + 1.
·Jest tak, jak przypuszczaliśmy. Dla związku idealnego Q ma wartość 1. Załóż my, że rozkład liczebności (tab. 4.9) wskazuje na brak związku między zmiennymi.
25
25
25
Q
Współczynnik Q będzie wówczas miał wartość:
ad - bc 25 . 25 - 25 . 25 Q-~~-- ad + bc - 25 . 25 + 25 . 25
625 - 625 625 + 625
= _0_ = O. 1250
W przypadku braku związku Q ma wartość zero. Wróćmy do przykładu z tabeli 4.8, gdzie ten związek nie jest taki jednoznaczny. Zacznijmy od obliczenia współczynnika Q: ad - bc 15 . 15 - 5 . 5 225 - 25 200 Q = ad + bc = 15·15 + 5·5 = 225 + 25 = 250 = +0,8. Jeżeli zakres wartości Q wyznaczający siłę związku między dwiema zmiennymi został ustanowiony od O do l, to wartość 0,8 świadczy o bardzo silnym związku
O
35
45
Istnieje zależność między tymi dwoma zmiennymi ale me umiemy wstępnie ocenić jej siły. Obliczmy wartość współczynnika Q:
Tabela 4.9. 25
25
=
ad - bc 25·45 - 0·35 1125 - O 1125 ad + bc = 25·45 + 0·35 = 1125 + O = 1125 = +1.
Wartość współczynnika Yula wskazuje na taką sytuację, jak gdyby wszyscy respondenci udzielali odpowiedzi należących do par zgodności, co jawnie kłóci się z naszą wstępną obserwacją. Współczynnik Q nas w tym przypadku "oszukuje" a wszystko to za sprawą pola "b", którego liczebność wynosi O. W takiej sytuacji powinniśmy użyć innej miary do badania związku między zmiennymi. Miarą tą jest współczynnik phi (
j(a + b)(c + d)(a + c)(b + d)·
Obliczmy zatem
-v"22~5 8=C;:0C=.~60:=:==.40=::'5 =c.
1125 2323,79
--- =
+0,4841.
Zastosowanie współczynnika rp pozwoliło na prawidłowe określenie siły związ ku pomiędzy zmiennymi zawartymi w tabeli 4.10. Przypuszczaliśmy, że jest to zależność pozytywna (w sensie powiązań między kategoriami zmiennych) i dodatnia wartość miary związku to potwierdziła. Wiemy teraz również, że jest to związek o średniej sile. Abyśmy mieli pewność, że współczynnik rp jest miarą, za pomocą której możemy zmierzyć prawidłowo zależność idealną, obliczmy go dla danych z tabeli 4.7:
50 . 50 - O. O rp
2500 - O
2500
= \1'50.50.50.50 = )6250000 = 2500 = +1.
Dla zależności pozytywnej idealnej wartość współczynnika rp jest równa +1, tyle ile w takim przypadku wynosi wartość współczynnika Yula. Analogicznie będzie w sytuacji braku związku - wartość współczynnika rp będzie równa O. Sprawdźmy jeszcze przykład dotyczący badania zależności pomiędzy postawą wobec kary śmierci a skłonnością do przyznania większych uprawnień policji:
15 . 15 - 5 . 5 rp
225 - 25
obie nasze zmienne mierzone są na poziomie porząd kowym. Miarą pozwalającą nam ocenić siłę związku między takimi zmiennymi jest współczynnik gamma Goodmana i Kruskala. na
początek, że
Można powiedzieć, że
nym przypadkiem
następujący:
d '
gdzie Ps, to liczba par zgodności (tak jak zostały one zdefiniowane poprzednio) a Pd - liczba par niezgodności. Jeśli liczba par zgodnych jest większa niż liczba par niezgodnych, to będziemy mieć do czynienia z zależnością pozytywną· Przy równej liczbie par zgodnych i niezgodnych współczynnik gamma będzie się równał zero, co oczywiście oznacza brak związku. Jeśli liczba par zgodnych będzie mniejsza niż par niezgodnych, to współczynnik gamma będzie miał wartość ujemną, co będzie oznaczało zależność negatywną. Przedstawmy hipotetyczne rozkłady liczebności ilustrujące opisane prawidłowości. 10
o
o
5
5
5
o
2
8
o
10
O
5
5
5
2
8
2
O
O
10
5
5
5
8
2
O
,= +1
,=0
,=
-0,94
przeanalizować algorytm
liczenia współczynnika gamma. Załóżmy, osób, sprawdzając ich skłonność do uczestniczenia w akcjach charytatywnych. Zmiennej tej przyporządkowaliśmy trzy kategorie: wysoka, średnia, niska. Następnie zaklasyfikowaliśmy każdą z tych osób do jednej z trzech kategorii dochodu (wysoki, średni, niski). Przypuszczamy, że istnieje związek pomiędzy poziomem dochodu a skłonnością do uczestniczenia w akcjach charytatywnych. Rozkład liczebności według obu zmiennych ułożył się jak w tabeli 4.11. że przebadaliśmy 20
tabel n-przez-n
W sytuacji gdy wymiary tabeli są większe niż 2 x 2, tzn. zmienne mają wię cej niż dwie kategorie odpowiedzi, pierwszą kwestią, jaką musimy ustalić, jest poziom pomiaru zmiennych, których związek badamy. Od tego bowiem będzie zależało, którą miarę związku należy zastosować. Zmienne zamieszczane w tabelach najczęściej są mierzone na poziomach słabych, bądź ich poziom pomiaru w celu przejrzystości prezentacji jest zaniżany do takich. Załóżmy
jest
d
Spróbujmy
rp jest zawsze niższa niż wartość współczynnika Yula dla tego samego zestawu zmiennych (z wyjątkiem skrajnych wartości: O dla braku związku i +1 lub -1 dla związku idealnego). Należy o tym pamiętać dokonując porównań siły związku dla różnych zestawów zmiennych trzeba zawsze odnosić się do poziomu wartości tego samego współczynnika.
związku dla
współczynnik gamma
-P ,= PsPs +P
200
= \1'20· 20 . 20 . 20 = \1'160000 = 400 = +0,5.
Wartość współczynnika
4.5. Miary
Wzór na
poznany przed
chwilą współczynnik Yula
współczynnika gamma
(dla tablic 2 x 2).
jest szczegól-
Tabela 4.11.
Skłonność
Wysoka Średnia
Niska
Skłonność
do uczestniczenia w akcjach charytatywnych kategorii dochodu
według
Dochód do uczestniczenia w akcjach charytatywnych - - - - - - - - - Wysoki Średni Niski
5 2 O
4
1
1 2
1
4
Licząc pary zgodne, rozpoczynamy od utworzenia szeregu tabel częściowych na takiej zasadzie, że dla każdego pola wewnętrznego tabeli (poczynając od lewego górnego rogu), posuwając się po wierszach, sprawdzamy jaka część tabeli znajduje się na prawo i w dół od tego pola.
Mamy teraz wszystkie wartości niezbędne do obliczenia współczynnikagamma:
Dla tabeli 4.11 mamy:
Ps - Pd 87 - 11 76 I = Ps + Pd = 87 + 11 = 98 = +0, 78.
1
5 4
2
2
1
4
4
2
4
1
4
4
gdzie 5 i 1 to kolejne wartości z pierwszego wiersza; dla ostatniej wartości z pierwszego wiersza (1) nie ma wartości na prawo i w dół; 2 i 4 to kolejne wartości drugiego wiersza i odpowiadające im części na prawo i w dół; dla pozostałych wartości nie ma już niczego na prawo i w dół tej tabeli. Kolejnym krokiem algorytmu jest obliczenie iloczynów pól my odpowiadających im wydzielonych części tabeli:
wewnętrznych i
su-
5(4 + 2 + 1 + 4) = 5(11) = 55, 1(2 + 4) = 1(6) = 6, 2(1 + 4) = 2(5) = 10, 4(4) = 16. Suma tych wszystkich
wartości
stanowi
liczbę
par zgodnych dla tabeli 4.11:
Ps = 55 + 6 + 10 + 16 = 87. Procedura liczenia liczby par niezgodnych jest odbiciem lustrzanym pokazanej części algorytmu. Zaczynamy od prawego górnego rogu i sprawdzamy wszystko na lewo i w dół w analizowanej tabeli. W omawianym
przykładzie mamy:
1 2
4
o
o
1
2
2
4
o
o
1
1(2 + 4 + O+ 1) = 1(7) = 7, 1(2 + O) = 1(2) = 2, III
2(0 + 1) = 2(1) 4(0) = O,
1
= 2,
zatem: P d = 7 + 2 + 2 + O = 11.
Związek pomiędzy wysokością dochodów i skłonnością do uczestniczenia w akcjach charytatywnych jest silną zależnościąpozytywną (trzeba wziąć pod uwagę fakt, że współczynnik gamma zawyża ocenę siły związku). Patrząc
na algorytm obliczania współczynnika gamma widzimy wyraźnie, jak tabeli pól wartości. Jeszcze raz podkreśl my, że współczynnik ten może być stosowany tylko w odniesieniu do zmiennych mierzonych na poziomie porządkowym, który taką kolejność na stałe ustanawia.
ważna jest kolejność występującychw
Jeżeli zmienne, których związek mamy zbadać, są mierzone na poziomie nominalnym i nie są dychotomiczne (tzn. mają więcej niż dwie kategorie), to siłę tego związku określamy w oparciu o współczynnik lambda Goodmana i Kruskala. Ponieważ kolejność kategorii zmiennej mierzonej w skali nominalnej jest wyznaczana arbitralnie, to współczynnik lambda nie wskazuje nam kierunku zależności a tylko jej siłę (ma wartość zawsze dodatnią). To, czy jest to zależność pozytywna, czy negatywna, określamy sami na podstawie rozkładu liczebności w tabeli.
Współczynnik lambda, inaczej niż dotychczas prezentowane miary związku, jest miarą asymetryczną. Oznacza to, że w zależności od tego, którą zmienną uznamy za zależną (tę zamieszczonąw kolumnach, czy tę zamieszczoną w wierszach), a którą za niezależną - wartość współczynnika lambda będzie ulegała zmianie dla tej samej tabeli statystycznej. Jeśli miara związku między dwoma zmiennymi zamieszczonymi w tabeli pozostaje taka sama, niezależnie od tego, czy zmienną niezale żną zamieścimy w kolumnach, czy w wierszach tabeli, to jest ona miarą symetryczną, np. współ czynnik gamma dla tabeli 4.11 ma wartość +0,78, niezależnie od tego, czy będziemy go liczyć dla tabeli takiej jak w tekście, czy też zmienne zamienimy miejscami. Załóżmy, że przeprowadziliśmy
badania wśród osób pochodzących z byłego o pozwolenie na pracę w Polsce. Pytaliśmy o to, jakiej są narodowości i w jakim charakterze mają być zatrudnieni w Polsce. Wyniki naszych dociekań zawarte są w tabeli 4.12. ZSRR,
ubiegających się
Przyjmijmy, tak jak możemy to wywnioskować z układu tabeli, że zmienną niezależną będzie dla nas narodowość a zmienną zależną typ zatrudnienia, o pozwolenie na który ubiegają się badani obcokrajowcy.
Tabela 4.12. Obcokrajowcy narodowości
Typ zatrudnienia
ubiegający się o pozwolenie na i typu zatrudnienia
pracę
w Polsce według
Rosjanie
Ukraińcy
Białorusini
Suma
Robotnicy Robotnicy rolni
10 20 10
15 15 20
20 5 5
45 40 35
Suma
40
50
30
120
Specjaliści
Rosjanie Typ zatrudnienia
Obie zmienne są mierzone w skali nominalnej, więc ich związek jest mierzony za pomocą współczynnika lambda
\=
/\
zmiennej
zależnej
Specjaliści
Robotnicy
Robotnicy rolni
10
20
10
40
Jeśli wszystkich Rosjan przyporządkujemydo kategorii "robotnicy" , to 20 osób zaklasyfikujemy prawidłowo a 20 nie (w tym 10 specjalistów i 10 robotników rolnych). Zatem dla Rosjan błąd przyporządkowaniabędzie wynosił 20.
Typ zatrudnienia
z
jest zatem
Suma
Ukraińcy
B z - BN B ·
Strategia liczenia wartości B z i B N, to pewnego typu gra, polegaj ąca na przewidywaniu wartości zmiennej zależnej dla każdej kategorii zmiennej niezależnej. Rozpoczynamy grę tak, jakbyśmy początkowo znali tylko liczebności brzegowe tabeli. Rozkład
Zaczynamy od obliczenia błędów cząstkowych oddzielnie dla każdej kategorii zmiennej niezależnej.
następujący:
Suma
Specjaliści
Robotnicy
Robotnicy rolni
15
15
20
50
Wśród Ukraińców najliczniejsząkategorię stanowią "robotnicy rolni". Jeśli założymy, że wszyscy Ukraińcy to "robotnicy rolni" , to pomylimy się w 15 przypadkach "specjalistów" i 15 przypadkach "robotników". Błąd przyporządkowa
nia w tej kategorii narodowości będzie równy 30.
Typ zatrudnienia Specjaliści
Robotnicy
Robotnicy rolni
45
40
35
Suma
Białorusini
Typ zatrudnienia
120
Gdybyśmy uznali, że wszystkie 120 badanych osób zaklasyfikujemy do najliczniejszej kategorii - do kategorii specjalistów - to 45 osób zaklasyfikowalibyśmy prawidłowo a 75 nie (w tym 40 robotników i 35 robotników rolnych). Zatem ogólna liczba błędów, jakie moglibyśmypopełnić przez takie przyporząd kowanie wynosi 75, i to jest Bz. Zauważmy, że jest to najmniejsza liczba błędów, jakie mogliśmy popełnić, przyporządkowując badanych do kategorii zmiennej zależnej. Jeśli przypisalibyśmy wszystkich do kategorii "robotników", to błęd nie przyporządkowalibyśmy 80 osób. W przypadku "robotników rolnych" błąd wzrósłby do 85. Zatem naszą strategią jest przypisanie wszystkich do najliczniejszej kategorii, aby popełnić jak najmniej błędów przyporządkowania:
B z = 40 robotników + 35 robotników rolnych = 75 Taka sama logika towarzyszy nam w wartości B N .
błędów
zmiennej
postępowaniu prowadzącym
zależnej.
do znalezienia
Suma
Specjaliści
Robotnicy
Robotnicy rolni
20
5
5
30
Jeśli uznamy, że wszyscy ubiegający się o pozwolenie na pracę Białorusini to
"specjaliści", to pomylimy się w 10 przypadkach (5 robotnikach i 5 robotnikach rolnych). Błąd przyporządkowaniadla Białorusinów wynosi 1o.
Suma błędów przyporządkowaniadla każdej kategorii zmiennej niezależnej stanowi nasze poszukiwane B N· W naszym
przykładzie:
BN
= 20(Rosjan) + 30(Ukraińców) + 10(Białorusinów) = = 60 błędów zmiennej niezależnej, Bz-BN Bz
A=----
75 - 60 = 15 = O 2. 75 75 '
i
Związek pomiędzy narodowością
ciele badanych
narodowości w
a typem pracy o jaki ubiegają się przedstawiPolsce istnieje, ale jest bardzo słaby.
Załóżmy teraz, że nie prowadzi się statystyki dotyczącej narodowości osób, którym udzielane jest pozwolenie na pracę. Zaznacza się jednak typ zajęć, na jakie wydano zezwolenie. Przeprowadzamy własne badania na 120 osobach ubiegających się o takie zezwolenie. Chcemy sprawdzić, czy znając typ zatrudnienia jesteśmy w stanie powiedzieć coś o narodowości osób otrzymujących zezwolenie. Wobec tego teraz jako zmienną niezależnąbędziemy traktować typ zatrudnienia a narodowość będzie zmienną zależną.
Dla tych samych danych z tabeli 4.12 mamy: B z = 40(Rosjan) BN dla specjalistów BN dla robotników BN dla robotników rolnych
+ 30(Białorusinów) = 70, 10(Rosjan) + 15(Ukraińców) = 25 + 5(Białorusinów) = 20 10(Rosjan) + 5(Białorusinów) = 15
15(Ukraińców)
więc
A = 70 - 60 = 10 = O 14. 70
70
Gdybyśmy dla przykładu prezentowanego w tabeli 4.11, ilustrującego związek wysokości dochodu ze skłonnością do udziału w akcjach charytatywnych obliczyli współczynnik lambda symetryczny, to wynosiłby on 0,44, podczas gdy współczynnik gamma dla tego przykładu miał wartość +0,78. Właściwy w tym
'
Możemy jednak spotkać się z sytuacją, w której każda ze zmiennych mierzona jest na innym poziomie. Wówczas stosujemy miary związku właściwe dla zmiennej mierzonej na słabszym poziomie. Jeśli jedna ze zmiennych byłaby mierzona na poziomie porządkowym a druga na nominalnym, to do mierzenia związku między nimi stosowalibyśmy współczynnik lambda.
Nie jest to jedyna sytuacja, w której stosujemy miary właściwe dla niższego niż tabeli poziomu pomiaru. Załóżmy, że rozkład liczebności w badaniach nad skłonnością do uczestniczenia w akcjach charytatywnych w zależ ności od poziomu dochodu przedstawia się jak w tabeli 4.13.
występujący w
Związek pomiędzy typem zatrudnienia a narodowością jest jeszcze słabszy niż w odwrotnym przypadku. Wyraźnie też zaznaczyła się asymetrycznośćwspół czynnika lambda.
w stanie wyrazme rozróżnić, która ze zmiennych jest niezależna, a która zależna. Jeśli dysponujemy obydwoma współczynnikami lambda, to możemy policzyć jedną, wówczas symetryczną, miarę lambda dla danej tabeli, która jest kombinacją lambdy liczonej po wierszach i po kolumnach. W przedstawionym przykładzie wskazalibyśmy raczej na narodowość, jako zmienną niezależną a typ zatrudnienia, jako zmienną zależną. Skoro jednak mamy wyznaczone oba współczynniki lambda to obliczmy też ich wersję symeCzasem nie
współczynnik gamma.
przypadku jest
~=60
a
Badając związek między dwoma zmiennymi zaprezentowanymi w tabeli statystycznej, musimy zwracać uwagę na to, na jakich poziomach są mierzone te zmienne. W prezentowanych powyżej przykładach obie zmienne były mierzone na takich samych poziomach: obie na poziomie nominalnym, bądź obie na poziomie porządkowym. Używamy wówczas właściwych dla danych poziomów i rozmiarów tablic miar.
jesteśmy
tryczną:
A = (75 - 60) + (70 - 60) = O 172. 75 + 70 '
Przy stosowaniu współczynnika lambda trzeba pamiętać o jego ograniczeniu. Jeżeli wszystkie liczebności modalne dla każdej kategorii zmiennej niezależnej należą do tej samej kategorii zmiennej zależnej, to lambda będzie wynosić zero, nawet wtedy, gdy zmienne będą w rzeczywistości powiązane.
Tabela 4.13.
Skłonność do
Skłonność
do uczestniczenia w akcjach charytatywnych kategorii dochodu
uczestniczenia w akcjach charytatywnych
według
Dochód
---------~
Wysoki
Średni
Niski
15 5
O 5
15
O
15
Wysoka Średnia Niska
mierzone na poziomie porządkowym, więc aby zmierzyć sinimi należy policzyć współczynnik gamma. Zaczynamy od obliczenia liczby par zgodnych i niezgodnych:
Obie zmienne
są
5 O
łę związku między
III
pary zgodne: 15(5 + 5 + 15 + O) = 15(25) = 375, 5(15 + O) = 5(15) = 75,
Ps = 450,
pary niezgodne:
'Wartość symetrycznego współczynnik lambda jest zatem następująca:
15(5 + 5 + O+ 15) = 15(25) = 375, 5(0 + 15) = 5(15) = 75, Pd
= 450,
zatem:
= Ps - Pd I
=
Ps + Pd
450 - 450 450 + 450
=
~ 900
=
O .
Wartość współczynnika gamma wskazuje na brak związku pomiędzy poziomem dochodu a skłonnością do brania udziału w akcjach charytatywnych. Takie stwierdzenie kłóci się ze zdrowym rozsądkiem opartym o intuicyjną interpretację danych zawartych w tabeli. Widzimy bowiem, że badani różnią się swoją postawą wobec akcji charytatywnych w taki sposób, iż osoby o wysokich i niskich dochodach są tak samo skłonne uczestniczyć w tych akcjach, w odróżnieniu od osób o średnich dochodach, które nie są skłonne do takich zachowal1.
Całe to zamieszanie spowodował specyficzny rozkład częstości w tabeli. Do tej pory byliśmy skłonni uważać, że istnieje zależność między zmiennymi, jeśli czę stości układały się po przekątnej tabeli. Tego typu zależność jest zależnością monotoniczną· W tabeli 4.13 częstości układają się nie po przekątnej, tylko w kształcie zbliżonym do paraboli. Oznacza to, że związek między zmiennymi istnieje, ale jest to zależność niemonotoniczna. W takim przypadku do zmierzenia tego związku stosujemy miary właściwe dla niższego poziomu pomiaru,
tu -
współczynnik
lambda.
W przypadku, gdy za zmienną zależną przyjmiemy skłonność do uczestnictwa w akcjach charytatywnych współczynnik lambda wynosi:
Bz
=
30,
B N =5+5+5=15, Bz-BN 30-15 A= = Bz 30 Jeśli za zmienną zależną przyjmiemy
Bz
- BN
15 30
= -
=
0,5.
Wskazuje ona na istnienie między badanymi zmiennymi związku o średniej sile. Taki wniosek zgodny jest z naszymi intuicyjnymi ocenami. Zatem w przypadku podejrzenia o niemonotoniczny charakter zależności między zmiennymi do badania ich związku należy stosować współczynnik lambda. Jest on miarą bardziej czułą na różnorodne typy zależności.
4.6. Trzecia zmienna Do tej pory rozważaliśmy związek między dwiema zmiennymi. Teraz do tego układu wprowadźmy trzecią zmienną. Będziemy ją nazywać zmienną kontrolną· Jaki zatem wpływ może mieć ta zmienna na pierwotny związek między zmienną niezależną i zależną (załóżmy
skrajne możliwości):
zmienna kontrolna nie ma żadnego wpływu na pierwotny związek; obecność zmiennej kontrolnej zmienia całkowicie pierwotny związek;
zmienna kontrolna jest konieczna, aby pierwotny związek zaistniał. Jeżeli pierwotny związek między zmienną niezależną i zależną jest przedstawiony w tabeli kontyngencji, to wprowadzając zmienną kontrolną do tego związku dokonujemy rozbicia tej tabeli na tabele częściowe, tzn. dla każdej kategorii zmiennej kontrolnej utworzymy osobną tabelę dla zmiennej niezależnej i zależnej. Aby odejść na chwilę od konwencji zależności idealnych odwołajmy się do danych pochodzących z Połskiego Generałnego Sondażu Społecznego z roku 1995.
uważa Pan(i), że powinno się zezwolić na eutanazję na żądanie pacjenta?", przy następującej kategoryzacji
odpowiedzi: tak, nie, nie wiem.
Sprawdźmy na początek, czy istnieje różnica w poglądach kobiet i mężczyzn na tę kwestię (tab. 4.14).
dochód:
40 - 25 40
0,43.
\/Vśród prawic czterystu zmieIlIlych tego sondażu znalazła się zmienna bada-
B N = 15 + 10 + O = 25, Bz
=
jąca stosunek respondentów do eutanazji. Pytanie w sondażu brzmiało: "czy
= 40,
A = Bz
A= (30-15)+(40-25) 30 + 40
=
15 40
=
O38. '
Sądząc po rozkładzie liczebności i ich procentowym udziale, płeć nie różnicuje poglądów na kwestię eutanazji na życzenie pacjenta. Około połowa badanych mężczyzn i kobiet byłoby skłonnych takiego przyzwolenia udzielić, po kilkanaście procent nie jest zdecydowanych, a reszta jest eutanazji przeciwna.
Tabela 4.16.
Tabela 4.14.
Tabela krzyżowa POZWOLIĆ NA EUTANAZJĘ -Z/J.Ż.ĄDA PACJENT' PŁEĆ RESPONDENTA * WIARA W ŻYCIE PO ŚMIERCI
Tabela krzyżowa POZWOLIĆ NA EUTANAZJĘ - ZAŻĄDA PACJENT * PŁEĆ RESPONDENTA
PŁEĆ RE8PONDENTA:
PŁEĆ RE8PONDENTA: 1=M,2=KOB MĘŻCZYZNA POZWOLIĆ NA EUTANAZJĘ ZAZĄDA PACJENT
Tak,
zezwalać
Liczebność
% z PŁEĆ RE8P. 1=M,2=KOB Liczebność
% z PŁEĆ RE8P. 1=M,2=KOB Liczebność
Ogólem
Tak
812
437
MĘŻCZYZNA
POZWOLIĆ NA EUTANAZJĘZAZĄDA
Liczebność
NIE WIEM
Ogółem
KOBIETA
375
% z PŁEĆ RE8P. 1=M,2=KOB Nie
1=M,2=KOB WIARA W ŻYCIE PO ŚMIERCI
% z PŁEĆ RE8P. 1=M,2=KOB
52,0%
49,0%
51,0%
257
326
583
36,0%
37,0%
36,0%
84
121
205
12,0%
14,0%
13,0%
716
884
1600
100,0%
100,0%
100,0%
Tak, zezwalać
% z PŁEĆ RE8P. 1=M,2=KOB
PACJENT
Liczebność
Nie
% z PŁEĆ RE8P. 1=M,2=KOB
NIE WIEM
Liczebność
% z PŁEĆ RE8P. 1=M,2=KOB Nie
POZWOLIĆ NA
Tak,
zezwalać
-
Liczebność
% z PŁEĆ RE8P. 1=M,2=KOB
Poszukajmy zatem innej zmiennej, która może różnicować poglądy w tej sprawie. Być może wiara w życie po śmierci miałaby takie znaczenie (tab. 4.15).
NIE WIEM
Liczebność
Ogółem
% z PŁEĆ RE8P. 1=M,2=KOB
Tabela krzyżowa POZWOLIĆ NA EUTANAZJĘ·ZAŻĄDA PACJENT * WIARA W ZYCIE PO ŚMIERCI
TRUDNO POWIEDZIEĆ
WIARA W ŻYCIE PO ŚMIERCI
POZWOLIĆ NA EUTANAZJĘ -
Tak,
zezwalać
Liczebność
% z WIARA W ŻYCIE PO ŚMIERCI Nie
Liczebność
% z WIARA W ŻYCIE PO ŚMIERCI NIE WIEM
Liczebność
% z WIARA W ŻYCIE PO ŚMIERCI Ogółem
Liczebność
% z WIARA W ŻYCIE PO ŚMIERCI
widać
245
124
812
65,0%
50,0%
51,0%
101
61
583
27,0%
25,0%
36,0%
111
33
61
205
11,0%
9,0%
25,0%
13,0%
975
379
246
1600
100,0%
100,0%
100,0%
100,0%
najmniej skłonne do wyrażenia zgody na eutanazję są osoby, które w życie pozagrobowe a największe przyzwolenie występuje wśród tych, którzy w takie życie nie wierzą. Pamiętając o tym, że płeć nie miała bezpośredniego wpływu na poglądy w kwestii eutanazji posłużmy się zmienną wiara w życie po śmierci, jako zmienną kontrolną. Efekt przedstawia tabela 4.16. Jak
wierzą
Tak,
zezwalać
PACJENT
EUTANAZJĘ
ZAżĄDA
Liczebność
% z PŁEĆ RE8P. 1=M,2=KOB
Ogółem
443
43,0%
POZWOLIĆ NA
Nie
45,0% 421
Liczebność
% z PŁEĆ RE8P. 1=M,2=KOB
Tabela 4.15.
ZAżĄDA PACJENT
Liczebność
% z PŁEĆ RE8P. 1=M,2=KOB Nie
Nie
z PŁEĆ RE8P.
1=M,2=KOB Ogółem
Z/J.Ż.ĄDA PACJENT
Tak
Liczebność
%
EUTANAZJĘ
TRUDNO POWIEDZlEC
Liczebność
Liczebność
% z PŁEĆ RE8P. 1=M,2=KOB
NIE WIEM
Liczebność
% z PŁEĆ RE8P. 1=M,2=KOB Ogółem
Liczebność
% z PŁEĆ RE8P. 1=M.2=KOB
178
KOBIETA 265
44,0%
47,0%
Ogółem
443 45,0%
184
237
421
45,0%
42,0%
43,0%
46
65
111
11,0%
11,0%
11,0%
408
567
975
100,0%
100,0%
100,0%
142
103
245
71,0%
58,0%
65,0%
43
58
101
21,0%
33,0%
27,0%
16
17
33
8,0%
10,0%
9,0%
201
178
379
100,0%
100,0%
100,0%
55
69
124
51,0%
50,0%
50,0%
30
31
61
28,0%
22,0%
25,0%
22
39
61
21,0%
28,0%
25,0%
107
139
246
100,0%
100,0%
100,0%
Widzimy, że płeć w dalszym ciągu nie ma charakteru różnicującego w odniesieniu do osób, które wierzą w życie po śmierci oraz takich, które nie mają w tej kwestii zdania. Natomiast w odniesieniu do osób, które w życie po śmier ci nie wierzą, zależność między płcią a zgodą na eutanazję zmienia się w sposób zasadniczy. W tej grupie respondenci mają najbardziej sprecyzowane poglądy w kwestii eutanazji (naj mniejszy procentowy udział odpowiedzi "nie wiem"), przy czym mężczyźni są zdecydowanie bardziej skłonni do przyznania pacjentowi prawa do eutanazji niż kobiety.
Z przedstawionego przykładu wynika, że nawet w ramach trzech zmiennych moo różnym typie wpływu zmiennej kontrolnej na związek między zmienną niezależną i zależną (brak wpływu w odniesieniu do dwóch kategorii zmiennej kontrolnej i istotny wpływ w odniesieniu do jednej kategorii tej zmiennej). żemy mówić
Załóżmy
teraz, że pierwotna zależność między płcią a zgodą na eutanazję dla
całej badanej grupy wygląda w sposób zbliżony do takiego, jaki występował wśród osób nie wierzących w życie po śmierci. (Przedstawiane poniżej dane będą miały charakter modelowy i ilustratywny i tylko w nazwach zmiennych będą się odwoływać do rzeczywistej sytuacji badawczej.) Wobec tego zależność między płcią
(zmienna niezależna) a poglądami w kwestii dostępno§ci eutanazji na życzenie pacjenta (zmienna zależna) przedstawiona w formie tabeli z procentowym rozkładem odpowiedzi przybrałaby następującą formę (tab. 4.17):
pozwolić się
pacjentowi na
eutanazję
na
życzenie
Mężczyzna
Kobieta
70 20 10
55 35 10
100%
100%
Tak Nie Nie wiem Suma
Taki rozkład odpowiedzi wskazuje, że istnieje związek między zaprezentowanymi w tabeli zmiennymi. Spróbujmy zatem ponownie wprowadzić zmienną wiara w życie po §mierci jako zmienną kontrolną i załóżmy, że procentowy rozkład odpowiedzi byłby taki jak w tabeli 4.18. Tabela 4.18.
Nie
Trudno
powiedzieć
M
K
M
K
M
K
Tak Nie Nie wiem
32 59 9
31 58
90 2 8
89 3 8
50 25 25
50 25 25
100%
100%
Suma
4.7. Modele przyczynowe Analiza zależności w tabelach i tabelach częściowych służy nam do określenia charakteru zależności między zmiennymi: niezależną (N), zależną (Z) i kontrolną (K). Łącznie z badaną hipotezą ma to prowadzić do zbudowania modelu przyczynowego, obrazującego wzajemne zależności i uwarunkowania badanego zjawiska.
100% 100% 100% 100%
w tabeli kontyngencji możemy przedstawić
na rysunku 4.1.
N ------ Z Rysunek 4.1. Większość
prezentowanych dotychczas przykładów tabel miała taką postać. Stanowi ona podstawę wyjściową modelu przyczynowego.
Wprowadźmy teraz zmienną kontrolną i
rozpatrzmy jej możliwy wpływ na ten pierwotny związek. Istotne relacje między zmiennymi i ich kierunek zostaną oznaczone strzałką, natomiast te, które zanikają będą przedstawione w postaci linii przerywanej. Wprowadzając do
Tak
Powinno pozwolić się pacjentowi na eutanazję na życzenie
11
dla każdej tabeli częściowej tzn. dla każdej kategorii zmiennej kontrolnej (dla tych, którzy wierzą w życie po śmierci; dla tych, którzy nie wierzą w to oraz dla tych, którym trudno to określić) związek między zmienną niezależną a zależną nie istnieje (procentowy rozkład liczebności dla kobiet (K) i mężczyzn (M) jest zbliżony, tab. 4.18). W takiej sytuacji pierwotna zależność między tymi zmiennymi nosi nazwę zależności pozornej.
Podstawową zależność, jaką badamy
Tabela 4.17.
Powinno
że
modelu
zmienną kontrolną możemy stworzyć hipotezę alter-
natywną w wyjaśnianiu zmiennej zależnej dla zmiennej niezależnej (rys. 4.2).
Rysunek 4.2.
Obrazuje on sytuację, w której pierwotna zależność miQdzy zmienną niezależną (płcią) a zmienną zależną (przyzwolenie lub nie, na eutanazję na życzenie) znika pod wpływem zmiennej kontrolnej (wiara w życie po §mier'Ci). \iVidać,
W takiej sytuacji siła danego związku będzie stanowiła o tym, który z nich stanie siQ dla nas eksplanacyjnie istotniejszy. Sprawdzaliśmy np. związek między
l!
płcią a
stosunkiem do eutanazji, a następnie między wiarą w życie po śmierci a stosunkiem do eutanazji. Ten drugi związek okazał się dla nas analitycznie ciekawszy. Zmienna kontrolna może nie mieć żadnego wpływu na relację zachodzącą mię dzy zmiennymi niezależną i zależną (rys. 4.3). Rysunek 4.5.
N
:~z
I I I
/
/
K Rysunek 4.3.
Wówczas pomijamy ją w budowie modelu aby nie komplikować jego obrazu tak było w przypadku osób wierzących w życie po śmierci i braku związku mię dzy płcią a stosunkiem do eutanazji w ogóle i dla tej kategorii w szczególności. Kolejną formą modelu przyczynowego, jaka może się pojawić w układzie trzech zmiennych jest zależność pozorna. Oznacza to, że wprowadzenie zmiennej kontrolnej powoduje zniknięcie relacji między zmienną niezależną a zależną (rys. 4.4).
N
Rysunek 4.4.
Z przykładem to ilustrującym mieliśmy do czynienia w poprzednim podrozdziale. Może również wystąpić sytuacja, w której zależność między zmienną niezależną
Zaprezentowane powyżej modele przyczynowe są użytecznym narzędziem analizy danych. Naszym zadaniem jest na ogół przeprowadzenie analizy modeli o wyższym stopniu złożoności, zawierającychwięcej zmiennych oraz o bardziej złożonych związkach między nimi. Jednakże logika badania takich związków opiera się na zaprezentowanych tu podstawach. wstępnej
11111111
Wstępem
do budowy modeli przyczynowych jest związek dwóch zmiennych. musimy brać pod uwagę liczbę kategorii obu zmiennych (rozmiar tablicy) oraz ich poziom pomiaru. Analizując go
Programy komputerowe oferują zwykle spory zestaw miar zadaniem jest wybór miary właściwej do badanej sytuacji.
zależności.
Naszym
Oprócz tych miar, które zostały dokładnie opisane w tym rozdziale i im podobnych, jak współczynniki Kendalla tau-b dla tabel o takiej samej liczbie kolumn i wierszy oraz tau-c dla tabel, w których liczba kolumn jest różna od liczby wierszy, stosuje się również współczynnik kontyngencji C Pearsona lub współ czynnik V Cramera, które są zbudowane na innych zasadach i przeznaczone dla tabel o wymiarach większych niż 2 x 2. Zostaną one omówione w rozdziale 7. Wszystkie te miary można obliczyć, za pomocą programów komputerowych, w odniesieniu do zmiennych w ich pierwotnej postaci (bez konieczności fizycznej konstrukcji tabel). Tabel warto używać w celu prostej ilustracji analizowanych zmiennych, tając jednak o ich wszystkich zaletach i wadach.
pamię
a zmienną zależną występuje tylko w obecności zmiennej kontrolnej (rys. 4.5). Wówczas zmienną kontrolna pełni funkcję zmiennej pośredniczącej, a zmienna niezależna jest wobec niej zmienną poprzedzającą, zatem zależność między zmienną niezależną a zmienną zależną nie jest zależnością bezpośrednią. Tak jak to miało miejsce w związku między płcią a stosunkiem do eutanazji wśród osób nie wierzących w życie po śmierci.
Ćwiczenia Ćwiczenie 4.1.
Policz odpowiednie miary oraz 4.15.
związku dla
tabel 1.5, 1.6, 1.7, 1.8, 4.2, 4.5, 4.6, 4.14
Co
może zrobić
- tu nominalnego. Taką miarą była dla nas lambda. Oprócz lambdy SPSS liczy automatycznie współczynnik tau Goodmana i Kruskala (rys. 4.7).
za nas komputer
W prezentowanym przykładzie wykorzystamy analizowane już zmienne pochodzące z PGSS (za ich pomocą prezentowaliśmy wprowadzanie zmiennej kontrolnej do badania związku dwóch zmiennych). Dane w tekście pochodziły z badań z roku 1995, te prezentowane poniżej dotyczą roku 1999. Związkiem, jaki badaliśmy najpierw, był związek między płcią respondenta a jego skłonnością do przyzwolenia na eutanazję. Obie zmienne były mierzone na poziomie nominalnym. Tu, w celu pokazania różnych miar związku, przekodujemy zmienną nominalną przyzwolenie na eutanazję:
Miary kierunkowe Asymptotyczny Wartość
Nominalna przez Nominalna
Lambda
Symetryczna PRZYZWOLENIE NA EUTANAZJĘ
Zmienna
Tau Goodmana i
Kruskala
na zmienną porządkową (kategorię "nie wiem" zmienimy na zgadzam, ani się nie zgadzam"):
kategorię
"ani
PŁEĆ
Teraz utworzymy
jako
zmienną niezależną, a
eutanazję jako zmienną zależną
MEZCZYZNA się
Liczebność % z PŁEĆ RESP.
1=M,2=KOB
ani się zgadzam, ani nie zgadzam nie, nie zgadzam
się
Liczebność % z PŁEĆ RESP. 1=M,2=KOB
Liczebność % z PŁEĆ RESP. 1=M,2=KOB
Ogótem
,000
,000
,000
,000
,008
,004
,000e
,011
,006
,002"
b
b
b
b
hipotezy zerowej.
Rysunek 4.7.
re(rys. 4.6).
Liczebność % z PŁEĆ RESP. 1=M,2=KOB
Ogółem
KOBIETA
Wartość współczynnika lambda wskazuje na brak związku między płcią a przyzwoleniem na eutanazję (pamiętamy jednak o ograniczeniu lambdy, które tu ma miejsce). Współczynnik tau niesie informację, że badany związek jest naprawdę bliski zera. Przewidując postawy wobec eutanazji na podstawie płci można zredukować błąd
PŁEĆ RESPONDENTA: 1=M, 2=KOB
tak, zgadzam
,000
c. W oparciu o aproksymację rozkładu chi-kwadrat.
Tabela krzyżowa: PRZYZWOLENIE NA EUTANAZJĘ * PŁEC RESPONDENTA
PRZYZWOLENIE NA EUTANAZJĘ
,000
b. Nie może być obliczone, ponieważ asymptotyczny błąd standardowy wynosi zero.
tabelę krzyżową między płcią,
przyzwolenie na
zakładając
Istotność przybliżona
zależna:
RESPONDENTA: 1=M,2=KOB a. Nie
kodowaną zmienną
Zmienna zależna: PRZYZWOLENIE NA EUTANAZJĘ Zmienna
się
1. tak, zgadzam się 2. ani się zgadzam, ani się nie zgadzam 3. nie, nie zgadzam się.
T
zależna:
RESPONDENTA: 1=M,2=KOB
się
Przybliżone
Zmienna zależna:
PŁEĆ
1. tak, zgadzam się 2. nie, nie zgadzam 3. nie wiem
błąd
standardowya
266
300
566
56%
47%
50%
65
85
150
14%
13%
13%
145
260
405
30%
40%
36%
476
645
1121
100%
100%
100%
o 0,8%.
Miary oparte na chi-kwadrat potwierdzają ten śladowy związek (rys. 4.8). Zostaną one omówione w rozdziale 7. Miary symetryczne
Wartość
Nominalna przez Nominalna
,104 ,104
,002
,104
,002
kontyngencji
1121
N Ważnych obserwacji a. Nie
Wybierzmy i obliczmy odpowiednie miary zależności dla zmiennej nominalnej płeć i zmiennej porządkowej przyzwolenie na eutanazję. Pamiętamy o tym, że w takim przypadku stosujemy miary właściwe dla niższego poziomu pomiaru
zakładając
,002
Phi V Kramera Współczynnik
Rysunek 4.6.
Istotność przybliżona
hipotezy zerowej.
b. Użyto asymptotyczny błąd standardowy, przy zalożeniu hipotezy zerowej.
Rysunek 4.8.
Następną próbą, jaką podjęliśmy poszukując zróżnicowania postaw wobec eutanazji, było sprawdzenie zależności między wiarą w życie po śmierci a stosunkiem do eutanazji. Pierwotnie obie zmienne były mierzone na poziomie nominalnym. Skoro przekodowaliśmy postawy wobec eutanazji na zmienną porządkową, to przekodujmy zmienną nominalną wiara w życie po śmierci:
1. tak 2. nie 3. trudno
Miary symetryczne Asymptotyczny błąd Wartość Porządkowa
przez
Porządkowa
N
Ważnych
a. Nie
a
Przybliżone 1"
istotność przybliżona
tau-b Kendalla
-,186
,026
-6,950
,000
Gamma
-,334
,046
-6,950
,000
obserwacji
zakładając
standardowy
1121
hipotezy zerowej.
b. Użyto asymptotyczny btąd standardowy, przy zalożeniu hipotezy zerowej.
powiedzieć
Rysunek 4.10.
na zmienną porządkową (kategorię "trudno powiedzieć" zmienimy na kategorię "ani tak, ani nie"):
Tabela krzyżowa: PRZYZWOLENIE NA EUTANAZJĘ' PŁEĆ RESPONDENTA' WIARA W ŻYCIE PO ŚMIERCI
1. tak 2. ani tak, am me 3. nie
PŁEĆ RESPONDENTA: 1~M. 2~KOB
Utwórzmy tabelę pomiędzy wiarą w życie po śmierci, jako zmienną niezależną, a przyzwoleniem na eutanazję jako zmienną zależną (rys. 4.9).
WIARA W ŻYCIE PO ŚMIERCI Tak
PRZYZWOLENIE NA EUTANAZJĘ
tak, zgadzam się
Liczebność
% z PŁEĆ RESP. 1 M,2-KOB
ani się zgadzam, ani nie zgadzam
Liczebność
% z PŁEĆ RESP.
1=M,2=KOB
Tabela krzyżowa: PRZYZWOLENIE NA EUTANAZJĘ'WIARA W ŻYCIE PO ŚMIERCI
nie, nie zgadzam się
WIARA W ŻYCIE PO ŚMIERCI Ani tak, ani nie
Tak PRZYZWOLENIE NA EUTANAZJĘ
Tak, zgadzam się
Liczebność
%zWIARAW ŻYCIE PO ŚMIERCI
Ani się zgadzam, ani nie zgadzam
Nie, nie zgadzam się
Liczebność
Ogółem
Ogółem
339
70
157
566
46%
43%
74%
50% 150
87
48
15
12%
29%
7%
13%
Liczebność
319
46
40
405
Liczebność
%zWIARAW ŻYCIE PO ŚMIERCI
Liczebność
% z PŁEĆ RESP. 1 M,2 KOB
Ogółem
Nie
%zWIARAW ŻYCIE PO ŚMIERCI
% z WIARA W ŻYCIE PO ŚMIERCI
Liczebność
% z PŁEĆ RESP. 1 M,2 KOB
PRZYZWOLENIE NA EUTANAZJĘ
tak, zgadzam
się
Liczebność
%, z PŁEĆ RESP. 1 M,2 KOB
ani się zgadzam, ani nie zgadzam
Liczebność
% z PŁEĆ RESP.
1=M,2=KQB
nie, nie zgadzam
się
Liczebność
% z PŁEĆ RESP.
43%
28%
19%
36%
745
164
212
1121
100%
100%
100%
Ani tak, ani nie
1 M,2 KOB
09ółem
Liczebność
% z PŁEĆ RESP. 1 M,2 KOB
100% Nie
Rysunek 4.9.
Obie zmienne są mierzone na poziomie porządkowym, zatem współczynnikiem mierzącym siłę ich związku będzie gamma. Dodatkowo oczekujemy, że miara ta będzie w tym przypadku ujemna, gdyż zakładamy, iż osoby wierzące w życie po śmierci nie będą skłonne do wyrażania zgody na eutanazję a osoby nie wierzące w życie po śmierci taką zgodę wyrażą.
Zależność pomiędzy zmiennymi wiara w życie po śmierci a przyzwolenie na eutanazję (zmienne porządkowe) przedstawia rysunek 4.10.
PRZYZWOLENIE NA EUTANAZJĘ
tak, zgadzam
się
Liczebność
% z PŁEĆ RESP. 1 M,2 KOB
ani się zgadzam, ani nie zgadzam
nie, nie zgadzam
się
Liczebność
% z PŁEĆ RESP. 1=M,2=KOB Liczebność
% z PŁEĆ RESP. 1-M,2 KOB Ogółem
Liczebność
% z PŁEĆ RESP. 1 M,2 KOB
Rysunek 4.11.
MĘŻCZYZNA
KOBIETA
146
193
339
50%
43%
46%
09 ólem
33
54
87
11%
12%
12%
112
207
319
38%
46%
43%
291
454
745
100%
100%
100%
31
39
70
45%
41%
43%
24
24
48
35%
25%
29%
14
32
46
20%
34%
28%
69
95
164
100%
100%
100%
89
68
157
77%
71%
74%
8
7
15
7%
7%
7%
19
21
40
16%
22%
19%
116
96
212
100%
100%
100%
Rzeczywiście
gamma ma wartość ujemną. Jak na związek pomiędzy zmiennymi to ma też całkiem przyzwoitą wartość (pamiętamy, że gamma "zawyża" siłę związku). To, co może nas szczególnie niepokoić, to duża liczebność pola, dla którego odpowiedź na oba pytania jest "tak". To jest wbrew założeniom związku ujemnego.
jakościowymi,
Ponieważ tabela ma jednakową liczbę kolumn i wierszy, liczymy tau-b. Związek nadal jest ujemny, ale teraz jego siła wydaje się bardziej "adekwatna" do tego, co widać w oknie tabeli.
Na koniec potraktujmy zmienną wiara w życie po śmierci, jako zmienną kontrolną wobec związku płci i przyzwolenia na eutanazję (rys. 4.11). życie
śmierci nie wpływa w sposób widoczny na respondenta a jego stosunkiem do eutanazji. Miary związku dla poszczególnych podtabel to potwierdzają (rys. 4.12).
po
pierwotną zależność pomiędzy płcią
Miary symetryczne
WIARA W ŻYCIE PO ŚMIERCI
Istotność Wartość
Nominalna przez Nominalna
Tak
N
Ani tak, ani nie
Ważnych
N zakładając
Ważnych
Phi
,077
,109
,077
,109
Phi
,155
,140
V Kramera
,155
,140
Phi
,072
,577
V Kramera
,072
,577
745
obserwacji
Nominalna przez Nominalna
przybliżona
V Kramera
obserwacji
Nominalna przez Nominalna N
Nie
a. Nie
Ważnych
164
obserwacji
212
hipotezy zerowej.
b. Użyto asymptotyczny bląd standardowy, przy zalożeniu hipotezy zerowej.
Rysunek 4.12. Używamy
1. Blalock M. H.: Statystyka dla socjologów. Warszawa, PWN 1977.
2.
Brzeziński
J.: Metodologia
badań
psychologicznych. Wyd. 3. Warszawa, PWN
1999. 3. Frankfort-Nachmias Ch., Nachmias D.: Metody badawcze w naukach Poznań, Zysk i S-ka 2001.
Sprawdźmy inną miarę związku.
Zmienna kontrolna wiara w
Literatura
tu miar, które nie zostały jeszcze szczegółowo omówione, ze na ograniczenia lambdy jakie tu mają zastosowanie.
względu
Procedury uzyskiwania za pomocą programu SPSS zaprezentowanych wyzeJ wyników można znaleźć w książce Jarosława Górniaka i Janusza Wachnickiego SPSS PL for Windows - pierwsze kroki w analizie danych (część II, rozdz. 4, 5, Kraków, SPSS Polska 2000).
społecznych.
Pojęcia l!Jl
III I!l
I!l I!l III III
!II III II!
Ell iii iii iii
podstawowe
statystyka indukcyjna testy statystycznej istotności populacja próba próba losowa błąd z próby statystyki próby parametry populacji test dla jednej próby test dla dwóch prób analiza wariancji ANOVA hipoteza zerowa Ho hipoteza alternatywna Hl błąd l, II rodzaju
111 III III II! l1li III
III !li III
fil
III I!I III III
poziom istotności test dwustronny test jednostronny klasyczna definicja prawdopodobieństwa aksjomatyczna definicja prawdopodobieiistwa rozkład normalny rozkład średnich z próby założenie normalności rozkładu
centralne twierdzenie graniczne rozkład t Studenta estymator liczba stopni swobody test dla proporcji estymacja przedziałowa
Do tej pory, opisując przykłady empiryczne, określenie "grupa badana" stosow stosunku do jednostek analizy, które były obiektem naszych badań. Teraz dokonamy precyzyjnego opisu tej grupy. To co nas bowiem interesuje, to możliwość generalizacji naszych obserwacji i analiz. Techniki umożliwiające takie generalizacje będą przedmiotem tego i następnych rozdziałów.
waliśmy
Na początek zostaną wprowadzone podstawowe pojęcia i na prostym przykła dzie zostanie zaprezentowana idea testu statystycznej istotności. Będzie chodziło o zaprezentowanie pewnego sposobu rozumowania, którego uchwycenie pozwoli na późniejsze swobodne poruszanie się w materii statystyki indukcyjnej. Przedstawioną w nim formułę można by stosować w sposób mechaniczny (podstawiając odpowiednie wielkości do danego wzoru, np. na statystykę testu) ale nas będzie interesowało zrozumienie tych procedur.
Ta formuła statystyki testu oparta jest o rozkład częstości, zwany rozkładem normalnym, a właściwie szczególny przypadek rozkładu normalnego, będącego rozkładem średnich z próby. Innym rozkładem częstości, z którym zapoznamy się również w tym rozdziale jest rozkład t Studenta.
5.1. Czym zajmuje się statystyka indukcyjna? Do tej pory zajmowaliśmy się analizą zmiennych lub ich związku, odwołując się do danych pochodzących z badań. Zatem wszystkie hipotezy, które stawialiśmy, mogły być zweryfikowane, bądź nie, w stosunku do grupy badanych jednostek analizy. I tak, hipoteza dotycząca związku między poziomem dochodu na jednego mieszkańca a udziałem rolnictwa w PKB na pewno okazała się trafna w stosunku do 20 analizowanych państw. Ale czy prowadząc tę analizę chodziło nam tak naprawdę o pokazanie zależności dla tych 20 państw, czy też o wykrycie pewnych prawidłowości, które miałyby bardziej ogólny charakter. Pytanie jest oczywiście retoryczne, choć bez tego pierwszego nie można by było dokonać tego drugiego. To co nas przede wszystkim interesuje, to fakt, do jakiego stopnia możemy dokonać generalizacji, aby sprawdzone przez nas hipotezy można było ciągle jeszcze uważać za prawdziwe. To właśnie statystyka indukcyjna oferuje nam aparat teoretyczny i narzędzia praktyczne do dokonywania uogólnieil wniosków pochodzących z grupy badawczej na szerszą zbiorowość - jest to wnioskowanie statystyczne. Dokonujemy zatem indukcji, przechodząc od szczegółów -- danych empirycznych dla grupy badanej, do ogółu - wniosków dotyczących szerszej zbiorowości. Narzędzia, za pomocą których możemy z określoną precyzją taki zabieg przeprowadzić, to testy statystycznej istotności. Zacznijmy od początku. Na początku jest nasze zainteresowanie otaczającym nas światem zjawisk społecznych - to jest nasze uniwersum. Z tego świa ta wyłania się szczególnie interesujące nas zjawisko, np. jakie są wyznaczniki społeczno-cywilizacyjnegorozwoju państw lub jaki jest stosunek studentów socjologii do ich własnego kierunku studiów. Wszystkie jednostki analizy, których dotyczy interesujący nas problem (wszystkie państwa, wszyscy studenci socjologii - tu wszyscy mogą stanowić studentów jednego uniwersytetu lub studentów wszystkich uczelni w Polsce, czy wszystkich uczelni na świecie) stanowią dla nas populację. Definiując problem badawczy, definiujemy zbiorowość, do której się on odnosi, wyznaczamy populację. Jej cechą charakterystyczną jest to, że zawiera ona wszystkie jednostki analizy interesujące nas z badawczego punktu widzenia. Na
ogół nie zdarza się abyśmy przeprowadzali badania empiryczne na populacji. Nie mamy takich możliwości finansowych i organizacyjnych. To, co jest dla nas dostępne, to możliwość przeprowadzenia badań na części populacji.
Z populacji dobieramy mniejszą grupę jednostek analizy do badania. Ta grupa to próba. Od sposobu, w jaki dobierzemy próbę z populacji zależy możliwość stosowania testów statystycznej istotności, a więc możliwość dokonywania generalizacji z próby na populację. Czego zatem należy unikać przy doborze próby? Powinniśmy zadbać o to, aby próba nie była "skrzywiona" (obciążona błędem). Przypuśćmy, że chcemy udowodnić, że proszek do prania X jest najlepiej sprzedawanym produktem tej branży. Przeprowadzamy sondę w jednym z hipermarketów. Spośród 20 osób, które zakupiły proszek do prania, 15 osób zakupiło proszek X. Teraz spokojnie możemy wystąpić w reklamówce tego proszku, oświadczając że 75% nabywców preferuje proszek X. Przypuśćmy jednak, że wcześniej wiedzieliśmy, iż sklep, pod którym przeprowadzaliśmysondę prowadzi sprzedaż proszków tylko jednego producenta, dla którego wiodącym produktem jest proszek X. Dokonaliśmy więc intencjonalnego skrzywienia próby. Zwykle badacze nie postępują w taki sposób a skrzywienie próby może być nie intencjonalne. Załóżmy taki sam scenariusz badania rynku proszku, z wyłączeniem monopolizacji sklepu przez jednego producenta. Okazuje się, że otrzymaliśmy takie same wyniki, bo np. sklep w tym dniu oferował proszek X po promocyjnej, dwukrotnie niższej cenie. Nic więc dziwnego, że tylu klientów preferowało ten właśnie produkt. Nasza próba została skrzywiona przez nieprzewidziane przez nas i wcześniej nam nie znane czynniki zewnętrzne. Jednym z najbardziej znanych przykładów nieintencjonalnego skrzywienia próby były badania preferencji przedwyborczych przeprowadzone przez Literary Digest przed wyborami prezydenckimi w USA, w roku 1936. Przeprowadzone na dość dużej próbie badania wskazywały na 60% zwycięstwo kandydata Republikanów Alfa Landona, podczas gdy w czasie rzeczywistych wyborów otrzymał on tylko 38% głosów i został pokonany przez demokratę Franklina D. Roosevelta. Okazało się, że próbę do badania dobierano z listy właścicieli samochodów i książki telefonicznej. W czasach Wielkiego Kryzysu były to dobra na tyle luksusowe, że pozwolić sobie na nie mogli tylko lepiej sytuowani obywatele, wówczas w większości popierający Republikanów. Z badań "wypadła" zatem dużo większa grupa społeczna, gorzej sytuowanych, w znacznej mierze popierająca Demokratów. Powinniśmy zawsze pamiętać, że jeśli próba jest skrzywiona, to nie istnieje taka metoda statystyczna, która pozwalałaby nam na generalizacje na jej podstawie.
Wszystkie narzędzia statystyki indukcyjnej opierają się na założeniu, że próba w rzetelny sposób odzwierciedla populację. Jeśli mamy powód przypuszczać, że nasza próba jest skrzywiona, to żaden test statystycznej istotności "nie zamieni nam ropuchy w królewicza" .
5.2. Próba losowa Jeżeli próba w sposób rzetelny odzwierciedla populację to jest reprezentatywna. Reprezentatywność próby uzyskujemy poprzez odpowiedni sposób doboru jednostek analizy z populacji do próby. Takie kryterium spełniają sposoby probabilistycznego doboru próby, których podstawę stanowi zasada, że każda jednostka analizy w populacji ma jednakową szansę (jednakowe lub z góry znane prawdopodobieństwo)znalezienia się w próbie. Przywołajmy przykład badania stosunku studentów socjologii do własnego kie-' runku studiów. Przypuśćmy, że dysponujemy alfabetycznąlistą wszystkich studentów socjologii naszego uniwersytetu. Każdej osobie na liście przypisujemy kolejny numer, następnie numery te umieszczamy na piłeczkach pingpongowych i wrzucamy do bębna. Mieszamy je tam dokładnie i prosimy ochotnika o wylosowanie jednej piłeczki. Zapisujemy jej numer i wrzucamy ją z powrotem do bębna. Procedurę powtarzamy tyle razy, ile jednostek chcemy wylosować do próby (w naszym przykładzie 165 razy). Tak dobraną próbę nazywamy próbą losową·
Tak skomplikowanej "ręcznej" procedury losowania nie musimy już dziś stosoPrzy doborze stosunkowo małych prób korzystamy z tablic liczb losowych, a przy większych próbach - z odpowiednich programów komputerowych.
wać.
Taki dobór losowy prosty, jaki został zaprezentowany powyżej, nie jest jedynym losowym sposobem doboru próby. Warto tu wspomnieć jeszcze chociażby dobór warstwowy. Ze względu na problem badawczy, niektóre zmienne charakteryzujące populację mają dla nas kluczowe znaczenie. Jeśli liczebności
kategorii takiej zmiennej są znacznie zróżnicowane, to trzeba zastosować warstwowy dobór próby. Jeżeli np. prowadzilibyśmy badania na temat stosunku do wybranego kierunku studiów wśród studentów uczelni wojskowej, to moglibyśmy założyć, że płeć miałaby tu znaczenie różnicujące postawy. Gdyby interesowało nas to zróżnicowanie, to zależałoby nam aby w próbie obok mężczyzn znalazły się również kobiety. Ponieważ procent kobiet studiujących na uczelniach wojskowych jest niewielki, przy doborze losowym prostym istniałoby takie niebezpieczeństwo, że żadna z nich nie znalazłaby się w naszej próbie. Aby temu zapobiec, dokonujemy wstępnie podziału naszej populacji
na warstwy będące kategoriami interesującej nas zmiennej, w tym przykładzie byłby to podział na studentki i studentów danej uczelni wojskowej. Podział
na warstwy musi spełniać dwa kryteria - po pierwsze musi być wytzn. każda jednostka analizy musi być przyporządkowanado którejś warstwy, po drugie - podział ten musi być rozłączny, tzn. każda jednostka może być przyporządkowana tylko do jednej warstwy. Następnie dokonujemy doboru losowego prostego, z każdej z warstw osobno. Jeśli zachowujemy proporcje liczebnościowe warstw, tj. losujemy taki sam procent każdej warstwy, to mamy dobór losowy warstwowy proporcjonalny. Jeśli jednak z jakichś powodów badawczych dokonamy losowania różnych proporcji z każdej warstwy (co jest do przyjęcia), to będziemy mieli dobór losowy warstwowy nieproporcjonalny (wówczas prawdopodobieństwo znalezienia się w próbie będzie niejednakowe dla poszczególnych jednostek analizy ale nam znane). czerpujący,
Przypuśćmy, że zastosowaliśmy wszelkie reguły mające nam zagwarantować
losowy charakter naszej próby. Nie musimy zatem dłużej martwić się tym, że może być ona skrzywiona. Nie oznacza to jednak, że w ogóle nie musimy się martwić. Naszym problemem jest teraz błąd z próby. W tym przypadku błąd nie oznacza pomyłki w procesie losowania. Błąd z próby oznacza odchylenie charakterystyk próby w stosunku do populacji. Jeśli wśród studentów socjologii 70% to kobiety, a w naszej próbie dobranej losowo znalazło się ich 58%, to jest to błąd z próby. Takie same odchylenia mogą dotyczyć innych charakterystyk, np.: dochodu, wyznawanej religii, preferencji wyborczych, postaw wobec aborcji itd., czyli wszystkich mierzonych zmiennych.
Znajdujemy się zatem w sytuacji, w której charakterystyki opisujące próbę od tych opisujących populację. Weźmy pod uwagę pojedynczą zmienną. W rozdziale trzecim zostały opisane dwie grupy miar charakteryzujących zmienną - miary tendencji centralnej i miary dyspersji. Ich podstawowymi przedstawicielami są średnia arytmetyczna i odchylenie standardowe. mogą różnić się
Musimy zatem dokonać rozróżnienia na to co jest charakterystyką próby, a co jest charakterystyką populacji. Analizy prowadzone przez nas do tej pory odnosiły się do prób. Zatem charakterystykami próby będą: lIll
X-
średnia arytmetyczna z próby,
II
s-
odchylenie standardowe z próby,
nazywane
odtąd statystykami próby.
Charakterystyki populacji będziemy oznaczać małymi greckimi literami i będą to odpowiednio: II
fJ (j -
średnia
arytmetyczna z populacji, odchylenie standardowe z populacji,
nazywane
odtąd
parametrami populacji.
Wzory, za pomocą których liczy się parametry populacji są analogiczne do tych, które stosowaliśmy do wyznaczenia statystyk próby. Jeśli odwołamy się do ich wersji definicyjnej, to dla parametrów przyjmą one następującą postać: 11II
średnia arytmetyczna z populacji:
Istnienie związku między dwoma zmiennymi będziemy badać za pomocą testu niezależności chi-kwadrat. Pomimo tej różnorodności testów istnieje jednak jednakowa procedura wnioskowania statystycznego za pomocą testów istotności, procedura niezależna od typu testu. Ta procedura będzie teraz przedmiotem naszych rozważań. Nie będziemy się tutaj zagłębiać w teoretyczne uzasadnienia i niuanse poszczególnych typów testów (to stanie się przedmiotem naszych rozważań w dalszej części podręcznika), postaramy się prześledzić i zrozumieć ideę weryfikacji hipotez za pomocą testów na możliwie naj prostszym przykładzie. Zostanie on dla jasności wywodu i wprowadzenia pewnych ogólnych pojęć zaprezentowany na bardzo małej próbie - w rzeczywistości badawczej trzeba uwzględnić warunki stosowalności danego testu; liczebność próby jest jednym z takich warunków.
odchylenie standardowe z populacji:
Istnieje jedna zasadnicza różnica pomiędzy statystykami próby a parametrami populacji. Parametry, tak jak to wynika z powyższych wzorów, są liczone z wartości wszystkich jednostek analizy danej zmiennej. Są więc wielkościami stałymi, niezmiennymi dla danej populacji. Statystyki natomiast są liczone dla wartości zmiennej tych jednostek analizy, które zostały wylosowane do próby. Mają więc charakter losowy, są zmienne z próby na próbę. Mogą się więc róż nić od parametrów. Testy statystycznej istotności pozwalają nam tylko określić, z danym prawdopodobieństwem,czy różnica ta wynika z błędu z próby. Zatem od tej pory będziemy żyć w stanie "statystycznej niepewności". Ale jest to chyba stan bliższy naszym codziennym doświadczeniomniż jakikolwiek inny. (
5.3. Testy statystycznej
Przed przystąpieniem do zajęć ze statystyki indukcyjnej studenci socjologii mieli sprawdzian z wiadomości ze statystyki opisowej. Sprawdzian był oceniany w skali od O do 30 punktów. Do sprawdzianu przystąpiło 17 osób, średnia arytmetyczna dla tej grupy wynosiła 20 punktów a odchylenie standardowe 3,5. Potraktujmy tę grupę jak populację. Znane są nam więc jej parametry (fJ = 20, (j = 3,5). Dokonajmy doboru próby w sposób losowy. Wylosowane do próby cztery osoby uzyskały następującą liczbę punktów za sprawdzian: 18, 21, 22, 25. Średnia arytmetyczna z próby wynosi zatem 21,5. Istnieje więc różnica pomiędzy parametrem i statystyką. Test istotności (w tym przypadku test parametryczny dla jednej próby) pozwoli nam ocenić naturę tej różnicy. Procedurę wnioskowania rozpoczynamy od postawienia hipotezy zerowej Ho. W tym przypadku hipoteza ta będzie miała następującą postać:
istotności
Ho:
Jest wiele kwestii w analizie statystycznej, w stosunku do których możemy uży
Zakładamy
wać testów, jako narzędzia wspomagającego nasze wnioskowanie. Dla każdej
stępnie
z tych kwestii będziemy używać innego typu testu istotności. I tak, jeśli nasze rozważania będą dotyczyły różnicy między statystykami jednej próby a parametrami (lub jakąkolwiekinną wartością niż parametr), to będziemy stosować test dla jednej próby. Jeżeli będziemy dokonywać porównania statystyk z dwóch prób, to będziemy stosować test dla dwóch prób. Przy porównywaniu statystyk z trzech lub więcej prób będziemy stosować analizę wariancji ANOVA.
taką że:
X=
fJ.
zatem, że statystyka próby jest równa parametrowi populacji. Naw stosunku do hipotezy zerowej stawiamy hipotezę alternatywną Hl,
Hipotezę tę
czasem hipotezą badawczą. Zazwyczaj stawia się jedną ale może też być ich więcej. Jeśli spojrzymy na dane i sposób sformułowania hipotez, zerowej i alternatywnej, to widać, że tak nazywa
się
hipotezę alternatywną,
naprawdę
zainteresowani jesteśmy udowodnieniem hipotezy alternatywnej. Dowodu tego jednak nie możemy przeprowadzić wprost. Jedynym dostępnym nam sposobem jest dowód pośredni, poprzez odrzucenie hipotezy zerowej. Przy weryfikacji hipotezy zerowej możemy popełnić dwa rodzaje błędów. Po pierwsze, możemy odrzucić hipotezę zerową chociaż jest ona prawdziwa. Jest to błąd I rodzaju, zwany błędem 0:. Po drugie, możemy przyjąć hipotezę zerową, choć jest ona fałszywa - jest to błąd II rodzaju, zwany błędem (3. W prezentowanej tu procedurze testu istotności nie mamy możliwości określenia błę du II rodzaju. Prawdopodobieństwopopełnienia błędu I rodzaju wyznaczamy w sposób arbitralny, przed przystąpieniem do badań. Sami zatem ustalamy ryzyko odrzucenia hipotezy zerowej chociaż jest ona prawdziwa. Ustalamy tym samym poziom istotności testu. Przy weryfikacji hipotez statystycznych stosuje się zwyczajowo określone poziomy istotności: 0,05; 0,01 i 0,001. Jeśli ustalimy poziom istotności na o: = 0,05, to oznacza, że przyjmujemy 5% szans na to, iż odrzucimy hipotezę zerową, chociaż jest ona prawdziwa. Określony
poziom istotności testu wyznacza nam tzw. obszar krytyczny (z jego istotą zapoznamy się w kolejnych punktach tego rozdziału). Dla podanych poprzednio standardowych poziomów istotności odpowiadające im obszary krytyczne rozpoczynają się od wartości Za: Poziom
istotności
0,05 0,01 0,001
o:
Obszar krytyczny od z" 1,96 2,58 3,29
Zatem nasza statystyka testu ma 21,5 - 20
X-f-t
a/VH'
1,5·2
3
°
Im większa byłaby różnica między statystyką a parametrem, tym większa była by wartość statystyki testu. Bezwzględnąwartość obliczonej przez nas statystyki testu porównujemy z właściwym dla obranego poziomu istotności obszarem krytycznym:
Izl < Za, iii jeżeli Izl ~ Za,
III
jeżeli
W naszym
to nie ma podstaw do odrzucenia hipotezy zerowej, wówczas odrzucamy hipotezę zerową·
przykładzie zachodzi
ta pierwsza ewentualność, bowiem 0,86 < 1,96.
Możemy więc przyjąć, że różnica pomiędzy wielkością statystyki próby (21,5)
a
wielkością
parametru (20) wynika z
błędu
próby.
Stosując test parametryczny dla jednej próby (taki jak w przykładzie powyżej) używamy wyżej określonych
znaczenia iii
jeśli
lIIl
jeśli
błędu
poziomów istotności dla bardziej precyzyjnego wyI rodzaju. I tak:
Izl < 1,96, nie mamy podstaw do odrzucenia Ho i nie podajemy żadnego
prawdopodobieństwa;
l!lI
Z=---
1,5
= 3,5/V4 = - == -3,5- = -3,5 = ,86. 3,5/2
Z
l1li
Po postawieniu hipotezy zerowej, hipotezy alternatywnej oraz wyznaczeniu poziomu istotności testu liczymy statystykę testu. Statystyka ta przybiera różną postać w zależności od typu testu. Dla naszego przykładu będzie to statystyka Z, którą liczymy według następującego wzoru:
wartość:
Izl ~ 1,96 i Izl < 2,58, odrzucamy Ho z prawdopodobieństwem p < 0,05, co konwencjonalnie oznacza prawdopodobieństwopomiędzy 0,05 a 0,01; jeśli Izl ~ 2,58 i Izl < 3,29, odrzucamy Ho z prawdopodobieństwem p < 0,01, co oznacza, że p jest mniejsze od 0,01 ale większe niż 0,001; jeśli Izl ~ 3,29, odrzucamy Ho z prawdopodobieństwem p < 0,001 na tym zatrzymując doprecyzowanie naszego postępowania.
Jeżeli test dla jednej próby będziemy wykonywać za pomocą programów komputerowych, to otrzymamy dokładną wartość prawdopodobierlstwa alfa. Wszystkie powyżej poczynione uwagi odnoszą się do szczególnego typu testu parametrycznego dla jednej próby, zwanego testem dwustronnym. Postać hipotezy alternatywnej zadecydowała o zastosowaniu tego typu testu. Jeśli hipotezę alternatywną zapisalibyśmy w postaci:
gdzie: II iii iii l.1li
średnia
arytmetyczna dla populacji, w omawianym przypadku f-t = 20; odchylenie standardowe dla populacji, tutaj a = 3,5; X - średnia arytmetyczna dla próby, w tym przypadku X = 21,5; N - liczebność próby (N = 4). f-t -
a -
to zastosowalibyśmytest jednostronny (istota dwustronności lub jednostronności testu zostanie wyjaśniona później).
Podsumujmy zatem krok po kroku procedurę właściwą dla przeprowadzenia wnioskowania statystycznego za pomocą testów istotności: 1. Zanim podejmie się analizę danych, trzeba sformułować hipotezę zerową i hipotezę alternatywną, ze szczególnym uwzględnieniem uzasadnienia zastosowania testu jednostronnego i innego niż 0,05 poziomu istotności testu. 2. Po zgromadzeniu danych należy upewnić się, czy mamy wszystkie niezbędne informacje do przeprowadzenia testu, który wybraliśmy, tzn. czy jesteśmy w stanie policzyć jego statystykę. 3. Liczymy statystykę testu.
4. Wyznaczamy odpowiedni obszar krytyczny (adekwatny do formy hipotezy alternatywnej, poziomu istotności testu oraz liczby stopni swobody - dla innych testów niż prezentowany powyżej). 5. Porównujemy statystykę testu z obszarem krytycznym. 6. Podejmujemy decyzję o odrzuceniu lub braku podstaw do odrzucenia hipotezy zerowej. 7. Jeśli odrzucamy hipotezę zerową, to staramy się możliwie precyzyjnie określić błąd I rodzaju. 8. Wracamy do hipotezy zerowej i alternatywnej, i na podstawie przeprowadzonego testu wyciągamy wnioski. Spróbujmy teraz
5.4.
prześledzić istotę
przedstawionej
powyżej
procedury.
Prawdopodobieństwo
Wiemy, że statystyki mają charakter losowy atesty istotności pozwalają nam z pewnym prawdopodobieństwemokreślić, czy różnica między statystykami a parametrami wynika z błędu próby, czy też kryją się za tym jakieś inne istotne przyczyny. Przyjęliśmy również, iż poziom istotności testu, to wyznaczone przez nas prawdopodobieństwopopełnienia błędu I rodzaju. Czym zatem jest prawdopodobieństwo?
Intuicyjnie używamy tego terminu jako "szansy na coś". Powiemy zatem, "prawdopodobnie nie będzie padało" - patrząc na bezchmurne niebo; "prawdopodobnie nie zaliczyłem tego testu" - nie odpowiedziałem na większość pytań.
precyzyjnymi
pojęciami -
Przywołajmy zatem
statystyce musimy definicjami.
się posługiwać
bardziej
dwie znane definicje prawdopodobieństwa, do których dalszej części podręcznika.
się odwoływać w
bę
prawdopodobieństwa(Laplace'a)
Jeżeli przez n oznaczymy liczbę wszystkich możliwych zdarzeń elementarnych (tzn. zdarzell, z których jedno musi zaistnieć w wyniku eksperymentu, wykluczając
przy tym zaistnienie innego zdarzenia), to prawdopodobieństwozaistnienia zdarzenia losowego A wyraża się stosunkiem liczby zdarzeń elementarnych sprzyjających zdarzeniu A(m), do całkowitej liczby zdarzeń elementarnych (n)
p(A) q
m n
0'.( p(A) '.( 1,
= -,
oznacza prawdopodobieństwo,że nie zajdzie zdarzenie A,
p(A)
m n
q(A)
= 1--,
q(A)
= 1-
+ q(A) =
p(A),
1.
Aksjomatyczna definicja prawdopodobieństwa(Kołmogorowa) 1. Każdemu zdarzeniu losowemu przyporządkowana jest jednoznacznie pewna liczba rzeczywista z przedziału (0,1), zwana prawdopodobieństwem tego zdarzenia. 2. Prawdopodobieństwo zdarzenia pewnego jest równe jedności. 3. Jeżeli zdarzenie losowe X jest sumą rozłącznych zdarzell losowych Xl + +X2 + ... + X n , to prawdopodobieństwozrealizowania tego zdarzenia jest równe sumie prawdopodobieństwzdarzeń Xl, X 2 , ..• , X n
p(X) = p(Xd
5.5.
Rozkład
+ p(X2 ) + ... + p(Xn ).
normalny
Rozkład normalny jest rozkładem częstości, którego obraz przypomina kształ tem dzwon (rys. 5.1).
Krzywa taka posiada trzy zasadnicze cechy: iIl III
Używając prawdopodobieństwaw
dziemy
Klasyczna definicja
II
jest jednomodalna, jest symetryczna, jej końce zbliżają się asymptotycznie do osi wartości.
Ta ostatnia własność oznacza, że wykres funkcji dla wartości dążących do plus lub minus nieskończonościbędzie zbliżać się do osi odciętych, ale nigdy jej nie dotknie.
f
x
Rysunek 5.1. Proszę zwrócić uwagę na zmianę oznaczeń osi układu współrzędnych. Na rysunku mamy modeł matematyczny rozkładu normalnego, więc przyjmujemy założenie, że zmienna X ma charakter ciągły (mamy x - wszystkie wartości, zamiast Xi - wartości z próby), których częstość występowania (ni) określa funkcja gęstości prawdopodobieństwa(I).
Powodem, dla którego ten typ rozkładu częstości jest nazywany rozkładem normalnym jest fakt, że szereg charakterystyk populacji ludzkich, takich jak: wzrost, waga, współczynnik inteligencji ma rozkład częstości zbliżony do takiego dzwono-podobnego kształtu. Nie oznacza to jednak, że inne typy rozkładów są "nienormalne" . Są to po prostu inne modele rozkładów. Takie matematyczne modele możemy traktować jak typy idealne w sensie weberowskim. Rozkład
Pole pod krzywą normalną odpowiada proporcji wszystkich osób o określonej charakterystyce, czyli 100%, co w wymiarze bezwzględnym stanowi 1,0. Zatem pole pod krzywą normalną wynosi 1,0 (można to udowodnić licząc całkę od minus nieskończonoścido plus nieskończonościpo funkcji gęstości prawdopodobieństwa -- do czego zachęcam zainteresowanych). Ponieważ rozkład normalny jest rozkładem symetrycznym, to pole po lewej stronie średniej będzie równe 0,5 (50% wszystkich przypadków) i pole po prawej stronie średniej będzie równe 0,5 (50% wszystkich przypadków). Wobec tego, prawdopodobieństwo wylosowania do próby osoby, której IQ jest niższe od średniej wynosi 0,5, tyle samo co prawdopodobieństwo wylosowania osoby o IQ większym od średniej. Dla Zosi wartość IQ wynosi 115, zatem proporcji osób, które prawdopodobnie osiągną wynik lepszy od niej, odpowiada pole pod krzywą normalną na prawo od tej wartości a proporcji osób, które prawdopodobnie uzyskają wynik gorszy odpowiada pole na lewo od niej. Jak znaleźć konkretne wielkości odpowiadające tym obszarom? Aby je uzyskać korzystamy z zestandaryzowanych tablic rozkładu normalnego (załącznik 1). Zaczynamy od obliczenia różnicy pomiędzy daną konkretną wartością a średnią - w przypadku Zosi mamy:
x - J-i = 115 - 100 = 15. Zosia uzyskała wynik o 15 punktów większy od średniej. Następnie tę różnicę dzielimy przez wielkość odchylenia standardowego - w tym przypadku (5 = 10:
x - J-i _ 15 == 1 5 (5 10 ,.
normalny jest charakterystyczny dla zmiennych, w przypadku których
na wielkość przybieranych wartości ma wpływ wiele czynników, ale żaden z nich nie jest dominujący. W naukach społecznych jest to na tyle częsta sytuacja, że samo takie określenie stanowi wystarczającą przyczynę, aby z rozkładem normalnym bliżej się zaprzyjaźnić.
Obliczona przez nas wielkość zestandaryzowana oznacza, że wynik, jaki osią gnęła Zosia, znajduje się na prawo od średniej arytmetycznej, w odległości 1,5 odchylenia standardowego od tej średniej (rys. 5.2). f
Wspomniany wyżej poziom inteligencji mierzony jako współczynnikinteligencji IQ jest zmienną o rozkładzie normalnym. Zmienna ta mierzona jest w skali od do 200, ze średnią równą 100 i odchyleniem standardowym wahającym się w okolicach 13 lub 14, w zależności od wieku badanych. W naszym przykładzie przyjmijmy spore uproszczenie, ustalając wartość odchylenia standardowego na 10. Zosia, wypełniając test mierzący współczynnik inteligencji, uzyskała 115 punktów. Chcielibyśmy wiedzieć, czy to dużo, czy mało. Inaczej mówiąc, jak wiele osób ma szansę uzyskać wynik lepszy od Zosi, a ile osób prawdopodobnie uzyska wynik od niej gorszy. Niestety nie możemy ustalić, ile osób uzyska taki sam rezultat.
°
-
z
Rysunek 5.2.
Dla takiej wielkości zestandaryzowanej oznaczanej w tablicach rozkładu normalnego jako z, wyznaczone zostały wielkości pola pod krzywą normalną·
Zapiszmy
tę formułę
standaryzacji:
x-p.,
z=--= (J
z,,,
115 - 100 15 10 = 10 = 1,5.
W tablicy rozkładu normalnego mamy trzy kolumny oznaczone A, B, C (załącz nik 1). W kolumnie A znajdują się wartości z liczone z dokładnością do dwóch miejsc po przecinku. W kolumnie B znajduje się wielkość pola pomiędzy średnią a określonym z (liczona z dokładnością do czterech miejsc po przecinku), natomiast w kolumnie C podana jest wielkość pola pomiędzy wartością z a plus nieskończonością lub pomiędzy z a minus nieskończonością, w zależności od tego po której stronie średniej znajduj~ się dane z. Wróćmy
Teraz możemy wyjaśnić istotę obszaru krytycznego oraz wartości które pojawiły się już wcześniej w tym rozdziale. Ustalając poziom istotności testu "odcinamy" odpowiednią (taką jak wyznaczone a) część pola pod krzywą normalną jako obszar krytyczny. W zależności od tego czy test jest dwustronny, czy jednostronny, odpowiednia część pola znajduje po obu stronach średniej lub po jednej stronie średniej (prawej lub lewej). Prześledźmy tę procedurę w stosunku do najczęściej używanego poziomu istotności a = 0,05. f
do Zosi.
Obliczone dla niej z wynosi 1,5. Szukamy tej wartości w kolumnie A (załącz nik 1). Pole pod krzywą od średniej do danego punktu wynosi 0,4332 (kolumna B), zaś pole od tego punktu do plus nieskończoności wynosi 0,0668 (kolumna C). Wobec tego tylko 6,68% osób osiągnie prawdopodobnie lepszy wynik niż Zosia, natomiast wynik gorszy może osiągnąć 93,32% osób; jest to suma pól pod krzywą: lIiI
od minus nieskOllczoności do średniej -
!li
między średnią a punktem odpowiadającym wynikowi Zosi -
0,5; 0,4332,
razem 0,9332. Zosia jest więc bardzo inteligentną osobą. Nie da się tego powiedzieć o Jasiu, którego współczynnik inteligencji wynosi 80. Zobaczmy dlaczego? Zacznijmy od obliczenia wartości z
z =
x - p., -(J-
80 - 100
- 20
= --1-0- = -1-0- = -2,0.
Rysunek 5.3.
Dla testu dwustronnego wartość poziomu istotności dzielimy na pół, a więc mamy dwie części pola po 0,025 znajdujące się po obu końcach krzywej normalnej. W tablicach rozkładu normalnego (załącznik 1) szukamy w kolumnie C wartości z dla pola 0,025. Znaleziona wartość to nasze Za, W tym przypadku równe 1,96. Jeśli zatem statystyka testu znajdzie się między -Za a +za, to nie będzie podstaw do odrzucenia hipotezy zerowej, jeśli jednak znajdzie się ona na którymkolwiek polu 0,025 to hipotezę zerową Ho odrzucimy. Zapiszmy to symbolicznie: iii iii!
Izl < IZnl Izl ;;:; IZal -
nie ma podstaw do odrzucenia Ho, odrzucamy Ho· f
Ujemna wartość z oznacza, że punkt wyznaczający wartość IQ Jasia znajduje się po lewej stronie średniej i jest od niej odległy o dwa odchylenia standardowe. Zatem pole pod krzywą normalną od minus nieskończoności do tego punktu będzie odpowiadać proporcji osób, które mogą uzyskać wynik gorszy od Jasia (kolumna C - 0,0223 - oznaczenia na dole tablicy) i jest to 2,23% populacji, natomiast pole po prawej stronie tego punktu odpowiada tej części populacji, która prawdopodobnie uzyska wynik lepszy od Jasia i jest to 97,72% osób (pole pomiędzy danym punktem a średnią - tu 0,4772 plus pole po prawej stronie średni-sj - czyli 0,5). Biedny Jaś!
Zo;
x
Rysunek 5.4. Jeśli hipotezę alternatywną postawimy w taki sposób, że test jednostronny, to obszar krytyczny odpowiadający polu
stosować będziemy wielkości 0,05
znaj-
dzie się z jednej strony krzywej normalnej. Wyznaczające go z określimy w następujący sposób: pole po jednej stronie średniej wynosi 0,5, od niego odejmujemy wartość pola obszaru krytycznego 0,05, otrzymujemy 0,45. W kolumnie B tablic rozkładu normalnego (załącznik 1) szukamy tej wartości i odpowiadają cego jej z. Teraz nasze Za wynosi 1,645, niezależnie od tego, po której stronie średniej się znajduje.
byłoby możliwych
kombinacji liczby jednostek analizy próby z liczebności populacji. Dla każdej próby moglibyśmy policzyć średnią - statystykę, która jak pamiętamy ma charakter losowy. Średnia z próby byłaby więc zmienną o dają cym się zbadać rozkładzie. Ten właśnie rozkład to rozkład średnich z próby. On stanowi podstawę weryfikacji hipotezy zerowej. Zatem, jeżeli jakaś zmienna (x) ma rozkład normalny w populacji, z której dobieramy szereg prób o tej samej liczebności (N), to:
f
iii
rozkład średnich
iii
średnia rozkładu średnich
II
x
Rysunek 5.5.
Zatem warunki weryfikacji testu dla testu prawostronnego (rys. 5.4) są nastę pujące:
<
Za -
z ;?
Za -
lIlI Z III
nie ma podstaw do odrzucenia Ho, odrzucamy Ho,
z próby
będzie rozkładem normalnym;
z próby, czyli średnia średnich (oznaczana jako X), będzie równa średniej z populacji /-l, z której te próby zostały dobrane; odchylenie standardowe rozkładu średnich z próby będzie równe Oj?" = = 0/ V1.V, czyli stosunkowi odchylenia standardowego w populacji do pierwiastka kwadratowego liczebności próby z tej populacji dobranej - odchylenie standardowe rozkładu średnich z próby bywa nazywane błędem standardowym średniej lub błędem standardowym.
Dodatkowo o tym rozkładzie wiemy, jaki procent wszystkich możliwych śred nich z próby znajduje się w zakresie błędów standardowych w stosunku do średniej średnich. I tak:
± log 11, ± 20g /-l
a dla testu lewostronnego (rys. 5.5): III Z
>-
Za -
II Z ::;; - Za -
5.6.
nie ma podstaw do odrzucenia Ho, odrzucamy Ho.
Rozkład średnich
z prób
Formuła, którą zastosowaliśmy w początkowym przykładzie do policzenia sta-
tystyki testu, X-/-l
Z=---
o/V1.V'
jest formułą standaryzacyjnąrozkładu normalnego, która została opisana powyżej, tyle że zastosowaną,do szczególnego wariantu rozkładu normalnego _ rozkładu średnich z prób. Srednia z próby, w stosunku do której stawiamy hipotezę sprawdzaną za pomocą testu istotności dla jednej próby, jest tylko jedną z wartości statystyk możliwych do policzenia z danej populacji. Przy założeniu określonej liczebności próby z danej populacji możemy dobrać tyle prób, ile
/-l
± 30g
--+
68,27%,
--+
95,45%,
--+
99,73%.
····m~·!?·~~!!t!~~·. ·······, Uczniowie kończący gimnazjum przystępują do testów sprawdzających z kilku przedmiotów, w tym z matematyki. Załóżmy, że rozkład punktów, jaki uzyskują gimnazjaliści z matematyki jest rozkładem normalnym o średniej /-l = 70 i odchyleniu standardowym o = 20. Dobieramy próbę liczącą 100 osób. Jaki będzie rozkład średnich z próby? Zgodnie z przedstawionymi powyżej założenia mi powinien to być rozkład normalny o średniej X = /-l = 70 oraz odchyleniu standardowym o/V1.V = 20/JIOO = 20/10 = 2. Średnia z próby N = 100 w 99,73% przypadków powinna znaleźć się w przedziale od 64 do 76 punktów (plus/minus trzy błędy standardowe). Załóżmy, że nasza próba została dobrana spośród uczniów, którzy uczestniczyli w 6-tygodniowym kursie matematyki przygotowującym ich do końcowego testu z matematyki. W takim przypadku nasze pytanie brzmi, czy tę próbę możemy jeszcze traktować jako próbę wszystkich gimnazjalistów?
Odpowiedź na to pytanie pozwala ocenić, czy różnice pomiędzy X a p., wynikają z doboru próby, czy też należy już uznać, że próba odzwierciedla populację o innej średniej p., , niż ta, którą zakładaliśmy przed dobraniem próby.
Przyjmijmy, że w naszym przykładzie średnia z testu z matematyki dla próby 100 osób wynosi 73. Zatem:
O'
Ho:
X = p.,,
Hl:
X>
= 0,05 więc dla testu jednostronnego
Za
p., ,
Można więc stwierdzić, że kurs przygotowawczy z matematyki nie przyniósł
spodziewanych efektów. Zanim przejdziemy do dalszych zagadnień podsumujmy naszą wiedzę dotyczącą poczynionych wcześniej założeń. Odnosimy się w nich do trzech oddzielnych rozkładów częstości: populacji, próby i średnich z próby. Dane, które posiadamy, dotyczą tylko pierwszych dwóch rozkładów. Przyjęte założenia pozwalają nam je wykorzystać w odniesieniu do własności trzeciego rozkładu. Wiemy, że:
= 1,645.
Obszar krytyczny określiliśmy na podstawie formuły standaryzacyjnej rozkładu normalnego. Przypomnijmy ją i spróbujmy zapisać słownie:
z
=
x(l) - p.,(2) a(3) ,
przy czym: 1. wartość zmiennej, której odległość od średniej chcemy znaleźć, 2. średnia naszego rozkładu częstości, 3. odchylenie standardowe naszego rozkładu częstości.
Teraz ten opis słowny przełóżmy na konkretny przykład, którego dotyczy nasza procedura weryfikacyjna: iii
!Il
III
zmienną, której odległość od średniej chcemy zmierzyć, jest średnia X z naszej próby;
średnią naszego roz~ładu częstości (tu rozkładu średnich z próby) jest śred nia średnich, czyli X, a według przyjętych założeń p., , czyli średnia z naszej populacji;
odchyleniem standardowym naszego rozkładu, rozkładu średnich z próby jest błąd standardowy, czyli a/m.
Na tej podstawie obliczmy statystykę testu:
X z =
~ p.,
a/m
73 - 70 3 3 = 20/VIOO = 20/10 = "2 = 1,5.
Kolejna zagadka w postaci wzoru na statystykę testu dla jednej próby została rozwiązana. Dokonajmy więc weryfikacji naszej hipotezy, porównując statystykę testu z obszarem krytycznym: z < Za, gdyż 1,5 < 1,645, więc nie ma podstaw do odrzucenia Ho.
III
zmienna x w populacji ma określony rozkład częstości; ten rozkład to rozkład normalny; jego parametrami są średnia p., i odchylenie standardowe a; zmienna x w losowo dobranej przez nas próbie ma określony rozkład często ści; znamy liczebność tej próby N oraz jej średnią X; zmienna x w próbie to ta sama zmienna x co w populacji; rozkład średnich z próby to coś, czego zasadniczo nie da się zobaczyć, ale z czego można zrobić użytek; istnieją oddzielne rozkłady średnich z próby dla każdej możliwej liczebności próby; dla każdego określonego N rozkład średnich z próby jest rozkładem wszystkich możliwych średnich pochodzą cych z populacji charakteryzowanej przez zmienną x o średniej p., i odchyleniu standardowym a; parametry rozkładu średnich z próby wyznacza centralne twierdzenie graniczne.
Nim przejdziemy do tego twierdzenia jeszcze jedna uwaga. W powyższych rozzmienna x ma w populacji rozkład normalny. Jest to założenie normalności rozkładu. Jeżeli jest ono prawdziwe, to rozkład średnich z próby też jest rozkładem normalnym i możemy zastosować formułę testu istotności dla jednej próby.
ważaniach dokonaliśmy założenia, że
Co się jednak stanie, gdy rozkład zmiennej w populacji nie jest rozkładem normalnym lub, co bardziej prawdopodobne, nie wiemy jaki jest rozkład zmiennej w populacji. W takim przypadku, jeżeli próba będzie dostatecznie duża, będzie my mogli nadal stosować przyjęte założenia, dzięki centralnemu twierdzeniu granicznemu. Centralne twierdzenie graniczne mówi, że jeżeli dobieramy próby losowe o liczebności
N z populacji o dowolnym rozkładzie o parametrach p., i a, to wraz ze wzrostem N, rozkład średnich z próby dąży do rozkładu normalnego o śred niej p., i odchyleniu standardowym a/m. Jeżeli
zatem liczebność próby będzie odpowiednio duża, możemy znieść zao normalności rozkładu zmiennej w populacji. Rozkład ten może być dowolny, np. asymetryczny lub wielomodalny, a i tak rozkład średnich z próby łożenie
będzie rozkładem
normalnym, do którego
będzie się stosować
centralne twier-
dzenie graniczne. jest ta odpowiednia liczebności próby do zawieszenia założenia norNie ma na to pytanie jednej i jednoznacznej odpowiedzi, bowiem prawidłowości obiektywnego świata przejawiają się tylko w procesach masowych. Socjologowie nie mają z tym na ogół problemu, gdyż próby w ich badaniach są zwykle wystarczająco duże. Arbitralnie przyjmuje się najczęściej następujące założenia dotyczące wielkości próby i sensowności zniesienia zało żenia normalności rozkładu zmiennej w populacji: Jak
duża
malności rozkładu?
II iii II II
N ;? 100 - zawsze można znieść założenie normalności rozkładu; 50::::;: N < 100 - prawie zawsze; 30 ::::;: N < 50 - z wielką ostrożnością; N < 30 - nigdy.
5.7.
Rozkład t
Efektywność estymatora zależy od tego, jak bardzo rozkład z próby skupia się wokół rzeczywistej wartości parametru. Jednak estymator nie może być całko wicie efektywny, gdyż to oznaczałoby brak jakiegokolwiel< błędu losowania, co
zaprzecza idei losowego doboru próby. Średnia z próby X jest takim nieobcią żonym estymatorem fJ (co wynika z centralnego twierdzenia granicznego). Nieobciążony estymator wariancji policzymy ze wzoru (0- jest nieobciążonym estymatorem (J"2, Z czego nie wynika, że O- jest nieobciążonym estymatorem (J"): 2
Studenta
Wiemy, że aby móc stosować test istotności dla jednej próby potrzebna nam jest pewna wiedza na temat populacji. Powinniśmy znać, lub przynajmniej hipotetycznie określić, średnią fJ i odchylenie standardowe (J". Takie
Ten nowy sposób na oszacowanie odchylenia standardowego w populacji na podstawie próby zakłada zastąpienie liczebności próby N w formule kalkulacyjnej odchylenia standardowego przez N -1. Obliczamy w ten sposób estymator O- odchylenia standardowego w populacji. Estymator, to oszacowanie parametru na podstawie statystyk. Musi on spełniać kryterium nieobciążoności, tzn. jego średnia rozkładu z próby powinna być równa wartości parametru oraz kryterium efektywności.
Formułę standaryzacyjną, odnoszącą się do rozkładu normalnego, jaką stosowaliśmy poprzednio w teście istotności, zamienimy teraz na formułę t:
x-
fJ t=--.
postępowanie, mające
na celu ustalenie parametrów populacji, nazywa Przez jakiś czas, w sytuacjach gdy można było hipotetycznie założyć wielkość fJ ale (J" nie było znane, przyjmowano, że dobrym oszacowaniem odchylenia standardowego w populacji może być odchylenie standardowe z próby, czyli s. Z czasem dostrzeżono, że szczególnie w przypadku małych prób takie założenie prowadzi do niewłaściwych wniosków.
o-/VH
się estymacją.
Prowadząc badania nad jakością piwa w browarach Guinnessa, zatrudniony tam kontroler jakości William Gosset odkrył lepsze oszacowanie wartości odchylenia standardowego dla populacji na podstawie małej próby.
Metodologia, jaką zastosował Gosset, została opisana w artykule jednego z najlepszych ówczesnych czasopism naukowych "Biometrica". Zanim do tego doszło, redaktor tego pisma, Karol Pearson, prowadził długotrwałą korespondencję z właścicielami browaru, którzy badania Gosseta traktowali jak własność swej firmy. W końcu wyrazili zgodę na opublikowanie części metodologicznej, bez badań empirycznycfj pod pseudonimem "student", bez ujawniania nazwiska pracownika, tak aby uniemożliwić dotarcie do firmowych tajemnic kontroli jakości. Stąd rozkład średnich dla małej próby nazywa się rozkładem t Studenta.
Rysunek 5.6 pokazuje zmiany wartości ta wyznaczającej obszar krytyczny dla takiego samego poziomu istotności o: = 0,05 dla testu jednostronnego, przy zmieniającej się liczebności próby. W pierwszym przypadku liczebność próby wynosi 121 i wówc~as ta. = 1,6~8: tylko nieznacznie więcej niż Za = 1,645 dla takiego samego pozlOmu ls~otnoscl (rys. 5.6a). Wraz ze wzrostem liczebności różnice pomiędzy z a t maleją. Gdy liczebność spada, wartość ta rośnie. Dla liczebności 21 i tego samego poziomu istotności, statystyka ta (rys. 5.6b) a przy liczebności 6 (rys. 5.6c) ta = 2,015.
1,725
Porównując rozkłady z i t, trzeba pamiętać, że rozkład z jes~ rozkł~d:m .normalnym o stałym obszarze krytycznym dla danego ioziomu IstotnoscI., m:zależnym od liczebności próby, natomiast wartości t zależą od licz~bnośC1 prob!. Zmniejszanie liczebności próby prowadzi do łagodzenia warunkow odrzucema
hipotezy zerowej.
a)
f N=121 df=120
--.! t,,=1,658
b)
x
Zestandaryzowane rozkłady t i z różnią się od siebie. Rozkład z jest rozkładem normalnym. Rozkład t przybiera postać rozkładu normalnego tylko dla prób liczniejszych niż 120 jednostek analizy. Wraz ze zmniejszaniem się liczebności próby, krzywa będąca obrazem rozkładu t ulega spłaszczeniu. Ważną konsekwencją tego jest "odsuwanie" się obszaru krytycznego o tej samej wielkości, od średniej. Ilustruje to rysunek 5.6. Przy każdym przedstawionym na tym rysunku przypadku pojawiło się nieznane nam dotąd oznaczenie df. Skrót ten oznacza liczbę stopni swobody (pochodzi od angielskiej nazwy degrees of freedom ). Matematyczne znaczenie liczby stopni swobody naj prościej można ująć jako liczbę elementów w danej formule, które mogą być zmienne.
f N=21 df=20
+ X2 + X3 = 10. Jeśli przyjmiemy np. Xl = 2 a X2 = 3, to X3 będzie musiało wynosić 5. Zatem w tej formule dwie wartości będą mogły się zmieniać a trzecia będzie przez nie wyznaczona. Takie równanie ma więc dwa stopnie swobody. Weźmy prostą formułę matematyczną, dodawanie Xl
x
c)
Liczba stopni swobody, oprócz poziomu istotności testu, jest niezbędna do odnalezienia w tablicach rozkładu Studenta wartości t wyznaczającej nasz obszar krytyczny. W przypadku testu istotności dla jednej próby, liczbę stopni swobody wyznacza się ze wzoru df = N ~ 1,
f N=6 df=5
gdzie N oznacza --_ ..
to;=2,015
x
m
liczebność próby.
uwaga
Rysunek 5.6.
Zatem jeśli znamy a, zawsze stosujemy rozkład z. Jeśli odchylenie standardowe z populacji jest nieznane, to musimy dokonać estymacji. Istnieją dwa podejścia wśród statystyków do estymacji a jeśli próba jest licz-
niejsza
niż
30 jednostek analizy.
Jedni dokonują precyzyjniejszej estymacji, używając statystyki t i łagodzą warunki weryfikacji hipotezy zerowej (obszar krytyczny odsuwa się od średniej). Inni przyjmują s jako niedoskonały estymator a i utrzymują bardziej restrykcyjne warunki weryfikacji hipotezy zerowej przy rozkładzie z (to stanowisko jest mi bliższe). W przypadku próby o liczebności mniejszej niż 30 zawsze stosujemy statystykę i rozkład t.
-
Taka formllłaobliczanialiczby stopni swobody obowiązuje tylko w odniesieniu do tego konkretnego testu. W innych procedurach korzystają cychzrozkładutbędziemy mieli inne formuły liczenia stopni swobody (tokwestia,kt6rej zapamiętanie sprawia na ogół trudność i ma nieprzyjelllriekon.sekwencje) .
Taki zabieg jest niezbędny, abyśmy mogli korzystać z zestandaryzowanych tablic rozkładu t (załącznik 2). W pierwszej kolumnie tej tablicy znajdują się wartości liczby stopni swobody. W kolejnych kolumnach znajdują się wartości t dla opisanych w główce tablicy poziomów istotności testu, z uwzględnieniem podziału na test dwustronny i jednostronny. Poszukiwane przez nas konkretne ta znajdziemy na przecięciu wiersza odpowiadającego liczbie stopni swobody i kolumny z odpowiednim poziomem istotności testu. Teraz łatwo możemy odnaleźć wartości ta' które znalazły się na rysunku 5.6.
Na koniec naszych rozważail o rozkładzie t Studenta jedna uwaga techniczna. Licząc statystykę testu t za pomocą kalkulatora lub programu komputerowego, w ich opisie technicznym należy odnaleźć informację na temat wzoru, z jakiego
sam odsetek osób należących do mniejszości. Spośród nauczycieli województw wschodnich wylosowano próbę 100 osób, wśród których znalazło się 15% osób należących do mniejszości.
program korzysta.
Czy wobec tego mniejszości są niedoreprezentowane wśród nauczycieli?
Jeżeli statystyka t liczona jest w oparciu estymator odchylenia standardowego w populacji CT, wówczas korzystamy z formuły na liczenie t, która została wcześniej podana, jeśli natomiast t jest wyznaczone w oparciu o odchylenie standardowe z próby s, wówczas uprzednia formuła ma zmodyfikowanąpostać:
Hipoteza alternatywna została postawiona tak jak w teście jednostronnym lewostronnym, więc dla O' = 0,05 wartość -Za = -1,645.
X-p,
t=
s/VN -1'
0,15 - 0,2
przy tak samo określonej liczbie stopni swobody, df = N-L
JO,2(1 - 0,2) /100
5.8. Test istotności dla proporcji
Mamy z > -Za, hipotezy zerowej.
Testy istotności dla jednej próby, które zostały przedstawione do tej pory, mogły być stosowane w odniesieniu do zmiennych mierzonych na poziomach sil-
Z
nych (tylko w stosunku do takich zmiennych możemy policzyć średnią i odchylenie standardowe).
W naukach społecznych równie często, jeśli nie częściej, mamy do czynienia ze zmiennymi mierzonymi na poziomach słabych. Miarą takich zmiennych może być proporcja, czyli częstość występowania danej kategorii w całej zbiorowości. Symbolicznie możemy proporcję zapisać jako stosunek liczebności danej kategorii do całkowitej liczebności P = ni/N. Dla takiej miary istnieje zmodyfikowana formuła testu z, która pozwala na weryfikację hipotezy dotyczącej proporcji w próbie, w stosunku do proporcji w populacji.
-
nie możemy nauczycieli.
> -1,645, nie ma
wysnuć
więc
podstaw do odrzucenia
wniosku o niedoreprezentowaniu
mniejszości
5.9. Estymacja przedziałowa Opisując rozkład t Studenta, wprowadziliśmy pOJęCle estymatora, jako najlepszego oszacowania parametru w populacji na podstawie statystyk z próby. Z istnienia rozkładu średnich z prób wiemy, że nie wszystkie średnie X są równe średniej tL, nawet jeśli średnia z próby jest najlepszym estymatorem średniej z populacji. Z tego rozkładu wiemy, że 95% wszystkich średnich z próby bę dzie leżało w przedziale ±1,96 błędu standardowego od średniej p,. Analogicznie, 99% średnich znajdzie się w przedziale ±2,58 błędu standardowego od p" a 99,9% średnich w przedziale ±3,29 błędu standardowego.
Statystyka takiego testu ma następującą postać:
gdzie: Ps -- proporcja dla próby, Pp próby.
badań
wśród
gdyż ·~1,25
-0,05 = -0,05 = -1,25. JO,16/100 U,04
W ten sposób budujemy przedział wokół X, z założeniem, że w tym przedziale znajdzie się p,. Dokonujemy więc estymacji przedziałowej.
proporcja dla populacji, N -liczebność
Estymacja przedziałowa polega na wyznaczeniu pewnego przedziału liczbowego, wewnątrz którego z określonym prawdopodobieństwem znajdzie się estymowany parametr. Przedział ten nosi nazwę przedziału ufności, a prawdopodobień stwo tego, że znajdzie się w nim estymowany parametr wyznacza współczynnik ufności. Współczynniki ufności są odpowiednikami poziomów istotności dla testu dwustronnego (patrz rozważania z poprzedniego akapitu).
Załóżmy zatem, że proporcja osób zamieszkujących wschodnie województwa Polski i należących do mniejszości narodowych wynosi 0,2. Osoby te mają prawo do nauki swojego narodowego języka. Prawo to może być zrealizowane m.in. wówczas, gdy wśród nauczycieli szkół na tych terenach będzie co najmniej taki
/
:ami~t~jąc o .tym, że ~łą? standardowy Uj( to u/VN, przedział ufności dla sredmeJ fL mozemy zapIsac jako (oczywiście przy znanym u): p (X
- Za
l-N <
fL
< X + Za
l-N) =
przedziałów ufności dla średniej, przy nieznanym odchyleniu standardowym
w populacji:
l-a.
Załóżr~lJ, że 64 wylosowanych do ~róby gimnazjalistów uzyskało średnią liczbę punk.tow. z testu z matematyki X = 75. Odchylenie standardowe u = 20. PrzYJmując a = 0,05 wyznaczamy Za = 1,96.
p
Przedział ufności dla średniej w populacji będzie więc wynosił:
< 75 + 1,96(20/V54))
=
1-0,05,
< fL < 75 + 1,96(20/8))
=
0,95,
< fL < 75 + 1,96 . 2,5)
=
0,95,
p (75 - 4,9 < fL < 75 + 4,9)
=
0,95,
p (75 - 1,96(20/V54)
<
fL
P (75 - 1,96(20/8)
P (75 - 1,96·2,5
p ( X - Za
JN <
p ( X - ta
~ < fL < X + ta ~ )
fL
< X + Za
JN) = =
l - a, l - a,
(X -ta~ < fL < X+ta~) = l-a. N-l N-l
Podobnie jak w teście dwustronnym, wartości w rozkładzie t Studenta poszukujemy dla df = N-L Możemy dokonywać też oszacowania drugiego z parametrów populacji u. W większości podręczrrikówdo statystyki można odnaleźć odpowiednie wzory. Przywołajmy jeszcze reguły, na podstawie których możemy dokonywać oszacowania proporcji w populacji. Odpowiedni wzór będzie miał postać:
p (70,1 < fL < 79,9) = 0,95.
~ pra.w~~podobieństwem 0,95 możemy stwierdzić, że średnia populacji będzie SIę, mIescIła ~ pr~edziale od 70,1 do 79,9. Jeśli współczynnik ufności przyjęli bysmy ~a pOZIOmIe 0,01, to wówczas przedział ufności dla tej samej próby byłby
następujący:
p (75 - 2,58(20/V54)
< fL < 75 + 2,58(20/V54))
=
1-0,01,
< fL < 81,45)
=
0,99.
P (68,55
Teraz z prawdopodobieństwem równym 0,99 możemy powiedzieć że średnia z populacji znajdzie się w przedziale między 68,55 a 81,45. St~imy zatem przed wyborem, czy dany parametr szacować z większym prawdopodobień st,:em (mniejszy współczynnik ufności) i jednocześnie z mniejszą dokładnością ~wI~kszy zakres pr~e~ziału ufności), czy z mniejszym prawdopodobieństwem l .w~ększą dokł~dno~cIą. Ko?kretny wybór zależy od tego, co jest dla nas waż meJsze w okresloneJ sytuaCjI badawczej. W po~anym powyżej przykładzie założyliśmy, że mamy wiedzę o wielkości odchylema sta~dardow~g.~ w populacji u, co zwykle nie ma miejsca. Analogicznie d~ reguł, .ktore ustalrlrsmy dla testów istotności dla jednej próby w odniesiemu do wIelkości tej próby, korzystamy ze zmodyfikowanych formuł liczenia
Porównując wzór
na statystykę testu dla proporcji i wzór na estymację przedziaw wyrażeniu pod pierwiastkiem proporcja z populacji została zastąpiona proporcją z próby, zakładamy bowiem, iż proporcja z próby jest estymatorem proporcji z populacji. Założenie takie daje się utrzymać tylko dla dużych prób, dlatego należy bardzo ostrożnie stosować szacowanie proporcji na podstawie małych prób. łową, należy zauważyć, że
lliiilllll
Przedstawiona w tym rozdziale procedura weryfikacji testu istotności dla jednej próby służyła przede wszystkim zaprezentowaniu logicznych założeń leżących u podstaw stawiania hipotezy zerowej i alternatywnej oraz poznania istoty konstruowania statystyk testów i warunków weryfikacji postawionych hipotez. Trzeba sobie bowiem zdawać sprawę, że badacz bardzo rzadko posiada wiedzę na temat wielkości parametrów populacji lub na temat sensowności rozpatrywania założenia normalności rozkładu interesującej go zmiennej w populacji. W badaniach najczęściej mamy do czynienia z danymi pochodzącymi z prób i w odniesieniu do nich prowadzimy postępowanie weryfikacyjne. Będzie to tematem rozważań w następnych rozdziałach. Procedury będą się nam komplikować, ale ich istota pozostanie taka sama.
Ćwiczenia Ćwiczenie 5.1. Postaw hipotezę zerową i hipotezę alternatywną w stosunku do następujących
twierdzeń:
1. Menedżerowie różnią się od innych pracowników stopniem identyfikacji z miejscem pracy. 2. Senatorowie partii prawicowych różnią się od wszystkich senatorów pod względem poparcia dla polityki konserwatywnej. 3. Osoby należące do ruchów pacyfistycznych różnią się od innych osób stopniem poparcia dla użycia siły militarnej.
7. Czy proporcjonalnie więcej osób uzyska wynik gorszy niż 8,5, czy wynik lepszy niż 147 8. Jakie jest prawdopodobieństwowylosowania osoby, której wynik będzie lepszy niż 12,57 9. Jakie jest prawdopodobieństwowylosowania osoby, która uzyska wynik pomiędzy 6 a 8,9? 10. Jakie jest prawdopodobiellstwo wylosowania osoby, która uzyska wynik pomiędzy 6 a 12,57 Ćwiczenie 5.4. Każdy
testu
Ćwiczenie 5.2. Kontynuując rozważania powyżej przedstawionych kwestii dokonaj kolejnych kroków procedury testu istotności jeżeli:
1. Stopień identyfikacji z miejscem pracy jest mierzony w skali od O do 100. Średnia arytmetyczna dla pracowników wynosi 36,1 a odchylenie standardowe 11,1. Dla losowo wybranych 9 menedżerów średnia ta wynosi 81,8. 2. Średni poziom konserwatyzmu senatorów wynosi 56,2, przy odchyleniu standardowym 32,4. Dla 7 losowo wybranych senatorów partii prawicowych średnia ta wynosi 61,9. 3. Skalę postaw pacyfistycznych mierzy się od O do 10. Hipotetycznie średni poziom pacyfizmu wynosi 3,5 przy odchyleniu standardowym 0,5. Dla 25 członków ruchów pacyfistycznych średnia ta wynosi 2,8.
Ćwiczenie 5.3. Indeks mierzący umiejętność szybkiego czytania ze zrozumieniem jest zmienną o rozkładzie normalnym o średniej f.L = 8,9 i odchyleniu standardowym eJ = 3,1. 1. 2. 3. 4. 5. 6.
Jaka proporcja osób może uzyskać wynik lepszy niż 147 Jaka będzie proporcja osób, które uzyskają wynik pomiędzy 8,9 a 147 Jaka będzie proporcja osób, które uzyskają wynik gorszy niż 147 Jaka proporcja osób uzyska wynik gorszy niż 8,57 Jaka proporcja osób uzyska wynik pomiędzy średnią a 8,57 Jaka proporcja osób uzyska wynik pomiędzy 8,5 a 147
z poniżej zaprezentowanych problemów wymaga rozwiązania za pomocą Dobierz i przeprowadź właściwą procedurę.
istotności.
1. Średnia wieku mieszkańców Stanów Zjednoczonych wy~osi 32 lat~, .przy odchyleniu standardowym 14,5. Ponieważ wielu emeryt.ow p~zenos.l. SIę na Florydę zakładamy, że średnia wieku w tym stanie będzlC wy~sza ~IZ W. całym USA. Dla losowo dobranych 144 mieszkańców Florydy sredma wIeku . wynosi 34 lata. 2. Dla losowo dobranych 25 mieszkańców Miami średnia :riek.u ,wyn~sl ~6,~, przy odchyleniu standardowym s = 16. Co możemy pO':ledzlec o mlesz ancach tego miasta w stosunku do mieszkańcówcałego krajU (dane z punktu 1. pozostają w mocy)? . . 7 3. Jeśli próba z punktu 2. liczyłaby 64 osoby, Jaka byłaby nasza konklUZJa. Ćwiczenie 5.5.
Wszyscy więźniowie osadzani w zakładach karnych przechodzą tes~y .p~ycholo giczne. Oto parametry niektórych używanych w tych testach wskazmkow:
A. poparcie dla przemocy B. poczucie izolacji w stosunku do innych C. tolerancja wobec współwięźniów
57,1 56,2 62,5
15,2 32,4 31,6
Dla 50 losowo dobranych więźniów zakładu o złagodzonym rygorze średnia X dla powyższych wskaźników wynosiła odpowiednio: A - 37,4; B - 50,7; C - 71,3. Czy badani więźniowie są reprezentatywni dla ogółu osadzonych pod tych trzech wskaźników?
względem
Ćwiczenie 5.6.
Co
Innymi wskaźnikami tego samego testu co w poprzednim ćwiczeniu są:
A. współczucie dla ofiar przestępstwa B. skłonność do popełniania kolejnych przestępstw C. odrzucenie norm społecznych
74,9 48,6 42,5
Dla 25 więźniów odsiadujących wyroki pomzeJ 2 lat statystyki powyższych wskaźników przedstawiająsię następująco:
może zrobić
za nas komputer
Aby przeprowadzić test dla jednej próby potrzebna nam jest wartość parametru w populacji. Na ogół nie jest ona znana. Dla pewnych zmiennych możemy jednak znaleźć jej bardzo prawdopodobne oszacowanie. Taką zmienną jest np. liczba osób w gospodarstwie domowym. Przeciętna liczba osób w rodzinie w roku 1999 wynosiła 3,17 ("Rocznik Statystyczny", 2000). Tę wartość możemy potraktować jako parametr, naszą statystyką będzie średnia liczba osób w rodzinie respondentów PGSS (rys. 5.7). Statystyki dla jednej próby
x A. B. C.
78,2 60,2 36,6
(f Błąd
16,2 33,8
N LICZBA OSÓB W GOSPODARSTWIE DOMOWYM
35,5
2282
Średnia
Odchylenie standardowe
3,35
1,83
standardowy średniej
3,83E-02
Rysunek 5.7.
Czy badani wIęzmowie różnią się w swoich postawach w stosunku do ogółu osadzonych pod względem każdego z tych wskaźników?
Test dla jednej próby
Ćwiczenie 5.7.
Wartość testowana
Kobiety stanowią 52% populacji w Polsce. Metodą warstwową dobrano próby o liczebności 50 osób według wykonywanych zawodów. Proporcja kobiet w tych próbach była następująca: Zawód Nauczyciele Profesorowie szkół wyższych Pielęgniarki
Stomatolodzy
3.17 95%
t L1CZBAOSÓBW GOSPODARSTWIE DOMOWYM
4,630
dl
Istotność
Różnica
(dwustronna)
średnich
2281
,000
,18
przedział ufności
dla
różnicy średnich
Dolna granica
Górna granica
,10
,25
Rysunek 5.8.
0,72 0,38 0,84 0,45
Czy da się obronić hipotezę o nadreprezentowaniu, bądź niedoreprezentowaniu kobiet w tych zawodach?
Ćwiczenie 5.8. Stan zdrowia czterolatków oceniany jest w skali od 30 do 70. Dla 25 losowo dobranych przedszkolaków średnia tego wskaźnika wynosi X = 50, a odchylenie standardowe s = 9. Oszacuj średni wskaźnik zdrowia dla populacji 4-latków z prawdopodobieństwem 0,95.
Na podstawie przeprowadzonego testu musimy o.drzu~ić hip~~ezę zer?':ą (poziom istotności - w programie SPSS oznaczany Jako Istotnosc - mmeJszy od 0,05; rys. 5.8) o równości średniej liczby osób w rod~inie wśród responden~ów PGSS ze średnią liczbą osób w rodzinie według roczmlm statystycznego (proba PGSS nie odzwierciedla pod tym względem populacji). Dokonajmy analizy innej zmiennej. Aby ją utworzyć należy podzielić wartości zmiennej łączny dochód gospodarstwa domowego przez liczbę osób w go~podar stwie domowym i utworzyć nową zmienną dochód na 1 osobę w 'rOdzzme - to jest nasza statystyka. Teraz możemy przepro,wadzić ~e.st dla j.ednej próby .dla zmiennej dochód na 1 osobę w 'rOdzzme. Porownywac ją będzIemy z przecIęt nym miesięcznym rozporządzalnym dochodem na 1 osobę, .który w 1999 roku wynosił 560,43 zł ("Rocznik Statystyczny", 2000) to Jest nasz parametr (rys. 5.9).
Statystyki dla jednej próby Błąd
N DOCHÓD NA 1 OSOBĘ
2113
Średnia
Odchylenie standardowe
580,46
standardowy średniej
12,93
594,14
Rysunek 5.9. Test dla jednej próby Wartość testowana
= 560.43 95% przedział ufności dla
t
DOCHÓD NA 1 OSOBĘ
1,549
dl 2112
Istotność
Różnica
(dwustronna)
średnich
,121
20,03
różnicy średnich
Dolna granica
-5,32
I Górna granica I
45,37
Pojęcia
Rysunek 5.10.
podstawowe
próby niezależne próby zależne III test na homogeniczność wariancji .. jednoczynnikowa analiza wariancji
iii
l1li średnia całkowita
III
III
III
Nie mamy podstaw do odrzucenia hipotezy zerowej (poziom istotności więk szy od 0,05; rys. 5.10) o równości dochodu na jedną osobę w rodzinie wśród respondentów PGSS w stosunku do tego z rocznika statystycznego (pod tym względem próba odzwierciedla populację).
III I!I
III
Literatura 1. Blalock M. H.: Statystyka dla socjologów. Warszawa, PWN 1977. 2.
Brzeziński
J.: Metodologia
badań
psychologicznych. Wyd. 3. Warszawa, PWN
1999. 3. Frankfort-Nachmias Ch., Nachmias D.: Metody badawcze w naukach Poznań, Zysk i S-ka 2001. 4.
Gruszczyński
Śląski 1986.
społecznych.
L. A.: Elementy statystyki dla socjologów. Katowice, Uniwersytet
suma kwadratów oszacowanie wariancji całkowita suma kwadratów
III III
II
iii III
wewnątrzgrupowa suma kwadratów międzygrupowa suma kwadratów
suma kwadratów błędu wewnątrzgrupoweoszacowanie wariancji międzygrupowe oszacowanie wariancji test post hoc wskaźnik Scheffe'a
Sytuacja badawcza, w której znane nam są parametry populacji jest prawie niespotykana. To, czym najczęściej dysponujemy, to statystyki z próby - jednej lub więcej niż jednej. Określenie różnic między tymi próbami oraz ich przyczyn, to nasze zadanie badawcze. Występowanie tych różnic świadczy o związku mię dzy dwoma zmiennymi - jednej mierzonej na poziomie silnym, dla której liczymy statystyki oraz drugiej, mierzonej na poziomach słabych, której kategorie stanowią dla nas osobne próby. Statystyka oferuje nam pomoc w takiej analizie w postaci testów dla dwóch prób lub analizy wariancji. Podobnie jak w teście dla jednej próby, w testach dla dwóch prób porównujemy dwie średnie, z tą różnicą, że średnie te są teraz statystykami z dwóch prób. Na podstawie tego porównania dokonujemy uogólnienia dotyczącego średnich odpowiednich populacji, przy czym nie mamy teraz żadnej wiedzy na temat parametrów tych populacji. W ciąż jednak, o ile wielkość prób nie jest odpowiednio duża, musimy utrzymywać założenie o normalności rozkładu interesującej nas zmiennej w badanych populacjach. Test dla dwóch prób jest właściwie rodziną testów składającą się z wielu jego odmian. Dobór tego właściwego zależy od takich czynników jak sposób doboru
prób ~raz możliwość (bądź nie) przyjęcia założenia o równości wariancji w populac~ach. Sama. form~ła statystyki testu t oraz procedura wyznaczania liczby
stopm swobody Jest WIęC w tych testach bardziej skomplikowana. Analiza wariancji ANOVA
należy do rodziny procedur statystycznych takich
~amy~h jak testy istotności. Zatem tak j ak owe testy opiera się na porównywaniu
sre~~lch, ~ prób. To, co różni ją od poprzednio przedstawianych procedur, to
mozhwosc Jednoczesnego porównywania więcej niż dwóch średnich.
Jeśli konkluzją analizy wariancji jest odrzucenie hipotezy zerowej o równości średnich z wielu prób, to zwykle stosujemy procedurę post hoc, mającą na celu dokładne wskazanie, która nierówność leży u podstaw warunków odrzucenia.
6.1. Sposób doboru prób Jeżeli obie próby są odzwierciedleniem dwóch różnych populacji a struktura jednej z nich nie ma żadnego wpływu na strukturę drugiej, to możemy mówić o ~ró~ach niezależnych (każda z prób jest dobierana w sposób niezależny). Dla kazdeJ z nich możemy obliczyć właściwe jej statystyki (X i s lub 0-). Sytuację tę możemy przedstawić następująco:
Jeśli różnica ta okaże się statystycznie nieistotna (brak podstaw do odrzucenia hipotezy zerowej), będzie to oznaczało, iż wynika ona z błędu próby, a nie jest konsekwencją udziału w eksperymencie.
Istnieje też inny tryb prowadzenia eksperymentu niż przedstawiony powyżej. Mamy w nim do czynienia z zależnością między obiema próbami. To tak, jakbyśmy losowali do próby bliźniaki, z których jedno umieszczalibyśmyw grupie eksperymentalnej a drugie w grupie kontrolnej. Takie badania są oczywiście prowadzone ale częstszym przypadkiem jest zastosowanie schematu w taki sposób, że na tej samej losowo dobranej próbie przeprowadzamy badania dwukrotnie, przed eksperymentem i po jego zakoń czeniu. Fizycznie mamy jedną próbę ale w kategoriach zbiorów danych są to dwie próby. W takim przypadku są to próby zależne.
6.2. Test dla dwóch prób
Populacja 1
Populacja 2
Rozkładem
/11 nieznane al nieznane
/12 nieznane
będzie rozkład
(J2
Próba 1 liczebność
średnia
nieznane
liczebność
Xl
średnia SI
X2
82
stać:
= M2,
Hl: MI
'I M2
teście
między średnimi
Hipoteza zerowa, jaką możemy postawić w takim przypadku, będzie miała poHo: MI
dla jednej próby, statystykę testu obliczymy dzieląc różnicę przez odchylenie standardowe rozkładu z próby. Teraz błąd standardowy jest odchyleniem standardowym rozkładu różnic średnich z próby. Tak jak w
N2
odchylenie standardowe
niezależnych
z próby, który będziemy wykorzystywać tworząc statystykę testu t Studenta. Tym razem jednak nie będzie to rozkład średnich z próby (tak jak w teście dla jednej próby) ale rozkład różnic pomiędzy wszystkimi teoretycznie możliwymi parami średnich z próby.
Próba 2
NI
odchylenie standardowe
a hipoteza alternatywna:
(przy
Test istotności ma nam odpowiedzieć na pytanie, czy różnica między średni mi z prób jest odzwierciedleniem różnicy między odpowiednimi populacjami (populacja osób poddanych eksperymentowi istnieje tylko hipotetycznie, jako zbiorowość, którą utworzyłyby osoby, jeśli eksperyment zostałby rozszerzony).
teście dwustronnym lub MI < M2 czy MI > M2 dla testów jednostronnych).
Tego typu założenia towarzyszączęsto sytuacji eksperymentu z udziałem grupy ~ontrolnej. Z populacji losowo dobieramy dwie niezależne próby, jedną podda-
Jemy eksperymentowi, drugą nie. Tę drugą traktujemy jak grupę kontrolną.
Zatem błąd standardowy, którego poszukujemy, jest estymatorem opartym o odchylenie standardowe z dwóch prób. ciągu naszych rozważań dotyczących błędu standardowego będzie my się odnosić do wariancji, a nie odchyleń standardowych jako miar zróżni cowania. Jeśli wariancje z dwóch prób są zbliżone co do wartości, to możemy założyć, że wariancje populacji, z których próby pochodzą, są sobie równe, czyli = o-~.
W dalszym
o-r
W takim przypadku błąd standardowy będziemy liczyć jako średnią ważoną wariancji z dwóch prób. Mamy wówczas większe szanse na odrzucenie hipotezy zerowej niż w przypadku, gdy równości wariancji w populacjach nie możemy
założyć. Jeśli jednak jest tak, że a-f
w oparciu o Aby
inną formułę.
i= a-~,
to statystykę testu t musimy policzyć
Oto wyniki:
rozstrzygnąćkwestię, czy mamy do czynienia z sytuacją równości czy nie-
Próba 1
Próba 2
Xi
Xi
6 7 7 8 9 10
3 5
równości wariancji w populacjach stosujemy test na homogeniczność (jednorodność) wariancji. W zależności od jego wyniku stosujemy odpowiednią formułę statystyki t naszego testu zasadniczego. Nim przejdziemy do prezentacji tych formuł (na konkretnym przykładzie), ustalmy kolejne kroki procedury testu dla dwóch prób niezależnych: 1. Stawiamy Ho i Hl
dotyczące porównania średnich z prób.
2. Dla każdej próby określamy jej liczebność N, średnią X i wariancję 82. 3. Aby określić, którą formułę statystyki testu t zastosować, przeprowadzamy test na homogeniczność wariancji F: a. stawiamy Ho i Hl dotyczące porównania wariancji; b. liczymy statystykę testu F; c. określamy liczbę stopni swobody i obszar krytyczny Fa; d. porównujemy statystykę testu z obszarem krytycznym: jeżeli F ~ Fa, to zakładamy nierówność wariancji w populacjach, jeżeli F < Fa, to zakładamy, że wariancje w populacjach są sobie równe. 4. Obliczamy zdeterminowaną przez test na homogeniczność wariancji statystykę testu t. 5. Wyznaczamy liczbę stopni swobody i obszar krytyczny to:. 6. Dokonujemy porównania statystyki testu z obszarem krytycznym i wycią gamy wniosek z całego naszego postępowania weryfikacyjnego.
stanowić grupę poddawaną eksperymentowi a 5 -
grupę kontrolną.
Badanie dotyczy oceny dobrze znanego produktu w skali od O do 10. Studenci z grupy eksperymentalnej dokonywali tej oceny po obejrzeniu jednominutowej reklamówki, o sprawdzonej wcześniej znacznej sugestywności. Studenci z grupy kontrolnej oceniali produkt bez znajomości tej reklamówki.
7 8
LXi = 47
LXi = 29
Xl - Lx;jN = 47/6 = 7,83
X2 =
L
xi/N = 29/5 = 5,8
dla dwóch prób będziemy mogli ocenić, czy ró~nica pomię~zy badanego produktu przez grupę eksperymentalną l kontro}n ą jest skutkiem oglądania reklamy tego produktu, czy też wynika z błędu proby. Za
pomocą testu
średnią oceną
Zatem: Ho: /-il = /-i2, Hl: /-il > /-i2· Ze względu na różnicę średnich w próbach. i oczekiwany :fekt, o.dd~iaływania reklamy hipoteza alternatywna została zapIsana w postacI własClwej dla testu jednost:onnego - prawostronnego (w pakietach komputerowych standardowo przeprowadzany jest test dwustronny). Schemat
Przypuśćmy, że z grupy studenckiej (zbiorowości, na której najczęsclej prowadzone są eksperymenty) wylosowano 11 osób. Spośród nich 6 osób będzie
6
wyjściowy dla
tego
przykładu możemy zapisać jako:
Populacja 1
Populacja 2
wszystkie osoby, któr-e widziały r-ekłamę
wszystkie osoby, któr-e nie widziały r-eklamy
{lI
nieznane
{l2
O'i nieznane ł
nieznane
O'~ nieznane
Próba 2
Próba 1
gr-upa ekspcr-ymentalna
gT"Upa kontmIna
liczebność
liczebność
średnia
Xl
NI = 6
7,83 odchylenie standardowe =
si = 1,81
= 5 5,8 odchylenie standardowe s~
średnia
X2
Nz =
=
2,96
Teraz możemy przystąpić do testu na homogeniczność wariancji: H o·. H .
2
0"1
W omawianym
przykładzie statystyka
7,83 - 5,8
(
W tym teście hipoteza alternatywna ma zawsze postać właściwą dla testu dwustronnego.
Statystykę testu F obliczamy na podstawie następującego wzoru:
=
będzie wynosić:
t = --,::.======== = 1,971. 6,1,81+5,2,96) (1 + 1)
2-1- 2 1· 0"1 ;0"2'
F
ta
2
= 0"2'
6+5-2
6
5
Wartości
obszaru krytycznego poszukujemy w tablicach rozkładu t Studenta dla testu jednostronnego, najpierw dla poziomu istotności oc = 0,05. Liczba stopni swobody dla tego typu testu jest wyznaczona następująco:
s2
większe 2 Smniejsze
df = NI
+ N2 -
2
= 6 + 5 - 2 = 9,
zatem:
W tym przypadku: F
= s~ = 2,96 - 1 si
1,81 -
III
,64.
Mamy policzoną statystykę testu, którą musimy porównać do obszaru krytycznego wyznaczonego przez rozkład F (Snedecora). Zestandaryzowane wartości tego rozkładu zawiera załącznik 3.
Ab~ odnale,ź~ "! nim obszar krytyczny, oprócz poziomu istotności musimy znać dWIe wartOSC1 lIczby stopni swobody (zaznaczone w tablicach jako n i n czego nie należy mylić z liczebnością). 1 2, Li:zb.ę sto~ni s:"o?ody oznaczoną jako nI obliczamy jako dl = N -1, dla próby, ktorej wanancJa Jest w liczniku statystyki F. Dla naszego przykładu liczba st,opni swobo~y liczn.ika dl = 5 - 1 = 4. Wartości tej· szukamy w pierwszym gornym rzędzIe tabelI. Liczbę stopni swobody oznaczoną jako n2 obliczamy również jako dl = N - 1 ale dla prób~, której wal~iancja znajduje się w mianowniku statystyki F. W ty~ przypadku lIczba stopm swobody mianownika dl = 6 - 1 = 5. Wartości tej szukamy w pierwszej kolumnie załącznika 3. Na przecięciu się wiersza i kolumny właściwych dla odpowiedniej liczby stopni swobody znajdujemy wartość obszaru krytycznego Fa = 5,19.
III
dla oc dla oc
Podsumujmy nasze dotychczasowe rozważania. Postawiliśmy hipotezę zerową, że badany produkt jest średnio jednakowo oceniany przez tych, którzy widzieli jego reklamę i przez tych, którzy tej reklamy nie widzieli. W hipotezie alternatywnej założyliśmy, że oglądanie reklamy wpływa na podwyższenie oceny badanego produktu. Obliczyliśmy liczebność, średnią arytmetyczną i wariancję dla każdej próby. Przeprowadziliśmy test na homogeniczność wariancji w populacji aby ustalić, z której formuły statystyki testu t mamy korzystać. W tym przypadku założenie o równości wariancji populacji zostało utrzymane. Obliczyliśmy statystykę testu t i wyznaczyliśmy obszar krytyczny testu. Z prawdopodobieństwemp < 0,05 odrzuciliśmy hipotezę zerową, przyjmując wniosek, że oglądanie reklamy badanego produktu miało wpływ na lepszą jego ocenę. Spróbujmy teraz tak zmienić poszczególne wartości w grupie kontrolnej aby ich zróżnicowanie przy niezmienionej liczebności i ich sumie, a więc przy niezmienionej średniej.
wzrosło
Teraz wskazania grupy kontrolnej Xi
1
Ponieważ F. ~ .Fa , ~dyż. 1,64 < 5,19, nie mamy podstaw do odrzucenia hipo-
3 6 9 10
tezy zeroweJ, 1Z wanancJe obu populacji są sobie równe. W takim przypadku t obliczamy według następującego wzoru:
statystykę testu
t
=
X 1 -X2
----r======~==
(~,st~~~~~) (~, + ~2)
= 0,05; ta = 1,833 < t = 1,971 - odrzucamy Ho, = 0,025; ta = 2,262 > t = 1,971 - p < 0,05.
LXi
= 29
X 2 = Lx;jN2 = 5,8
mogłyby wyglądać następująco:
III
III III
5. Mniejsza z liczebności prób jest liczebność grupy kontrolnej, wobec tego liczba stopni swobody będzie równa tej liczebności df = 5. Dla oc = 0,05 obszar krytyczny dla testu jednostronnego odczytany z tablicy rozkładu t Studenta wynosi ta = 2,015
liczebność
N 2 = 5, średnia X 2 = 5,8, wariancja s§ = 11,76.
Dla tego . całą procedurę testu " nowego zbioru danych pr zeprowad'zmy ponowme dla dwoch prob (według kolejnych przedstawionych wcześniej kroków): 1. Ho: /-lI =/-l2, Hl: /-lI 2.
>
Średnia Wariancja
NI
6. Zatem, jeśli ta
statystyka testu
-I CT~,
c. Fa = 5,19
statystyka próby - parametr populacji _-c--=----'---'---'---=---------.Cbłąd standardowy
jącą postać:
1,81 - 6,497,
<. F
=
Symboliczny zapis tej reguły dla dwóch prób niezależnych przyjąłby następu
= s§ = 11,76 _ si
= 2,015 > t = 1,115, to nie mamy podstaw do odrzucenia Ho·
Przyjrzyjmy się teraz bliżej statystykom testu t. Opiszmy słownie stosowaną wcześniej regułę budowy statystyki testu dla jednej próby
N2 = 5 X2 = 5,8 s~ = 11,76
6 Xl = 7,83 si = 1,81 =
3. a. Ho: CT? = CT~, Hl: CT?
b F .
7,83 - 5,8
--r======== = 1,115. + 11,76) (~ 6-1 5-1
/-l2·
---~--------Grupa eksperymentalna Grupa kontrolna Liczebność
t=
= ?,497, odrzucamy więc Ho z p
~ozostał,t~b sam Jak
< 0,05, obszar krytyczny
w przykładzie pierwotnym, llczebnosCl grup eksperymentalnej i kontrolnej.
gdyż nie uległy zmianie
4. W przypa~ku, kiedy nie możemy utrzymać założenia o równości wariancji w populacjach statystykę testu t liczymy w oparciu o następujący wzór:
Ponieważ w hipotezie zerowej założyliśmy równość średnich w populacjach, to /-lI - /-l2 = i w liczniku naszej statystyki pozostanie tylko różnica średnich
°
z prób, Xl -
X2.
Przejdźmy teraz do błędu standardowego, który możemy zapisać jako:
X l -X2
t=-r=~~~=
( N ,Si- l + N 2s~- l )
Liczbę
stopni swobody wyznacza mniejsza z
Q!;YIKQ)pl'zybli,żenierzeczywistej
liczebności
Jeżeli założymy równość wariancji w obu populacjach, to wówczas prób.
liczby stopni swobody dla tego skomplikowana formuła (zainteresowanych 3j()dl'izukaJlia w innych podręcznikach, nam będzie ją lipotrzeby tego testu wystarczy wartość przybliżona).
YZJj.a<~za dość
Na ogół próby mają różną liczebność, wobec tego estymator CT jest średnią ważoną z wariancji w obu próbach podzieloną przez odpowiedniąliczbę stopni swobody. Zatem:
0-=
NIsi + N 2 s§ NI +N2 - 2
i w rezultacie:
0-5(1-5(2
=
(NI8i+N28~) (~+~) NI
+ N2 -
2
NI
N2
'
Teraz wzór na statystykętestu dl d 'h 'b" . . , , . '.. . a woc pro mezaleznych przy załozemu rownoscI warIanCjI w populacjach staJ'e SI'ę l' . ł J 'l' ł" , ,. . " . z Ozumra y. es l za ozema o rownosCI warIanCjI w populacjach nie mo' t' . . zemy u rzymac, to oba odchylema standardowe mUsImy oszacować oddzielnI'e dł' . d ,. , o wo UJąc SIę o statystyk z obu prob, a WIęC:
możemy więc mówić o jednej próbie, gdyż cały czas prowadzimy badania na tej samej grupie osób, a z drugiej strony mamy do dyspozycji dwa zestawy danych, czyli tak jakbyśmy mieli dwie próby. Zatem procedura testu istotności dla dwóch prób zależnych będzie w sobie łączyć elementy testu dla jednej próby z elementami testu dla dwóch prób niezależnych.
Dla jasności wywodu najlepiej
posłużyć się
prostym
przykładem.
···r;l···~!·~X~!.~.f:l . Przypuśćmy, że
Na koniec naszY~h,r~zważań o teście istotności dla dwóch prób niezależnych trzeba pr~ypommec, ze korzystając z programów komputerowych przy liczeniu tych testow n~leż~.wiedzieć, czy odpowiednie formuły oparte są o obciążony e~tymator wanancJI 82, czy nieobciążony ei3ty-matorwariancJt8-2. Dla tego drugIego przypadku formuły liczenia statystyki testu będą miały zmodyfikowaną postać (tak liczy program SPSS): II
nasz eksperyment badający wpływ reklamy na ocenę danego produktu został zaprojektowany w taki sposób, iż wśród studentów wylosowaliśmy 6 osób, które dokonały oceny produktu. Następnie osoby te obejrzały reklamę i dokonały ponownej oceny produktu. Oto
wartości wskazań jakie otrzymaliśmy:
Przed eksperymentem
Po eksperymencie
5 5 7 8 7 3
10 6 8 7 9 7
statystyka testu t dla dwóch niezależnych prób przy założeniu równości wariancji w populacjach:
dla liczby stopni swobody df = NI
+ N2 -
2;
• st~t~styk~ tes.~u t dla dwóch niezależnych prób przy założeniu braku równOSCI warIanCjI w populacji:
6.3. Test dla dwóch prób zależnych O~reśl~li~~yjuż wcz.~śniej, że z dwiema próbami zależnymi mamy do czynienia n~JczęscIeJ w sytuaCjI eksperymentu polegającegona tym, że badamy dwukrotme tę samą grupę osób, raz "przed" i raz "po" eksperymencie. Z jednej strony
L: Xi = 35
L: Xi = 47
Xprzed = 5,83
X pa = 7,83
się 6 osób i 6 par wartości Np. Przy próbach upow kierunku rosnącym lub malejącym musimy pamiętać o tym, że możemy to zrobić tylko w odniesieniu do wartości "przed" lub tylko wartości "po" eksperymencie, par wskazań nie możemy bowiem rozłączać. Jeśli przyjrzymy się tym parom bliżej, to zauważymy, że w pięciu przypadkach na sześć po obejrzeniu reklamy ocena produktu uległa podwyższeniu.
W naszej próbie znajduje rządkowania wartości
Problem, który staramy się poddać testowi, to właśnie taki ocenę produktu, jaki zaobserwowaliśmyw naszej próbie. Możemy
zatem
postawić
hipotezy Ho:
zerową j.Lprzed
Hl: j.Lprzed
i
alternatywną:
= IL pa , <
j.Lpo·
wpływ
reklamy na
Test, który będziemy przeprowadzać zasadniczo odnosi się do różnic wskazań dla każdej pary.
Przed eksperymentem
Po eksperymencie
D
D-D
(D-D?
5 5 7 8 7 3
10 6 8 7 g 7
5
3 -l -l -3 O
g
2
4
Różnice te możemy zapisać jako:
D =
X po -
Xprzed'
Możemy więc dokonać modyfikacji hipotezy zerowej i alternatywnej, tak aby
l l -l
2 4
r. = 12
odnosiły się bezpośrednio do przedmiotu naszego zainteresowania; Ho: f.lD Hl: f.lD
= 0, > O.
Przez f.lD rozumiemy średnią wszystkich różnic we wskazaniach w populacji. Jeśli zakładamy, że obejrzenie reklamy będzie powodowało wzrost oceny produktu, to różnice te będą dodatnie i średnia tych różnic również będzie dodatnia. Stąd kierunek znaku nierówności w hipotezie alternatywnej.
Traktując różnice wskazań jako punkt odniesienia, zastosujmy do nich statystykę testu t dla jednej próby:
fJ - f.lD t=---=== sD/)Np -1' gdzie: N p - liczba par w próbie, fJ - średnia różnic wskazań w próbie, SD _ odchylenie standardowe różnic wskazań w próbie, które obliczymy na podstawie wzoru; SD =
./r.(D - D)2
V
Np
a f.lD -- średnia różnic wskazań dla wszystkich możliwych par w populacji.
Ponieważ w hipotezie zerowej założyliśmy, że średnia różnic dla populacji będzie się równała'zero, zatem ostateczny wzór na statystykę testu t będzie następu
jący:
fJ t = -----=== sD/)Np -1' dla df
= Np
-
1.
Policzmy więc statystykę testu dla naszego przykładu.
l l
g O
r. = 24
z tego:
fJ =
r.N D = 126 = 2, p
- Jr. (D - D)2 _ N
SD -
a na tej podstawie
_ t-
JN
p -
= 1
liczba stopni swobody df I!I
III
dla a dla a
2 2/V6=!
= Np
-
1
t:
= _2_ = 2V5 = v'5 = 2,236; 2/V5
2
= 6 - 1 = 5, a zatem:
= 0,05; to = 2,015 < t = 2,236 - odrzucamy Ho, = 0,025; to = 2,571 > t = 2,236 - p < 0,05.
Możemy postawić ną ocenę
f24 -- 2, V6
możemy obliczyć statystykę testu
fJ
SD/
-
p
wniosek, że danego produktu.
oglądanie
reklamy
wpływa na
bardziej pozytyw-
6.4. Jednoczynnikowa analiza wariancji Analiza wariancji jest procedurą pozwalającą na zbadanie związku dwóch zmiennych. Jedna z tych zmiennych (zwykle zmienna zależna) musi być ~ier~o na na poziomach silnych, druga (zmienna niezależna) na dowolnym pOZlOmle. Zwykle jednak zmienna niezależnajest zmienną mierzoną na p~ziomac.h sł~?!ch i wówczas każda kategoria tej zmiennej z punktu widzenia analIzy wanancJl Jest osobną próbą·
Przy innych kombinacjach poziomów pomiarów zmiennych do analizy ich związ ku możemy wykorzystać inne metody, o których powiemy m.in. w następnym rozdziale.
zmienna niezależna ma wpływ na zmienną zależną, to powImen się on przejawiać w taki sposób, że wartości zmiennej zależnej wskazywane przez respondentów należących do tej samej kategorii zmiennej niezależnej powinny być do siebie zbliżone, natomiast powinny się różnić od wartości wskazywanych przez respondentów należących do innej kategorii zmiennej niezależnej. Zatem średnia wskazań wartości zmiennej zależnej powinna być różna dla każ dej kategorii zmiennej niezależnej.
Aby ją określić postanowiono sprawdzić trzy sposoby:
Jeśli
Wytypowano 30 osób do pierwszego szkolenia. Każde 10 osób miało .odbyć trening w innym trybie i czasie (określonymi jak wyżej). Po zakończe.~lU .treningu każda poddana mu osoba miała określić swój po~iom satysfa~cJI z Jego ukończenia w skali od O (brak satysfakcji) do 5 (całkowIta satysfakcJa).
Jeśli
zmienna niezależna ma dwie kategorie, to różnice ich średnich możemy za pomocą testu dla dwóch prób. Jeśli tych kategorii jest więcej stosujemy analizę wariancji.
zbadać
Procedura rozumiana jako kolejne kroki postępowania, jest w analizie wariancji identyczna jak w pozostałych testach istotności: 1. Najpierw stawiamy hipotezę zerową, w której zakładamy równość średnich (z wartości zmiennej zależnej) dla wszystkich prób (kategorii zmiennej niezależnej).
2. W hipotezie alternatywnej zakładamy, że dla co najmniej jednej pary śred nich zachodzi stosunek nierówności. Inaczej niż w testach istotności, w hipotezie alternatywnej, nie można określić kierunku tej nierówności. 3. Na podstawie danych obliczamy statystykę testu F. Obszar krytyczny wyznaczamy w oparciu o tablice rozkładu F. 4. Jeżeli statystyka testu jest większa od wielkości obszaru krytycznego dla poziomu istotności 0,05, to odrzucamy hipotezę zerową. Przeprowadziliśmyjednoczynnikową analizę
wariancji. Możemy wobec tego istnieje związek między zmienną niezależną i zależną, bowiem od tego, w której kategorii zmiennej niezależnej znajdzie się respondent, zależy jego odpowiedź na pytanie (wartość) mierzona przez zmienną zależną. powiedzieć, że
Procedura przedstawiona powyżej nie jest dla nas już żadną nowością. To co jest w niej do tej pory nieznane, to logika konstruowania i liczenia statystyki testu oraz związane z nią nazewnictwo. Zobaczmy to na przykładzie.
1. Pierwszy polegał na rozpoczynaniu dnia pracy od poniedziałku do piątku, od godzinnego treningu. 2. Drugi sposób również polegał na rozłożeniu treningu na pięć godzinnych spotkań (od poniedziałku do piątku) ale odbywających się wieczorem. 3. Trzeci zakładał odbycie całego treningu w sobotę (z odpowiednimi przerwami rekreacyjnymi).
Nasza próba to poddane szkoleniu 30 osób, każdą z tych osób charakteryzują dwie zmienne: III III
tryb szkolenia (zmienna niezależna), ocena satysfakcji z odbycia szkolenia (zmienna zależna).
Aby relacje pomiędzy tymi zmiennymi nie były zakłócone przez żadne inne czynniki, przy doborze prób la-osobowych trzeba zwrócić uwagę ~~ to, aby był!. one do siebie "podobne" pod względem średniej wieku pracowmkow, proporcjI płci, chęci lub niechęci uczestnictwa w treningu itp. Na kwestię tę musimy zwracać uwagę tylko w warunkach ekspery~~nta:nych: tam gdzie następuje arbitralne przypisanie respondentów do kategorII zmIennej niezależnej (tu trybu i czasu szkolenia). Przyjmijmy, że dołożyliśmy wszelkich starań aby wyelimi~ować ~zynniki mogące zakłócić związek pomiędzy trybem i czase~ ,od.bywama trem~gu a satysfakcją z jego ukończenia. Możemy zatem postawIc hIpotezę zerową·
Ho:
fJdzień = fJwieczór = fJsobota'
Hipotezy alternatywnej nie da się tak prosto zapisać. Może ona oczywiście przybrać formę: Hl:
fJdzień
i' fJwieczór i' fJsobota,
ale hipotezę zerową będzie również wykluczać jakakolwiek z następujących nieZałóżmy sytuację quasi-eksperymentalną. Kierownictwo
agencji reklamowej jest zainteresowane jak najbardziej efektywną formą szkolenia swoich pracowników w zakresie ich zdolności do komunikowania się z klientami. W tym celu stworzono specjalny pięciogodzinny program treningowy. Kwestią nierozstrzygniętą pozostała forma jego aplikacji.
równości:
i' fJwieczór, fJwieczór i' fJsobota, fJdzień i' fJsobota' fJdzień
Oto ocena poziomu satysfakcji po przeprowadzonym treningu we wszystkich trzech grupach (Xi oznacza poziom satysfakcji). Dzień
Wieczór
Sobota
2 3 4 4 4 4 5 5 5 5
o
2 3 3 3 4 4 4 5 5 5
1
2 2 2 3 3 4 4 5
Dla każdego przypadku zostanie podana wartość statystyki F, którą jeszcze nie wiemy jak policzyć oraz średnia całkowita. Średnia całkowita to średnia arytmetyczna policzona po wszystkich wartościach zmiennej zależnej, bez uwzględ niania podziału na kategorie zmiennej niezależnej. Przypadek 1. Dzień
Wieczór
3 3 3 5 5 5
3 3 3 5 5 5
EXiD EXiD
= 41
XD = 41/10 = 4,1
EXiW
= 26
Xw = 26/10 = 2,6
EXiS
= 38
Xs = 38/10 =
= 24
XD = 24/6 = 4
EXiW
= 24
Xw=24/6=4
3,8
F Na podstawie wielkości średnich dla każdego trybu i czasu treningu możemy sądzić, że ma on wpływ na poczucie satysfakcji z jego ukończenia. Jest to jednak tylko przeczucie i aby sprawdzić jego statystyczną istotność zastosujemy analizę wariancji. Kolejnym jej krokiem powinno być obliczenie statystyki F. Zacznijmy od intuicyjnego zrozumienia, czym jest statystyka F. Przyjmijmy, że jest ona miarą tego, w jakim stopniu kategorie zmiennej niezależnej wyjaśniają zróżnicowanie wartości zmiennej zależnej. Jeśli
kategorie zmiennej niezależnej są zupełnie bezużyteczne w wyjaśnianiu zmiennej zależnej, statystyka F powinna być równa zero (brak związku między zmiennymi).
= 0,
średnia całkowita
X = 48/12 = 4.
Średnie z wartości zmiennej zależnej dla poszczególnych kategorii zmiennej niezależnej nie różnią się od średniej całkowitej. Wobec tego wiedza o tym, czy ktoś odbywa trening w dzień czy wieczorem, nie ma żadnego znaczenia przy przewidywaniu satysfakcji, jaką będzie on miał z ukończenia treningu. Statystyka F będzie wynosić zero. Wprowadźmy drobną zmianę we wskazaniach satysfakcji polegającą na tym, że w grupie dziennej jeszcze jedna osoba wskaże 5, a w grupie wieczornej jeszcze jedna osoba wskaże 3. W ten sposób średnia całkowita nie ulegnie zmianie.
zróżnicowania
W im większej mierze kategorie zmiennej niezależnej będą wyjaśniały zróżni cowanie wartości zmiennej zależnej, tym statystyka F będzie miała większą wartość (związek między zmiennymi będzie silniejszy). Jeśli
kategorie zmiennej
Przypadek 2. Dzień
Wieczór
3
3 3 3 3 5 5
3 5 5 5 5
niezależnej będą wyjaśniały całkowicie zróżnicowanie
wartości zmiennej zależnej, to wielkość statystyki F będzie dążyć do plus nieskończoności.
Dla celów ilustratywnych przyjmijmy jeszcze prostszą wersję eksperymentu szkoleniowego (potem powrócimy do pierwotnych danych). Załóżmy, że bierze w nim udział 12 osób szkolonych w dzień lub wieczorem (po 6 w każdej grupie). Rozpatrzmy różne przypadki oddziaływania zmiennej niezależnej czasu treningu, na zmienną zależną - ocenę satysfakcji z ukończenia treningu.
EXiD
= 26
XD = 26/6 = 4,33
EXiW
Xw
= 22
= 22/6 = 3,66
F = 1,248, średnia całkowita X = 48/12 = 4.
Teraz średnie.z wartości satysf .. z u k' . ,rozmą . . się . ,.. " poziomu , " a kCJI ~nczonego trenmgu mIędzy sobą l . rozmą "d oso'b o dbywa. .SIę, od . sredmeJ całkowiteJ' . Sred' ma wsro Jących szkoleme w dZlen Jest wyższa niż średnia dl db . h kl' wieczorem. a o ywającyc sz o eme Kontynuujmy wprowadzanie zm'lan we ws k ' . zakreSIe . Jak . poazamach w takIm . . przedmo: Jedno wskazanie 5 więc . . d' . . . . , . .. ej w grupIe zlenneJ l Jedno 3 WIęcej w grupIe wIeczorneJ. Przypadek 3. Dzień
Wieczór
3 5 5 5 5 5
3 3 3 3 3 5
LXiD =
XD
28
= 28/6 = 4,67
LXiW
Xw
F = 7,994, średnia całkowita
Zauważmy, że zróżnicowanie wartości zmiennej zależnej w przypadku 1. wystę puje tylko wewnątrz kategorii zmiennej niezależnej. Średnie dla każdej kategorii nie różnią się od średniej całkowitej. W przypadku 2. i 3. w coraz większym stopniu zróżnicowaniewartości zmiennej zależnej da się wyjaśnić przez różnice między kategoriami zmiennej niezależnej, a więc przez różnice między średnimi dla poszczególnych kategorii a średnią całkowitą· W korlcu, w przypadku 4. nie występuje w ogóle zróżnicowanie wartości zmiennej zależnej wewnątrz kategorii zmiennej niezależnej, a występuje tylko między kategoriami. Wszystkie odchylenia wartości zmiennej zależnej od średniej całkowitej mogą być wyjaśnione przez odpowiednie średnie kategorii zmiennej niezależnej . Zatem różnica pomiędzy wartością pojedynczego pomiaru a średnią całkowitą może zostać rozłożona na dwa składniki: różnicę pomiędzy wartością pojedynczego pomiaru a średnią kategorii zmiennej niezależnej, do której ten pomiar należy, oraz różnicę pomiędzy tą średnią kategorii a średnią całkowitą· Alge-
= 20
= 20/6 =
W tym ostatnim przypadku wszystkie rozmce we wskazaniach satysfakcji z ukończonego szkolenia dadzą się wyjaśnić przez to, w jakim czasie ono się odbywało. Jeśli ktoś odbywał trening w dzień to wiemy, że swą satysfakcję z kursu oceni na 5 a jeśli ktoś miał trening wieczorem, to jego satysfakcja wynosi 3. Zmienna niezależna z zależną są w związku idealnym.
3,33
X = 48/12 = 4.
braicznie można to zapisać jako:
Ró~nica .p~międ~y ~red~imi z wartości zmiennej zależnej dla każdej kategorii zmlenn.eJ ~leza,le~neJ ZWI~~sza się. Rośnie odchylenie tych średnich od średniej całko;"lteJ' Rosme :vartosc statystyki F. W coraz większym stopniu satysfakcja z uk~nczonego trenmgu zależy od tego, o jakiej porze był on prowadzony. Idźmy dalej według takiego samego schematu.
(wartość pomiaru - śr. całkowita) = = (wartość pomiaru - śr. kategorii)
Dla przypadku 1., dla wartości pomiaru 5, niezależnie od kategorii (dzień, wieczór) będziemy mieli:
Przypadek 4. Dzień
Wieczór
5 5 5 5 5 5
3 3 3 3 3 3
LXiD
XD
= 30
= 30/6 = 5
LXiW
+ (śr. kategorii - śr. całkowita).
(5 - 4) = (5 - 4) + (4 - 4), (1) = (1) + (O), 1 = 1 + O, 1 = 1, natomiast dla wartości pomiaru 3, również niezależnie od kategorii, otrzymujemy:
(3 - 4) = (3 - 4) + (4 - 4), (-1) = (-1) + (O),
= 18
Xw = 18/6 = 3
-1=-1+0, ~e względu
na dzielenie przez Onie da się policzyć wartości F X = 48/12 = 4. '
średnia całkowita
-1
=
-1.
a Dlt pr~!pa~ku 4:, ~la wartości pomiaru 5, która występuje tylko w jednej ka egoru zmIennej mezależnej (dzień), będziemy mieli:
(5 - 4) (1)
=
=
(5 - 5) + (5 - 4), (O) + (1),
1 = 0+1, 1 = 1, natomiast dla wartości pomiaru 3, która występuJ'e tylko w kategorii . '" uzyskamy: "wleczOl' , = (3 - 3) + (3 - 4), (-1) = (O) + (-1), -1=0-1,
(3 - 4)
Mianownik we wzorze na wartość estymatora jest równy liczbie stopni swobody. Licznik jest sumą kwadratów odchyleń wartości pojedynczych pomiarów od średniej. Dla każdego pomiaru wyznaczamy odległość, jaka dzieli ten pomiar od średniej i aby pozbyć się wartości ujemnych podnosimy ją do kwadratu. W analizie wariancji wyrażenie to nazywamy w skrócie sumą kwadratów i oznaczamy SK. Jeśli sumę kwadratów podzielimy przez liczebność, to otrzymamy średnie zróż nicowanie odchylenia przypadające na każdy pomiar, czyli wariancję. Jeżeli natomiast sumę kwadratów podzielimy przez liczbę stopni swobody, to otrzymamy oszacowanie wariancji (OW).
Zatem
powyższy wzór
na estymator wariancji OW
= SK. df
-1 = -1. W
p~zypadku.:. różnica pomiędzy średnią kategorii a średnią całkowitą zawsze
będzIe zero,.. a w przypadku 4 . różnica poml'ęd zy war t OSClą ' . pomIa. ,wynOSlC .
ru a.sredmą kate?oru zawsz: będ.zie równa zero. Są to dwa skrajne przypadki.
~ plerv.:szym z ~l(~h kat~go:le zmIennej niezależnej w ogóle nie wyjaśniają zróż
mc.owama warto~cl ~oml~row,. w.czwartym wyjaśniają je całkowicie. Przypadki 2. l 3., s.ą sytu~cJaml posredmml. W drugim przypadku odchylenie pomiędzy wart~sclą p?mla~U a srednią całkowitą w 1/3 może być przy przypisane różni cy mIędzy kategorii a średnią całkowitą , zaś w 2/3 różnl'cy po mIę . d zy t ' . sredmą . , war OSClą ~~mlaru ~ srednią kategorii. W przypadku trzecim odchylenie pomiędzy .,. ,. .wartOSClą . pomIaru , .a średnią całkowitą w 2/3 moz'e. b yc' wYjasmone przez rozn~cę pomlędz! .sredm~ kategorii a średnią całkowitą, a w 1/3 przez różnicę pomIędzy wartosclą pomIaru a średnią kategorii. Logika analizy ;varia?c:ji jest oparta na podziale odległości wartości pomiaru w stosunku do sredmej całkowiteJ' na część która moz'e b ' .,. '. .. . , y c wYJasmona przez sredmą kat~goru .1 na część, która przez tę średnią wyjaśniona być nie może. ~ostępo';~~le t~ jest analogiczne do tego, które zastosowaliśmy powyżej, z tą jednak rozmcą, z~ odl~gł.ości w procedurze ANOVA podnoszone są do kwadratu - pozwala to umknąc lIczb ujemnych.
Wprowadzając terminologię właściwą dla procedury analizy warianCj'l' b d . . d ł ' d " , ę Zlemy, SIę o ':0 !wac o pOjęCIa estymatora wariancji. Przypomnijmy zatem jego wzor defimcYJny: 3-2
=
L
(Xi -
xy
N-l
możemy zapisać jako:
Nawiązując
do poprzednich rozważań i powyżej wprowadzonej terminologii przedstawimy teraz dokładną procedurę liczenia statystyki F. To, co ANOVA liczy najpierw, to całkowita suma kwadratów SKc, czyli suma kwadratów odchyleń wartości wszystkich pomiarów od średniej całkowitej. Ta całkowita suma kwadratów składa się z dwóch części: takiej, która może być wyjaśniona przez odchylenia średnich poszczególnych kategorii od średniej całkowitej oraz takiej, która przez te odchylenia wyjaśniona być nie może. Pierwsza to międzygrupowa suma kwadratów SK M a druga wa suma kwadratów SKw.
wewnątrzgrupo
Wewnątrzgrupowa suma
kwadratów jest odzwierciedleniem odchyleń wartopomiarów od odpowiadającej im średniej kategorii i bywa nazywana sumą kwadratów błędu.
ści
Wyżej opisaną zależność możemy zapisać
SK c Podziału całkowitej
jako:
= SKM + SKw.
sumy kwadratów używamy do obliczenia dwóch oddzielnych oszacowań wariancji. Pierwsze to międzygrupowe oszacowanie wariancji. Jest to ta część wariancji populacji, która może być wyjaśniona przez kategorie zmiennej niezależnej. Obliczamy ją, dzieląc międzygrupową sumę kwadratów przez odpowiednią liczbę stopni swobody df M' Ponieważ jednostkami, w stosunku do których prowadzimy tę część analizy są kategorie zmiennej niezależnej, wobec tego liczba stopni swobody będzie równa liczbie kategorii minus jeden (df M = k -1).
Zatem:
Druga część wariancji populacji to ta, która nie może być wyjaśniona przez kategorie zmiennej niezależnej - to wewnątrzgrupoweoszacowanie wariancji. Obliczamy ją, dzieląc wewnątrzgrupową sumę kwadratów przez odpowiednią liczbę stopni swobody dfw. Ta liczba stopni swobody to różnica pomiędzy całkowitą liczbą stopni swobody a liczbą stopni swobody dla międzygrupowego oszacowania wariancji (dfw = (N -1) - (k - 1)). Stąd:
OW
_ SKw _ SKw w - df w - (N - 1) - (k - 1)"
Podobnie jak sumy kwadratów, liczby stopni swobody tywny, co oznacza, że:
df C = df M
+ df w = (k -
1)
+ [(N -
mają
charakter addy-
Sobota
2 3 4 4 4 4 5 5 5 5
O 1 2 2 2 3 3 4 4 5
2 3 3 3 4 4 4 5 5 5
2:= XiD = 41 XD = 4,1 ND = 10
2:=XiW = 26 Xw =2,6 Nw = 10
2:= XiS = 38 Xs = 3,8 Ns = 10
korzystamy do tego celu formułę opartą o następuJący wzor:
1) - (k - 1)] = N-L
SKc =
oszacowań:
N
przykładu, dla
którego
postawiliśmy nastę
pującą hipotezę zerową: !-Lwieczór
=
ND
+ Nw + Ns =
10 + 10 + 10 = 30,
LXi = LXiV + LXiw + LXis = 41 + 26 + 38 = 105.
krytycznego F cx odczytujemy z tablic rozkładu F (załącznik 3) dla odpowiedniego poziomu istotności (dla każdego poziomu istotności mamy osobną tablicę) i dla dwóch wielkości liczby stopni swobody (nI = df M' które znajdujemy w górnym rzędzie i n2 = dfw, które znajdujemy w lewej kolumnie). Jeśli wartość statystyki F jest większa od wartości obszaru krytycznego F cx , to odrzucamy hipotezę zerową, stosując znaną nam już procedurę określenia prawdopodobieństwa, z jakim tego dokonujemy. Odrzucenie hipotezy zerowej oznacza, że istnieje związek między zmienną niezależną i zależną.
Ho: !-Ldzień =
=
natomiast
Wartość obszaru
do naszego pierwotnego
LX; - (2:=NXi)2
gdzie w naszym przykładzie
F= OW M . OWw
Powróćmy
Wieczór
Pierwszą wielkością, jaką mamy obliczyć, jest całko.wita sur,na kwadratów. Wy-
Zależność ta nie odnosi się do oszacowań wariancji. Estymator wariancji nie jest równy sumie oszacowań wariancji międzygrupowej i wewnątrzgrupowej .
Statystyka F jest stosunkiem obu
Dzień
!-Lsobota·
Dokonajmy jej weryfikacji na podstawie danych empirycznych z naszego eksperymentu (Xi oznacza poziom satysfakcji).
pochodzących
Brakuje nam wyrażeń będących sumą kwadratów pomiarów. Obliczmy je. Dzień
'1"
4 9 16 16 16 16 25 25 25 25
2:= XTD
= 177
Wieczór
4 9 9 9 16 16 16 25 25 25
O 1 4 4 4 9 9 16 16 25
2:=XTw
Sobota
= 88
2:= XTs
= 154
LX; = LX;D
+ LX;w + LX;s =
177 + 88 + 154
= 419.
Całkowita suma kwadratów będzie wynosiła: SK c
(105)2 30
11025 30
= 419 - - - = 419 - - - = 419 - 367 5 = 51 5 "
Kolejnym kro~iem prowadzonej procedury będzie obliczenie sumy kwadratow, wyznaczanej z ogólnego wzoru: SK
(2:: Xil)2+(2:: x i2)2
=
N
M
N2
l
.
międzygrupowej
6.5. Test post hoc W przeprowadzonej analizie wariancji, po odrzuceniu hipotezy zerowej, konkluzją powinno być wskazanie hipotezy alternatywnej. Ze względu na wielość prób, hipotezę tę nie jest łatwo zapisać. To, co na razie jesteśmy w stanie stwierdzić to fakt, że istnieją różnice między próbami (kategoriami zmiennej niezależnej) w średnim poziomie wskazań zmiennej zależnej. Możliwa jest zatem każda z następujących kombinacji: JLdzień =/=
(2::Xik)2
(2:: Xi)2
Nk
N
+ ... + -'='------'-'-'-'-
(26)2
(38)2
+ -10- + -10- -
367 5 = 126 ' , .
Wartość wewn~tr~gr~powej sumy kwadratów obliczymy jako różnicę całkowitej
sumy kwadratow
l
mIędzygrupowej sumy kwadratów:
SK w = SKc - SK M = 51,5 - 12,6 = 38,9. Teraz możemy przystąpić do obliczenia odpowiednich oszacowań wariancji:
38,9 OW w = SK w = SKw dfw (N -1) - (k-1) - (30-1) _ (3-1) OW M
=
1,44,
= SK M = SK M = 12,6 _ df M
k- 1
3 - 1 - 6,3,
zatem statystyka F będzie wynosiła: F- OW M - OW w
=
= 4,375.
Obszar krytyczny dla df = 2 i 27 wynosi odpowiednio: .. dla a = 0,05; Fa = 3,35 < 4,375 dla a = 0,01; Fa = 5,49 > 4,375 -
II
odrzucamy Ho, < 0,05.
p
Wobe~ teg~ nasza. konkluzja j~st t,a~a, że istnieją różnice w ocenach satysfakcji z ukonczema trenmgu, w zaleznoscl od tego, w jakim trybie i czasie szkolenie to zostało przeprowadzone. '
JLsobota,
JLdzień = JLwieczór =/= JLsobota, JLsobota =
JLdzień =/=
JLwieczór·
Na podstawie danych moglibyśmy wskazać intuicyjnie ostatnią możliwość, jako najbardziej prawdopodobną. Nie chcemy jednak ostatecznych wniosków opierać tylko na intuicji. Moglibyśmy zastosować serię testów dla dwóch prób porównujących każdą z możliwych par średnich. Jednak przy tak prowadzonych porównaniach wielokrotnych prawdopodobieństwopopełnienia błędu I rodzaju rośnie przy każdym kolejnym porównaniu. W takich przypadkach stosujemy testy post hoc wielokrotnych porównań. Testy takie pozwalają nam kontrolować poziom istotności z jednoczesną możliwo ścią precyzyjnego wskazania występującej nierówności. Jednym z takich testów jest test oparty o wskaźnik Scheffe'a. Pozwala on wyznaczyć krytyczną różni cę (dla każdej pary średnich) konieczną do odrzucenia hipotezy zerowej, takiej że odpowiadające im średnie populacji są sobie równe. Test ten posiada taką zaletę, że można go stosować do prób o różnej liczebności. Jeśli
6,3 1,44
=/=
JLdzień =/= JLwieczór = JLsobota,
gdzie k jest liczbą kategorii zmiennej niezależnej. W naszym przykładzie: (41)2 SK M = - 10
JLwieczór
przez i oznaczymy jedną z prób a przez j obliczymy ze wzoru:
drugą,
to
krytyczną różnicę
ich
średnich
(Xi -
xjt =
±J
d/M' Fa' OWw
(~i + ~J.
Taką krytyczną różnicę liczymy dla każdej możliwej pary prób (par kategorii zmiennej niezależnej) a następnie porównujemy ją do bezwzględnej różnicy średnich tych prób. Jeśli ta ostatnia jest większa od wskaźnika Scheffe'a, oznacza to, że różnica między tymi dwiema próbami (kategoriami) była przyczyną odrzucenia hipotezy zerowej w analizie wariancji.
W omawianym przykładzie liczebności wszystkich prób są jednakowe, wobec tego wskaźnik Scheffe'a będzie jednakowy dla każdej kombinacji średnich, i bę dzie wynosił: 2·3,35'1,44·
(~ + ~) 10 10
próby oraz ideę testów dla dwóch prób, za pomocą li~:ratury uzupcłmającej, poradzicie sobie z pewnością z testem różnicy proporcjl.
= ±-yh,9296 = ±1,389.
Zatem: Ho
lXi -Xjl
f-LD=f-LW f-LD =f-LS f-LW=f-LS
14,1 - 2,61 = 1,5 14,1 - 3,81 = 0,3 12,6 - 3,81 = 1,2
VVskaźnik
Scheffe'a
> 1,389 < 1,389 < 1,389
VVniosek odrzucamy Ho nie odrzucamy Ho nie odrzucamy Ho
Tak jak wcześniej przypuszczaliśmy, powodem odrzucenia hipotezy zerowej w analizie wariancji były różnice w ocenie satysfakcji z ukończenia szkolenia między osobami, które odbywały trening w dzień a osobami, które odbywały trening wieczorem. 111l1li111
Analiza wariancji tak w warunkach eksperymentu, jak i w warunkach nieeksperymentalnych daje nam możliwość oceny wzajemnego oddziaływania dwóch zmiennych. Jedna z tych zmiennych - wartość mierzona w eksperymencie lub zmienna zależna - musi być mierzona na poziomach silnych. Druga ze zmiennych - grupy eksperymentalne lub zmienna na ogół zmienną mierzoną na poziomach słabych. Sama analiza wariancji pozwala nam tylko zmiennymi istnieje, czy nie. Do istoty tego testy post hoc.
ocenić,
czy
niezależna -
jest
związek między
związku możemy dotrzeć
częściej mamy do czynienia ze zmiennymi ja~ościowymi. D.la takich z~ie~nych nie możemy obliczyć średniej, a więc nie mozemy ,;obec ~lch posta':lc ~lpote zy o równości średnich. Możemy jednak wyznaczyc dl.a mc~ odpowl~.dme ~r~ porcje. W poprzednim rozdziale poznaliś~~ test .dla jednej proporCj.l: Is.tmej~ również test na porównanie dwóch proporcjl. Znając test dla proporcJi ~ j~dn~j
tymi poprzez
Test dla dwóch prób pozwala nam na tego samego typu analizę, ale tylko w przypadku gdy zmienna niezależna ma tylko dwie kategorie. Jest to niewątpliwie ograniczenie. Na korzyść stosowania tej procedury w przypadku gdy jest to możliwe - świadczy jej "wrażliwość" na sposób doboru próby oraz możliwość zróżnicowaniazałożeń dotyczących populacji (równość bądź nierówność wariancji). W zaprezentowanych procedurach zmienna zależna była zmienną mierzoną na poziomie co najmniej interwałowym. Wierny, że w naukach społecznych naj-
Ćwiczenia
Ćwiczenie 6.5.
Dla wygody arytmetycznej we wszystkich ćwiczeniach zmienne zależne mają charakter skal z wartościami skokowymi, przyjmujemy więc założenie o ich cią głości (tak jak to praktykowaliśmywcześniej), aby móc liczyć z nich statystyki.
Skala mierząca poparcie wprowadzenia odpłatności za studia wyższe (O - ca.ł kowity brak poparcia, 5 - całkowite poparcie) została zastosowana do badama różnych grup studentów.
Ćwiczenie 6.1.
Oto wyniki
°
Indeks tolerancji na zachowania szowinistyczne był mierzony na skali od (najmniejsza tolerancja) do 15 (największa tolerancja). W losowo dobranej próbie 10 studentów zmierzono wartość tego indeksu (grupa 1). Drugą próbę (grupa 2) wylosowano również spośród studentów tego samego uniwersytetu, którzy wła śnie ukończyli zajęcia z antropologii kulturowej. Sprawdź, czy istnieje różnica w tolerancji między tymi dwoma populacjami: III
l'lI
Grupa 1: 2, 3, 3, 4, 4, 5, 5, 5, 6, 6. Grupa 2: 4, 4, 4, 5, 5, 6, 6, 7, 7, 7.
Ćwiczenie 6.2. Grupę kontrolną z poprzedniego ćwiczenia porównaj do losowo dobranej próby pracowników wydziału nauk społecznych: III
Grupa pracowników: 5, 5, 5, 5, 5, 15, 15, 15, 15, 15.
Ćwiczenie 6.3. Załóżmy, że grupa kontrolna z ćwiczenia 6.1 uczestniczyła w treningu uczącym krytycznego podejścia do własnych postaw, po zakończeniu którego ponownie zmierzono indeks tolerancji członków tej grupy.
Zbadaj wpływ treningu na postawy tolerancji: .. Grupa 1 (po treningu): 3, 3, 5, 7, 6, 8, 7, 5, 9, 8. Ćwiczenie 6.4. W tym rozdziale rozważaliśmy wpływ oglądania reklamy na ocenę reklamowanego produktu. Przeprowadź analizę wariancji dla tego samego przykładu: iii III
Grupa eksperymentalna: 6, 7, 7, 8, 9, 10. Grupa kontrolna: 3, 5, 6, 7, 8.
Spróbuj wyjaśnić różnicę we wnioskach między obiema procedurami.
III
III lIIl
wskazań według
tych grup:
Studenci uczelni prywatnych: 3, 4, 4, 5, 5. Studenci zaoczni uczelni państwowych: 3, 3, 4, 4, 5. Studenci dzienni uczelni państwowych: 0, 0, 1, 1, 2.
Przeprowadź analizę wariancji i test post hoc, jeśli zajdzie taka potrzeba.
Ćwiczenie 6.6.
Badanie mierzące poparcie wprowadzenia odpłatności za studia prowadzono wśród wykładowców tych uczelni.
wyższe
Oto wyniki: 111
Wykładowcy
llII
Wykładowcy
lIlI
uczelni prywatnych: 3, 4, 4, 5, 5, 5, 5. studiów zaocznych: 1, 3, 4, 4, 4, 5. Wykładowcy studiów dziennych: 0, 1, 1, 2, 3.
Przeprowadź analizę wariancji i test post hoc, jeśli zajdzie taka potrzeba.
prze-
Co może zrobić za nas komputer
Pamiętamy że
Przeprowadzanie testów statystycznych lub analizy wariancji (dotyczy to więk szości procedur analitycznych) jest szybkie i mało skomplikowane. Wszystko liczy za nas komputer. Naszym zadaniem jest odpowiednio przygotować dla niego zadanie a potem prawidłowo zinterpretować wyniki. Tych decyzji komputer za nas nie podejmie. Zobaczmy jak to zrobić.
w testach dla dwóch prób pierwszą kwestią, którą musimy rozfakt, czy możemy utrzymac załozeme o rowno~cl wanan~JI w populacji, czy nie? W programie SPSS hipotezę tę sprawdza SIę w oparcm o test Levene'a (rys. 6.2). ,
l'
strzygnąć jest
Test dla prób
••
I'
l'
•
•
••
niezależnych
Test Levene'a jednorodności
PGSS oferuje nam dane dotyczącewysokości dochodów z pracy oraz dane dotyczące płci respondentów. Chcemy sprawdzić hipotezę o nierówności dochodów kobiet i mężczyzn. To jedna z możliwych hipotez potwierdzających dyskryminację według płci na rynku pracy. Aby ją sprawdzić trzeba przeprowadzić test dla dwóch średnich dotyczący różnic w dochodach między kobietami i mężczy znami. Respondenci PGSS są osobami o różnej sytuacji na rynku pracy: pracują i uzyskują dochody, są bezrobotni, są emerytami, rencistami, uczniami, studentami, są na utrzymaniu współmałżonka. Do tej analizy wybieramy tylko te osoby, które pracują i uzyskują z pracy dochody. Takich respondentów jest 925 (rys. 6.1). Statystyki dla grup
PŁEĆ RESPONDENTA: 1=M,2=KOB DOCHODY Z PRACY RESPONDENTA (PLN)
MĘŻCZYZNA
KOBIETA
Średnia
N
Test t równości średnich
wariancji
Test dla dwóch prób niezależnych
Odchylenie standardowe
Błąd
standardowy średniej
464
1149,65
866,89
40,24
461
875,90
542,59
25,27
Rysunek 6.1.
Statystyki dla obu grup respondentów (prób) - kobiet i mężczyzn pokazują, że rzeczywiście istnieją różnice w średnim dochodzie przez nie uzyskiwanym. Wartość odchylenia standardowego mówi nam o tym, że dochody mężczyzn są bardziej zróżnicowane niż dochody kobiet. Teraz chcielibyśmy wiedzieć, czy różnice między średnimi dochodami kobiet i mężczyzn są statystycznie istotne.
Co nam mówi test dla dwóch prób?
Pamiętamy, że hipotezą zerową, którą sprawdzamy tym testem jest hipoteza
dotycząca równości średnich dochodów kobiet i mężczyzn.
~
G ·c
·e o '2
~
:g
:=!-
~
,~
·U
l3
.~
g
~
N
fi
:Ę
·0
o::
~
~
* ~
95% przedzial ufności
~.~
D~ DOCHODY Z PRACY RESPONDENTA (PLN)
Zalożono równość
wariancji Nie
,000
30,085
zalożono
równości
wariancji
dla
różnicy
średnich
E·~rn
·0
Clo,
5,752
923
,000
273,74
47,59
180,35
367,14
5,760
778,314
,000
273,74
47,52
180,46
367,03
Rysunek 6.2.
Dla tego testu mamy policzoną statystykę F i poziom istot~ości.,J:śli p.ozio~ istotności jest mniejszy niż 0,05 to odrzuc~my ~ipotez,ę .0. rownoscl wan~~cJl. Tak jest w naszym przykładzie - tu pOZlOm IstotnosCI Jest nawet .mmeJ~~y niż 0,0005 bo SPSS zaokrąglił tę wartość do O,OO? Zate~ w d~lszeJ ~nah:l~ będziemy brać pod uwagę wielkości w wierszu, w ktorym "me z,ałozono ro,:nosCl wariancji". (Gdyby poziom istotności w teście Levene'a b~ł rown~ lub ';Ięks~~ niż 0,05, to w dalszej analizie patrzylibyśmy na wiersz gdzlC "załozono rownosc wariancji" .) To co nas interesuje to statystyka t, która tu wynosi 5,76, liczba stopni swobod~ , a 77831 0,000 , czyli mniej, .niż rown , i pozi~m istotności testu równy. , 0,0005. d . h JeślI . poziom istotności jest mniejszy niż 0,05 to hIpotezę o rownos.cl sre mc mus.Imy odrzucić. Zatem różnica w dochodach kobiet i mężczyzn Jest statystyczme istotna.
Analiza wariancji ANOVA Teraz chcielibyśmy wiedzieć, czy wysokość uzyskiwanych dochodów się na zadowolenie z sytuacji finansowej respondentów.
przekłada
Taką subiektywną ocenę sytuacji finansowej PGSS bada za pomocą odpowiedzi na pytanie o zadowolenie z własnej sytuacji finansowej ujęte w trzech kategoriach: lIIl l1li
II
DOCHODY Z PRACY RESPONDENTA (PLN) Test Scheffea,b Podzbiór dla alfa
ZADOWOLENIE Z WŁASNEJ SYTUACJI FINANSOWEJ
niezadowolony,
491
Niezadowolony
mniej więcej zadowolony, zadowolony.
Mniej
więcej
1
N
zadowolony
1176,68
69
1743,19
Istotność
1,000
Wyświetlane są średnie
920 osób odpowiedziało na to pytanie. Teraz nasza hipoteza zerowa jest taka, że średnie dochody osób niezadowolonych z własnej sytuacji finansowej będą równe średnim dochodom osób mniej więcej zadowolonych z własnej sytuacji finansowej oraz będą równe średnim dochodom osób zadowolonych z własnej
1,000
1,000
dla grup jednorodnych,
a. Wykorzystywana jest średnia harmoniczna wielkości próby = 155,383. b.
Liczebności grup nie są równe. Użyta została średnia harmoniczna grup. Poziom błędu I rodzaju nie jest zagwarantowany.
liczebności
Rysunek 6.4.
sytuacji finansowej.
Aby to sprawdzić należy przeprowadzić procedurę ANOVA dla poczucia zadowolenia z własnej sytuacji finansowej według uzyskiwanych dochodów.
3
793,78
360
Zadowolony
,05
2
Porównania wielokrotne Zmienna zależna: DOCHODY Z PRACY RESP (PLN) Test Scheffe
Rezultat analizy przedstawia rysunek 6.3. ~
Analiza wariancji
.c
Suma kwadratów Między
grupami
Wewnątrz Ogółem
grup
u
~ 'm
Średni
df
kwadrat
70026897,5
2
35013449
430027008
917
468949,85
500053906
919
F 74,664
'" 'c
Istotność
,000
Rysunek 6.3.
(I) ZADOWOLENIE Z WŁASNEJ SYTUACJI FINANSOWEJ
(J) ZADOWOLENIE Z WŁASNEJ SYTUACJI więcej
zadowolony
Niezadowolony Mniej
więcej
zadowolony
To co nas tu interesuje, to statystyka F tu równa 74,664 i poziom istotności 0,000 a więc mniejszy niż 0,05 (a nawet niż 0,0005). Musimy zatem odrzucić hipotezę o równości średnich dochodów dla grup respondentów wyrażających różne zadowolenie z własnej sytuacji finansowej.
Chcielibyśmy jednak wiedzieć, które różnice między grupami są istotne, czy między wszystkimi trzema grupami, czy też między jakąś parą z nich. Test post hoc pozwoli nam to ustalić (rys. 6.4).
Wstępna ocena grup jednorodnych wskazuje, że wszystkie różnice mogą być znaczące, zobaczmy zatem, co wyjdzie nam z porównań wielokrotnych
Niezadowolony
Zadowolony Zadowolony Mniej
*,
-Bl
u
-g.
oN
iD
'o
o::
·u ·m
o
§ .!!2
więcej
95%
przedział ufności
~.~ -c o",
o~
FINANSOWEJ Mniej
Zadowolony
'c"
Q)
Niezadowolony
(rys. 6.5).
'E
u
'c
DOCHODY Z PRACY RESP (PLN)
>-
~
o
u
zadowolony
'" i'l E"c (5~
566,51'
89,995
,000
345,87
787,16
949,41'
88,042
,000
73,3,55
1165,27
-566,51'
89,995
,000
-787,16
-345,87
382,90'
47,516
,000
266,40
499,39
-949,41'
88,042
,000
-1165,27
-733,55
-382,90'
47,516
,000
-499,39
-266,40
Różnica średnich jest istotna na poziomie .05.
Rysunek 6.5.
Wszystkie poziomy istotności są poniżej 0,05 a więc :v~zyst~i~ ró.żni~e są statystycznie istotne, te między osobami zadowolonyml.l ~meJ wlęceJ za~ dowalonymi, zadowolonymi i niezadowolonymi, mniej wlęceJ zadowolonyml i niezadowolonymi. Procedury uzyskiwania za pomocą programu SPSS zaprezentowanych. w!żej wyników można znaleźć w książce Jarosława Górniaka i Janusza WachmckIego
SPSS PL for Windows -
pierwsze kroki w analizie d
Kraków, SPSS Polska 2000).
anyc
h (
" II d 7 częsc ,roz z. ,
Literatura 1. Blalock M. H.: Statystyka dla socjologów. Warszawa, PWN 1977. 2. Brzeziński J.: Metodologia badań psychologicznych Wyd. 3. Warszawa, PWN
1999.
.
3. Frankfort-Nachmias Ch N h . D M d , . ., ac mms .: eto y badawcze w naukach P oznan, Zysk l S-ka 2001.
społecznych.
4. Gruszczyński L. A.: Elementy statystyki dla socjologów. Katowice, Uniwersytet Śląski 1986. Pojęcia
test III III
III III III
podstawowe
niezależności chi-kwadrat
liczebności
empiryczne liczebności teoretyczne poprawka ciągłości Yatesa dokładny test Fishera współczynnik kontyngencji C Pearsona
Cramera V stosunek korelacyjny 1] regresja liniowa metoda najmniejszych kwadratów współczynnik korelacji r Pearsona współczynnik alienacji
III współczynnik iii fil
!III
III !III
Już w poprzednim rozdziale zajmowaliśmy się tym, co dla badacza jest najciekawsze, a mianowicie relacją pomiędzy dwiema zmiennymi. Teraz postaramy się postawić kropkę nad "i" . Prowadząc analizę musimy pamiętać stale o dwóch jej poziomach - poziomie empirycznym odnoszącym się do próby i poziomie populacji. Badamy, czy istnieje zależność między zmiennymi w próbie? Jeśli tak, to jak jest ona silna? W końcu chcemy wiedzieć czy zależność ta jest istotna w populacji? Po przestudiowaniu poprzednich rozdziałów mamy już wiedzę dotyczącą pewnych elementów tej układanki. Teraz uzupełnimy elementy brakujące i postaramy się stworzyć z tego całość. Częstym
sposobem prezentacji dwóch zmiennych mierzonych na poziomach jest tabela. Wiemy jak zmierzyć siłę związku między takimi zmiennymi i poznamy jeszcze nowe wskaźniki. Poznamy też sposób uogólniania tych wniosków na populację. Najbardziej popularnym narzędziem do badania statystycznej istotności związku między zmiennymi na podstawie tabel jest test niezależności chi-kwadrat.
słabych
Jeżeli obie zmienne mierzone są w skalach silnych, to próba zaprezentowania ich w tabeli prowadzi na ogół do obniżenia poziomu pomiaru. Zabieg ten stosujemy zatem tylko w celach ilustratywnych.
Do badania związku takich zmiennych stosujemy natomiast bardziej wyrafinowane matematycznie metody. Jedną z nich jest analiza regresji liniowej. Pozwala ona nie tylko określić czy związek dwóch zmiennych istnieje, oraz jaka jest jego siła, ale stwarza nam również możliwości predykcyjne. Posuwamy się zatem o krok w poznawanych metodach analizy statystycznej.
7.1. Test chi-kwadrat Przypomnijmy przykład zamieszczony w rozdziale czwartym, pokazującyzwią zek stosunku do kary śmierci ze skłonnością do zwiększania uprawnień policji (tab. 4.8). Związek ten w próbie 40 przebadanych osób istnieje, a jego siłę określają obliczone miary (Q = 0,8; rp = 0,5). Załóżmy, że te 40 osób to studenci socjologii, losowo dobrani spośród wszystkich studentów tego kierunku i tego uniwersytetu. Czy na podstawie tego badania możemy w sposób uprawniony uogólnić ten
związek na wszystkich studentów tego uniwersytetu, bądź na wszystkich studentów socjologii w Polsce? Odpowiedź na to pytanie przyniesie odpowiedni
test statystycznej
istotności.
Procedura testu statystycznego rozpoczyna się od postawienia hipotezy zerowej. Zakładamy zatem, że wśród wszystkich studentów naszego uniwersytetu nie istnieje związek pomiędzy ich stosunkiem do kary śmierci a skłonnością do zwiększania uprawnień policji. Gdybyśmy przebadali wszystkich i obliczyli Q i rp, to ich wartość powinna wynosić zero, w przeciwnym razie sugerowałoby to błąd do boru próby. Ogólnie w sposób słowny hipotezę zerową sformułowalibyśmynastępująco:
Ho: w populacji nie istnieje związek pomiędzy badanymi zmiennymi.
Ponieważ znany nam jest test statystycznej istotności pozwalający tę hipotezę zweryfikować, możemy ją zapisać również w sposób symboliczny (symboliczny zapis hipotez może też się odnosić do właściwych dla danej tabeli miar związku
t:rm
Narzędziem pozwalającym
na weryfikację hipotezy zerowej jest w przypadku test niezależności chi-kwadrat, zwany w skrócie testem chI-kwadrat i oznaczany grecką literą X 2 . Ideę
na której opiera
się
ten test,
można opisać jako
poszukiwanie takiego roztzn. wskazy-
kładu liczebności w tabeli, który byłby zgodny z hipotezą zerową, wałby
na brak
związku między
Mielibyśmy wobec i!!I
zmiennymi.
tego do czynienia z dwoma typami
rozkładu liczebności:
pierwszy pochodziłby z badań i przedst.awiał rz:~zy,,:iste z~leżności ~ystę w próbie, te liczebności byłyby hczebnosclaml empirycznymi,
pujące
drugi przedstawiałby hipotetyczny rozkład lic~eb~oś~i pozos~a~ący. w zgodzie z hipotezą zerową, te liczebności nazywają 8lę hczebnosclaml teoretycznymi.
Jak znaleźć liczebności teoretyczne? Dla każdego pola wewnętr~nego,tabel~ limy J·e na podstawie wzoru: iloczyn sumy liczebności wszystluch pol w Wler, . k" h 'l k czy . szu, w którym znajduje się dane pole i sumy hczebnoscl ,:szyst l;, po w. 0lumnie, w której znajduje się dane pole podzielone przez hczebnosc całkOWItą. Wróćmy
do (tab. 7.1):
przykładu.
Tak
wyglądał w
nim
rozkład liczebności empirycznych
śmierci a skłonność do studentów socjologii
Tabela 7.1. Stosunek do kary licji
wśród
zwiększania uprawnień
śmierci
Stosunek do kary Zwiększanie uprawnień
policji Za
Przeciw
Za Przeciw
15 (a) 5 (c)
5 (b) 15 (d)
20 20
Suma
20
20
40
np.
Ho: X 2 = O, zatem hipoteza alternatywna przybierze postać:
Obliczmy
liczebności teoretyczne:
+ 5)(15 + 5)
_ 20·20 40
= 400 = 10,
(15 + 5)(5 + 15) _ 20·20 40 40
= 400 = 10,
(15
40
Jeśli w naszym postępowaniu odrzucimy hipotezę zerową, będzie to oznaczało, że związek odkryty w próbie dotyczy również populacji a miary tego związku
obliczone dla próby będą estymatorami takich miar dla populacji.
Suma
ntb =
40 40
po-
:!I1\ i~
_ (5
ntc -
_ (5 ntd -
+ 15)(15 + 5) 40
+ 15)(5 + 15) 40
400 - 10 40 ,
=
20·20
40 =
Odchylenia liczebności empirycznych od teoretycznych dla każdego pola testu
Statystyka
20 20 40
O
O
20 20 40
±1
0,4
Tabela
400
4{) = 10.
spełniającej hipotezę zerową
Tabela 7.2. Stosunek do kary śmierci a skłonność do zwiększania uprawnień policji wśród studentów socjologii
Stosunek do kary śmierci Suma
Za
Przeciw
Za Przeciw
10 10
10 10
20 20
Suma
20
20
40
Rozkład taki wskazuje ewidentnie na brak związku pomiędzy stosunkiem do kary śmierci a skłonnością do zwiększania uprawnień policji. Aby jednak mieć absolutną co do tego pewność, obliczymy również miarę zależności właściwą dla takiej tabeli: ad - bc t.p = -r,==:=77=====7=====
V(a + b) (c + d) (a + c) (b + d)
10· 10 - 10 . 10 )20 . 20 . 20 . 20
II ~ .
I
20·20 40
= --- = _
Zat~~ rozkł~d li~z:bności teoretycznych w tabeli pOWll1len byc takI Jak w tabeli 7.2.
Zwiększanie uprawnień policji
\~~
100 - 100 O -V-=1=60=0-00- = 400 = O.
10 10 20
20
11 9
11
20
20
10 10 9
12
8
8
20 20 40
±2
1,6
20
12 20
15 5 20
5 15 20
20 20 40
±5
10
20
O
O
20 20
20 20 40
±1O
40
20
Pamiętamy, że
w teście statystycznej istotności konkluzję o przyjęciu lub odrzuceniu hipotezy zerowej wywodzimy z porównania statystyki testu z obszarem krytycznym. Jak sama nazwa testu wskazuje, rozkład teoretyczny, na podstawie którego wyznaczymy obszar krytyczny, to rozkład chi-kwadrat. Jego znormalizowane wartości znajdują się w załączniku 4. Aby odszukać jakąkolwiekwartość w tej tablicy musimy znać poziom istotności testu (standardowo ustalony na tY = 0,05) oraz liczbę stopni swobody. Dla testu chi-kwadrat
liczbę tę określa
wzór:
df = (k - l)(w - l),
Jeże~i hipoteza zerowa jest prawdziwa, to będziemy oczekiwać, że liczebności
empIryczne będą takie same jak liczebności teoretyczne. Im bardziej te pierwsze będą. odchylać się od tych drugich, tym bardziej możemy spodziewać się że będZIemy musieli odrzucić hipotezę zerową. '
gdzie k to liczba kolumn a w ~ liczba wierszy w tabeli (wróć do rozważań z rozdziału 5 o istocie stopni swobody ~ dają się one bezpośrednio zastosować do takiego ich zdefiniowania, z jakim spotykamy się w omawianym teście).
N~ początek zajmiemy się ilustratywnym rozumieniem tych pojęć, potem przejdZIemy do konkretnych wzorów.
Teraz możemy przystąpić do dokładnego obliczenia statystyki testu chi-kwadrat. Wyraża się ona wzorem:
Dla przejrzystości dalszych rozważań będziemy się posługiwać tylko polami liczebności tabeli. gdzie n e to
liczebności empiryczne
a nt
~ liczebności teoretyczne.
\11~1 i
1\ !
Różnice pomiędzy liczebnością empiryczną a liczebnościąt~oretyczną dla każ
Przypomnijmy ich rozkład dla analizowanego przykładu: !li liczebności
.15 5 20 lIiI
5 15 20
20 20 40
liczebności
10 10 20
10 10 20
Zapiszmy te Pole a b c d
°
dego pola mogły wynosić od do ±10, to daje nam możliwość utworzenia 11 tabel obejmujących wszystkie możliwe kombinacje rozkładów liczebności pól wewnętrznych przy danych liczebnościach brzegowych.
empiryczne n e :
Teoretyczny rozkład chi-kwadrat z prób, na podstawie którego wyznaczamy obszar krytyczny, jest rozkładem ciągłym. Dlatego niektórzy statystycy dowodzą, że przy małej liczbie wszystkich możliwych kombinacji z danej próby (w naszym przykładzie jest to 11), krzywą rozkładu teoretycznego chi-kwadrat można wyznaczyć tylko w przybliżony sposób.
teoretyczne nt: 20 20 40
wartości dla każdego pola
ne
nt
15 5 5 15
10 10 10 10
ne
-
nt
(n e
-
tabeli i obliczmy statystykę chi-kwadrat:
nt)2
25 25 25 25
5 -5 -5 5
(n e
-
nt? /nt
25/10 = 2,5 25/10 = 2,5 25/10 = 2,5 25/10 - 2,5 X 2 = 10
Statystyka testu chi-kwadrat dla naszego
przykładu
Zastosujmy tę poprawkę do naszego przykładu. Pole n e dokładnie
tyle ile zapisaliśmy wcześn~ej, p,~ka~ując wpływ odchyleń liczebności empirycznych od teoretycznych na wlelkosc tej statystyki. Znajdźmy odpowiedni dla naszej tabeli obszar krytyczny tego testu. Liczba stopni swobody dla tabeli 2 x 2 jest równa df = (2 - 1)(2 - 1) = 1. Wobec tego: fJlI
ill III
wynosi
°
z
prawdopodobieństwem
mniejszym
niż
którego została zaprezentowana idea i procedura tezmiennych dychotomicznych. Dla tego konkretnego pr~ykładu rozkładów ~iczebności brzegowych w tabeli 2 x 2, wielkość statystyki chI-kwadrat wahała SIę od dla braku związku do 40 dla związku idealnego. dotyczył
°
15 10 5 10 5 10 15 10
In e
-
ntl
5 -5 -5 5
In e
-
ntl -
0,5
(In e
-
nt I - 0,5)2 20,25 20,25 20,25 20,25
4,5 4,5 4,5 4,5
(In e
-
nt I - 0,5)2 /nt
20,25/10 = 20,25/10 = 20,25/10 = 20,25/10 =
2,025 2,025 2,025 2,025
2
X = 8,1
dla o: = 0,05; Xz. = 3,84 < X2 = 8,10 -
odrzucamy hipotezę zerową,
2
dla o: = 0,01; Xz. = 6,64 < X = 8,10, .. dla o: = 0,001; Xz. = 10,83 > X2 = 8,10 -
!II
7.2. Warunki stosowania testu chi-kwadrat Przy~ład, ~a ~~dstawie
c d
l1li
jedna setn.a. Wobec teg~ w inter:s~jąc~j nas populacji istnieje związek pomiędzy po~l~~aml ~a stos.owan~e kary smlercl a stosunkiem do zwiększania uprawnień polIcJI. PowIemy, ze zWIązek ten jest statystycznie istotny.
stu mezaleznoscl,
a b
nt
Nasza konkluzja w tym przypadku nie ulegnie zmianie, gdyż:
dla o: = , 05·, Xa2 3 84 < X 2 -- 10 - O d rzucamy h·Ipotezę zerową, - , dla o: = 0,01; Xz. = 6,64 < X 2 = 10, dla o: = 0,001; Xz. = 10,83 > X2 = 10 - p < 0,01.
~atem odrzuciliśmy hipotezę zerową
Z tego powodu przy liczeniu statystyki testu chi-kwadrat dla tabel 2 x 2 powinno się stosować poprawkę ciągłości Yatesa. (Niektórzy statystycy uważają jednak, że to zbyt konserwatywne podejście.) Poprawka ta polega na tym, że od bezwzględnej różnicy między liczebnością empiryczną a liczebnością teoretyczną odejmujemy 0,5 przed podniesieniem tej różnicy do kwadratu.
p
< 0,01,
choć wprowadzenie poprawki ciągłości zaostrzyło warunki odrzucenia hipotezy zerowej. Przedstawiona powyżej kwestia jest dyskusyjna. Na potrzeby naszych rozważań i wprowadzenia do nich jakiegoś porządku przyjmijmy, że poprawkę ciągłości Yatesa będziemy stosować w tabelach 2 x 2. Inna kwestia z zakresu warunków stosowalności testu niezależności chi-kwadrat, jaką należy tu poruszyć, nie jest dyskusyjna. Dotyczy ona wielkości liczebności teoretycznych, a właściwie liczby dopuszczalnych dla danej tabeli liczebności teoretycznych, które mają wartość między
1 a 5.
Test chi-kwadrat możemy stosować tylko wówczas, gdy żadna z liczebności teoretycznych nie jest mniejsza od jedności i gdy nie więcej niż 20% liczebności teoretycznych jest mniejszych od pięciu. Dla najczęściej występujących tabel warunek ten będzie następujący: Rozmiar tabeli
Liczba nt
20% z nt
2x2
4 6 9 12 16 20 25
0,8 1,2 1,8 2,4 3,2 4,0 5,0
2 x 3
3x3 3x4 4x4 4x5 5x 5 Proszę pamiętać, że
ograniczenia te
Dopuszczalna liczba pól o 1
< nt < 5
o 1
1 2 3 4 5 dotyczą liczebności
w badanych krajach Dochód/osobę
Liczba telefonów na 1000 osób
Suma
Wysoki
Średni
Niski
Bardzo niski
Niska
12 3 O
6 6 3
O 12 3
O O 15
18 21 21
Suma
15
15
15
15
60
Wysoka Średnia
Aby zweryfikowaćpowyżej postawionąhipotezę trzeba policzyć statystykę testu niezależności chi-kwadrat.
teoretycznych a nie
empirycznych. Jeżeli
do policzenia testu chi-kwadrat będziemy stosować program komputerowy, to w programie tym pojawią się ostrzeżenia dotyczące zbyt dużej liczby liczebności teoretycznych mniejszych niż dopuszczalne dla stosowalności testu. Jeśli tak się zdarzy, to w zależności od wielkości tabeli będziemy mieli do dyspozycji różne rozwiązania tego problemu. W przypadku tabeli 2 x 2, gdy kryteria stosowania testu chi-kwadrat nie są spełnione, stosujemy dokładny test Fishera. Test ten znajduje się we wszystkich programach liczących test chi-kwadrat, co jest cenne, gdyż ręczne policzenie tego testu nie jest łatwe. Dociekliwych czytelników zachęcam do zapoznania się z nim w podręcznikach dla zaawansowanych. Natomiast w przypadku tabel o wymiarach większych niż 2 x 2 stosujemy projednej ze zmiennych lub obu zmiennych tak długo, aż liczba zbyt małych liczebności teoretycznych zostanie ograniczona tak, iż bę dziemy mogli zastosować test chi-kwadrat. Nie pozostaje to jednak bez skutku dla wyników naszej analizy (wyniki testu są wrażliwe na zmiany liczby kategorii - zmiana liczby stopni swobody). Może się też zdarzyć, że ograniczenie liczby kategorii obu zmiennych do dwóch nie rozwiąże problemu liczebności teoretycznych i w końcu będziemy musieli zastosować dokładny test Fishera. Takie sytuacje są jednak wyjątkowe. Spróbujmy prześledzić taką procedurę na przykładzie (tab. 7.3). cedurę łączenia kategorii
Ho: nie ma związku między poziomem dochodu na jednego mieszkal1ca a telefonów na 1000 osób. Hl: związek taki istnieje.
. d nego mi'eszkan'ca " l'lczba telefonów na 1000 osób Tabela 7.3. Dochód na Je
liczbą
Zaczynamy od obliczenia liczebności teoretycznych dla każdego pola tabeli: Pole
ne
nt
a b c d e f g h
12 6 O O 3 6 12 O O 3 3 15
4,50 4,50 4,50 4,50 5,25 5,25 5,25 5,25 5,25 5,25 5,25 5,25
j k l
Tabela, którą analizujemy ma wymiar 4 x 3; dopu~zczaln~ liczba l~czebn~ś~i teoretycznych mniejszych od pięciu dla takiej tabelI w~n~sl 2; W. te~ tab;l: ~lczeb~ ności teoretycznych nie spełniających kryterium mmlmalncJ wlelkoscl Jest 4, nie możemy zatem stosować testu chi-kwadrat.
Musimy zatem dokonać połączenia kategorii co najmniej jednej zmiennej. Zmienna mierząca poziom dochodu na jednego mieszkańc,a m.a dwie kategorie opisujące dochód jako niski. Spróbujmy zatem je połączyc w Jedną (tab. 7.4).
Tabela 7.4. Dochód na jednego danych krajach
mieszkańca
i liczba telefonów na 1000 osób w baDochód/osobę
Liczba telefonów na 1000 osób
Suma
Wysoki
Średni
Niski
Niska
12 3 O
6 6 3
O 12 18
18 21 21
Suma
15
15
30
60
Wysoka Średnia
Teraz odpowiednie
liczebności empiryczne
Teraz, kiedy dokonaliśmy połączenia kategorii państw o wysokim i średnim dochodzie na jednego mieszkańca (poprzednio w tych kategoriach wystąpiły pola o zbyt małej liczebności teoretycznej), możemy przypuszczać,że będziemy mogli zastosować test niezależności chi-kwadrat. Tak też jest istotnie. ne
nt
a b c d e f
18 O 9 12 3 18
9 9 10,5 10,5 10,5 10,5
i teoretyczne dla takiej tabeli mia-
łyby następujące wartości:
Pole
ne
nt
a b c d e f
12 6 O 3 6 12 O 3 18
4,5 4,5 9 5,25 5,25 10,5 5,25 5,25 10,5
g
h
ne
Pole
-
nt
(n e
-
(n e
nt)2
nt? /nt
9 9 0,214 0,214 5,357 5,357
81 81 2,25 2,25 56,25 56,25
9 -9 -1,5 1,5 -7,5 7,5
-
X2
= 29,142
df = (2 - 1)(3 - 1) = 2, zatem: lI!l
III l1li
dla dla dla
= 5,99 < X2
et =
0,05; X;
= et =
0,01; X; = 9,21 < X = 29,142, 2 0,001; X; = 13,82 < X = 29,142 -
et
= 29,142 -
odrzucamy hipotezę zerową,
2
p
<
0,001.
Nasza ostateczna konkluzja jest więc taka, że istnieje związek pomiędzy poziomem dochodu na jednego mieszkańca a liczbą telefonów na tysiąc osób.
Tabela, którą analizujemy ma wymiar 3 x 3; dopuszczalna liczba liczebności teoretycznych mniejszych od pięciu dla takiej tabeli wynosi 1; w tej tabeli liczebności teoretycznych nie spełniających kryterium minimalnej wielkości jest 2; nie możemy nadal stosować testu chi-kwadrat. Pozostaje nam próbować dalej i utworzyć dwie kategorie dochodu (tab. 7.5).
Pozostała nam do rozważenia ostatnia kwestia związana ze stosowaniem testu niezależności chi-kwadrat - kwestia relacji pomiędzy siłą związku a jego statystyczną istotnością. Siłę związku między zmiennymi mierzymy na podstawie danych empirycznych za pomocą odpowiednich współczynników.Wielkość tych współczynników pokazuje nam, czy związek zmiennych w próbie istnieje, czy też nie. Sama siła tego związku nie świadczy jeszcze o tym, czy jest on statystycznie istotny w populacji, czy też nie. Zatem siła związku mię.dzy zm~~nnymi w próbie nie przekłada się automatycznie na jego statystyczną lstotnosc w po-
pulacji. Tabela 7.5. Dochód na jednego danych krajach
Liczba telefonów na 1000 osób Wysoka
mieszkańca
i liczba telefonów na 1000 osób w baDochód/osobę
Wysoki i
średni
Niski i bardzo niski
Suma
Niska
18 9 3
O 12 18
18 2l 21
Suma
30
30
60
Średnia
Po,b.i~~ęiiZ()$tąną]pn~eclstaV\Tionewzajemne relacje między wyżej opisanyprostoty i wygody naszych rozważań przedstawione yz.~stal1:'l: t]rlk'6)\!e~vll(~tr:/;ne pola tabeli a statystyka testu chi-kwadrat .ZClS.tl:l,Il,le Qbli'czCfIl,a bez uwzględnienia poprawki ciągłości i spełnienia > FW:ą)'J.l.I1Jk1J..J1ltnlj:rl,!ovlriej liczby liczebności teoretycznych poniżej 5. Postą ~m.>w,edjt.ug reguły, że cel uświęca środki, czego w poprawnie l1e.\ą,l1ąl~iOj.e absolutnie nie wolno stosować.
Przypadek 1, N = 5
2
l
3
l
l
2
X2
X • = 0,13~ < X; ~ 3,84 - nie ma podstaw do odrzucenia hipotezy zerowej; zWIązek mIędzy zmIennymi jest słaby i statystycznie nieistotny. 2
Przypadek 2, N = 50
10 10 20
X
2
= 1,388, df = l, dla o: = 0,05
X;
= 3,84.
Przypadek 3, N = 500
100 100 200
= 0,166,
300 200 500 X
2
= 13,888, df = l, dla o: = 0,05
X;
Załóżmy teraz, że rozkład liczebności empirycznych będzie nieznacznie zmienion~, ale tak,. iż prz~niesie to poważne konsekwencje w stosunku do siły związku mIędzy zmIennymI. Przypadek 4, N = 5
2 l 3 022 235 X
2
tp
10 20 30
= 0,666,
30 20 50 X2
= 22,221, df = l, dla o: = 0,05
X;
= 3,84.
2
=
= 2,221, df = l, dla o: = 0,05
Zatem statystyczna istotność danego związku między zmiennymi zależy od jego i od wielkości próby, przy czym, im silniejszy związek między zmiennymi, tym mniej liczna próba jest niezbędna do wykazania jego statystycznej istotności. Trzeba też pamiętać o tym, że test chi-kwadrat wymaga dużej liczebności próby, gdyż rozkład z próby zbliża się do wartości podawanych w tablicach dopiero przy dużych N (wspominaliśmy już o tym przy okazji opisywania poprawki na ciągłość). siły
= 3,84.
2
= 0,666,
3,84 - nie ma podstaw do odrzucenia hipotezy zerowej; zmiennymi jest silny ale statystycznie nieistotny.
Test chi-kwadrat stosuje się przede wszystkim jako test statyHtycznej iHtotności dla zmiennych mierzonych w skali nominalnej. Zdarza się jednak, że stosujemy go do zmiennych mierzonych na poziomie porządkowym a nawet interwałowym.
= 13,88~ > X; = 3,8~ - od:-zucamy hipotezę zerową z p < 0,001 (dla ~ = 0,001. Xc> = 10,83); zWIązek mIędzy zmiennymi jest słaby ale statystycznie IStO.t~y, me tyl~o ~dr.zuciliś~~ hipotezę zerową ale zrobiliśmy to na naj niższym mozhw~m ~ozlOmIe IstotnoscI, zatem prawdopodobieństwo,że hipoteza ta jest prawdzIwa Jest znikome.
tp
=
X;
22,221 > X; = 3,84 - odrzucamy hipotezę zerową z p < 0,001; związek zmiennymi jest silny i statystycznie istotny na naj niższym możliwym poziomie istotności.
2
200 100 300
<
pomiędzy
X • = 1,38~ < X; ~ 3,84 --:-. nie ma podstaw do odrzucenia hipotezy zerowej; zWIązek mIędzy zmIennymI Jest słaby i statystycznie nieistotny.
X
°
20
X
30 20 50
= 0,166,
tp
tp
20
= 0,166, X2 = 0,138, df = l, dla o: = 0,05 X; = 3,84.
20 10 30
2,221
Przypadek 5, N = 50
325 tp
=
związek pomiędzy
X;
= 3,84.
7.3. Miary
związku oparte
na chi-kwadrat
Przy prowadzeniu badań empirycznych należy pamiętać o tym, że mamy cały czas do czynienia z dwoma poziomami analizy. Jeden dotyczy próby i wszystkiego, co na jej temat możemy się dowiedzieć, korzystając z już poznanych narzędzi statystycznych, drugi to poziom populacji. Zadaniem naszej analizy jest odpowiedzieć na pytanie, które prawidłowości i zależności odkryte w próbie mogą być uznane za statystycznie istotne w populacji. Do tej pory do policzenia siły związku między zmiennymi mierzonymi na poziomie nominalnym mieliśmy do dyspozycji, w zależności od rozmiarów tabeli, miary Q, tp i A. Teraz, korzystając z obliczonej statystyki testu chi-kwadrat, do zestawu, który już posiadamy, dokładamy następne miary związku między zmiennymi nominalnymi, poszerzając nasze możliwości eksplanacyjne. Wszystkie miary siły związku pomiędzy zmiennymi są normalizowane, tak aby przyjmowały wartości z przedziału (O - l). Zależność statystyki chi-kwadrat od li-
I1
11\lf 1\ ii
, I
czebności
próby i rozmiarów tabeli sprawia, że z taką niu do miar opartych na chi-kwadrat mamy kłopot.
normalizacją
w odniesie-
Poprzednio używaliśmy współczynnika
Kłopot w interpretacji tego współczynnikapolega na tym, że jego wartość maksymalna może być wyższa od jedności w zależności od rozmiaru tabeli. Dlatego wnioski oparte o wielkość tego współczynnika mogą być niezbyt precyzyjne. Aby tę niedogodność skorygować, Pearson zaproponował współczynnik kon-
tyngencji C:
Maksymalna wartość tego współczynnikanie przekracza jedności ale w zależno ści od rozmiarów tabeli (a w szczególności od różnicy pomiędzy liczbą kolumn i wierszy) może przyjmować wartości mniejsze. Rozwiązaniu tego problemu służyło wcześniej używanie współczynnika Czuprowa T, a obecnie bardziej popularnego współczynnika Cramera V:
v-gdzie m to liczba kolumn wielkości jest mniejsza.
bądź
{;;?;
od tego, która z tych
powyżej
poważną wadę. Wartości pośrednie
7.4.
Między
poziomem nominalnym a ilorazowym
Powyżej zamknęliśmy rozważania dotyczące
Przypomnijmy sobie przykład, dla którego liczyliśmy ten współczynnik. Dotyczył on skłonności do uczestnictwa w akcjach charytatywnych według kategorii dochodu. Liczebności w tabeli 4.11 są za małe aby zastosować test statystyczny (liczba par zgodnych i liczba par niezgodnych dla tego testu musi być większa niż 100), powiększmy je więc dziesięciokrotnie (pozwoli nam to spełnić warunki stosowalnościtestu i nie zmieni obliczonej już wartości współczynnika gamma). Tabela 7.6. Skłonność do uczestniczenia w akcjach charytatywnych według kategorii dochodu
Dochód Skłonność do uczestniczenia w akcjach charytatywnych - - - - - - - - - Wysoki Średni Niski
50 20 O
Niska
miary związku oparte na chi-kwadrat mają tych miar nie mają dobrej bezpośredniej interpretacji. Chociaż mogą one służyć do badania związku między dwiema zmiennymi (niezależnie od poziomu ich pomiaru), to istnieje obecnie tendencja do używania miar związku odpowiednich dla zmiennych o danym poziomie pomiaru i ograniczenia zastosowania miar uniwersalnych (do których należą powyższe miary). Wszystkie przedstawione
współczynnika ,.
Średnia
(m-1)N' zależności
Jeśli obie zmienne były mierzone na poziomie porządkowym, to do zmierzenia siły ich związku w próbie stosowaliśmy współczynnik ,. Teraz chcielibyśmy sprawdzić, czy związek taki jest statystycznie istotny. Możemy tego dokonać za pomocą testu chi-kwadrat, ale możemy również dokonać weryfikacji testu statystycznego o hipotezie zerowej takiej, że r dla populacji równa się zero, korzystając z testu opartego na statystyce bezpośrednio odwołującej się do
Wysoka
2
wierszy, w
związek istnieje w próbie, jaki jest on silny i czy jest istotny statystycznie w populacji. Przejdźmy zatem do zmiennych mierzonych na poziomach wyższych.
badania związku między dwiema zmiennymi mierzonymi na poziomie nominalnym. Wiemy już, jak zbadać, czy
10 40 10
10 20 40
Obliczony dla takiej tabeli współczynnik gamma wynosił +0,78. Sprawdźmy teraz, czy związek ten jest statystycznie istotny.
Ho:
r
Hl:
r # o.
=
O.
Statystykę
tego testu obliczymy ze wzoru:
Dla naszego przykładu statystyka ta wyniesie: z =
0,78
8700 + 1100 = 8 725. 200(1 - 0,6084) ,
!
Liczyliśmy dla
będziemy się odwoływać do wartości krytycznego dla tego testu. Na poziomie istotności równym 0,05 wartość ta wynosi 1,96. Ponieważ 18,7251 > 11,961, więc odrzucamy hipotezę zerową o braku związku pomiędzy skłonnością do uczestniczenia w akcjach charytatywnych i poziomem dochodu respondenta z prawdopodobieństwem mniejszym niż 0,05.
tego testu
statystykę z,
to
rozkładu normalnego poszukując obszaru
Na tym zamykamy nasze rozważania dotyczące badania związków zmiennych poziom pomiaru dotyczy zmiennych ilościowych. Zanim do nich przejdziemy, jeszcze kilka słów na temat "par mieszanych" .
jakościowych. Następny
Jeśli badamy związek dwóch zmiennych będących na różnych poziomach pomiaru, to zasadniczo stosujemy w takim przypadku sposób badania właściwy dla zmiennych mierzonych na poziomie niższym dla danej pary. Poznaliśmy już jednak procedury, które pozwalają nam sprawdzić statystyczną istotność związku dwóch zmiennych, z których jedna jest mierzona na poziomach słabych a druga na poziomach silnych - to test dla dwóch prób i analiza wariancji. To czego nam dla takiej pary brakuje, to możliwość określenia siły takiego związku.
Taką miarą w
analizie wariancji jest stosunek korelacyjny eta (7]). Podniesiony do kwadratu mówi nam, jaka część wariancji zmiennej mierzonej na poziomie silnym może być wyj aśniona przez przynależność do kategorii zmiennej mierzonej na poziomie słabym. Obliczamy go na podstawie wzoru:
7.5. Koncepcja
liniowości
Załóżmy teraz, że dwie zmienne charakteryzującenasze jednostki analizy w próbie mierzone są na poziomach silnych. Przypuszczamy, że pozostają one ze sobą w związku, co oznacza dla nas, iż jedną z nich będziemy traktować jako zmienną niezależną a drugą jako zmienną zależną. Siła tego związku będzie zależała od tego, na ile zmiany wartości zmiennej niezależnej będą wpływały na zmiany wartości zmiennej zależnej. Pamiętamy jeszcze ze szkoły podstawowej, że dwie wielkości liczbowe charakteryzujące jeden obiekt (punkt - jednostkę analizy) możemy przedstawić w układzie współrzędnych. Na osi poziomej tego układu będziemy zamieszczać wartości zmiennej niezależnej, oznaczonej jako x, a na osi pionowej wartości zmiennej zależnej, oznaczonej jako y. Z matematycznego punktu widzenia powiemy, że y jest funkcją x. Przejdźmy
do prostego
r;J J~~-~y~!.~~
przykładu.
.
Wydaje nam się, że osiągniętypoziom wykształceniama wpływ na możliwąwysokość pierwszej płacy. Jeśli wysokość płacy będziemy mierzyć w złotówkach na miesiąc, a poziom wykształcenia w latach ukończonej edukacji (to faktycznie jest zmienna porządkowa, co do której przyjmujemy założenie ciągłości, gdy wyrażamy ją w latach), to obie zmienne będą zmiennymi ilorazowymi. Jeśli zależność między nimi w ogóle istnieje, to powinna ona, choć w przybliżeniu, wystąpić dla czterech wylosowanych przez nas osób. Aby zachować ich anonimowość, oznaczmy te osoby cyframi i zapiszmy odpowiadające im wartości obu zmiennych.
gdzie w liczniku mamy międzygrupowąsumę kwadratów a w mianowniku całko witą sumę kwadratów (wielkości pochodzące z analizy wariancji). Dla przedstawianego przy analizie wariancji przykładu o wpływie organizacji czasu szkolenia na ocenę jego efektywności, stosunek korelacyjny wynosi:
7]
2
=
12,6 51,5 = 0,245.
W tym przypadku tylko 24,5% różnic w ocenie być wyjaśnione czasem jego odbywania.
efektywności szkolenia mogłoby
Stosunek korelacyjny jest miarą siły związku, która ma jeszcze inne zastosowanie, o którym powiemy przy okazji omawiania związku między zmiennymi mierzonymi na poziomach silnych.
Osoby
Lata potrzebne na osiągnięcie danego poziomu wykształcenia
Dochód miesięczny w złotówkach
8
500 800 1025 1200
1 2
3 4
12 15 17
W naszym odczuciu poziom wykształcenia ma wpływ na wysokość pierwszej płacy, a nie odwrotnie. Zatem liczba lat konieczna do osiągnięcia okr:~lo.nego poziomu wykształceniabędzie naszą zmienną niezależną (x), a wysokosc pierwszej płacy -" zmienną zależną (y). Spróbujmy zaznaczyć te wartości w układzie współrzędnych.
Punkty na wykresie wyznaczające pozycje wszystkich badanych osób (rys. 7.1) ułożyły się w taki sposób, że możliwe stało się poprowadzenie linii prostej przechodzącej
prawie idealnie przez te punkty. y 1400 1200
(15;1025)
1000
(17;1200)
800
(12;800) 600
(8;500)
400
Podsumowując
te rozważania powiemy, że jeśli b będzie miało wartość dodatto zależność pomiędzy badanymi zmiennymi będzie wprost proporcjonalna, czyli pozytywna, natomiast jeśli b będzie miało wartość ujemną, to zależność między zmiennymi będzie odwrotnie proporcjonalna, czyli negatywna. nią,
Wyznaczmy wobec tego równanie prostej dla naszego przykładu. Na rysunku 7.1 widzimy, że pomiary trzech osób leżą idealnie na linii prostej. Aby wyznaczyć jej równanie wystarczyłyby dwa takie punkty, które określałyby b w następujący sposób: b = Y2 - YI . X2 -
200
o ~~~~~~~~~~~ o 4 8 12 16 20
Podstawiając do
wzoru dane dla osób l i 2, mamy: b = Y2 - YI
x
X2 -
Rysunek 7.1.
Spróbujmy to jeszcze Oznacza to, że zależność między naszymi zmiennymi ma charakter liniowy i możemy ją zapisać za pomocą funkcji liniowej w układzie współrzędnych: =
a+ bx.
W równaniu tym X i y, to nasze zmienne, a i b to stałe wyznaczającepozycję linii prostej w układzie współrzędnych - a informuje nas, w którym miejscu prosta przetnie oś y, natomiast b określa kąt nachylenia prostej do osi x, lub inaczej, zmianę wartości zmiennej zależnej odpowiadającą zmianie wartości zmiennej niezależnej o jedną jednostkę.
b = Y2 - YI
III
III
lIIl
dla osób l i 3:
= 1025 - 500 = 525 = 75. 15 - 8
Xl
=
= a + 75x,
500 = a + 600,
b> l, to przyrost wartości X o jedną jednostkę powoduje przyrost wartości y o więcej niż jedną jednostkę;
a = -100,
O < b < l, to przyrost wartości X o jedną jednostkę powoduje przyrost o mniej niż jedną jednostkę;
b = -l, to przyrost wartości X o jedną jednostkę powoduje spadek wartości y o jedną jednostkę;
b < -l, to przyrost wartości X o jedną jednostkę powoduje spadek wartości y o więcej niż jedną jednostkę; -l
< b < O, to przyrost
wartości y
7
a + bx,
y y
b = l, to przyrost wartości X o jedną jednostkę powoduje przyrost wartości y o jedną jednostkę;
wartości y III
4
500 = a + 75 . 8,
też III
12 - 8
Teraz możemy uznać, że nasze b wynosi 75, co oznacza, iż każdy rok spędzony na zdobywaniu wyższego poziomu edukacji procentuje w postaci dodatkowych 75 złotych do pierwszej pensji. Zabierzmy się za wyznaczenie współczynnika a. Do równania prostej wystarczy teraz podstawić współrzędne jednego punktu:
I tak, gdy: III
= 800 - 500 = 300 = 75.
Xl
sprawdzić
X2 -
y
Xl
o mniej
wartości
X
o jedną jednostkę powoduje spadek
niż jedną jednostkę.
a = 500 - 600,
zatem: y
=
-100 + 75x.
Jedno nas teraz może niepokoić - wartości obu zmiennych dla osoby 4. Według równania naszej prostej (jeśli zależność między badanymi zmiennym~ jest liniowa) osoba, która osiągnęła poziom edukacji wymagający 17 lat naukI powinna otrzymać pierwszą pensję w wysokości y = -100 + 75 . 17 = 1175 zł, a otrzymała 1200 zł. Zobaczmy dlaczego.
'\1\I'i'~ l,
" l,'
I
7.6. Prosta regresja liniowa W rzeczywistej sytuacji badawczej przypadek osoby 4 z naszego przykładu jest raczej regułą niż wyjątkiem. Z reguły próby są zdecydowanie bardziej liczne i jest mało prawdopodobne aby wszystkie pomiary (wartości dwóch zmiennych dla wszystkich jednostek analizy) układały się idealnie w linię prostą. Zdarza się jednak, że obraz ten wygląda jak na rysunku 7.2 (tu znów ze względu na przejrzystość ograniczymy liczbę pomiarów). y 6
czyli aby suma kwadratów odległości pomiędzy pomiarami a prostą (tak jak są one zaznaczone na rysunku 7.3) była najmniejszą możliwą wartością dla danego zbioru danych. Stąd nazwa metody. y8
6
4
5 2
• •
4
O-\----~---.--~--~--.----~
3
o
10
8
6
4
2
2
12
x Rysunek 7.3.
O-t--~--~--~--~-~--~
o
2
4
6
8
10
12
x Rysunek
7.2.
Możemy
o tym obrazie powiedzieć, że pewnej zmianie wartości zmiennej nieodpowiada określona tendencja do zmiany wartości zmiennej zależnej. Przypuszczamy, że dałoby się do tego obrazu dopasować taką linię prostą, iż każdej wartości x odpowiadałoby najlepsze oszacowanie wartości y. zależnej
Procedurę taką
nazywamy analizą regresji liniowej. Pozostaje pytanie, jak zna"najlepiej pasującą" prostą? Metoda, która nam to umożliwia nazywa się metodą najmniejszych kwadratów. Poznanie jej istoty zacznijmy od rysunku 7.3. leźć tę
Każdy
pomiar naszej próby łączymy odcinkami prostopadłymi do osi x z hiporegresji. Zatem dla każdej określonej wartości Xi będziemy mieli dwie wartości zmiennej zależnej: Yi - rzeczywista wartość pochodząca z badań oraz y;' - wartość zmiennej zależnej leżąca na estymowanej prostej. tetyczną linią
Dążymy
do tego aby:
Z poprzednich rozważań wiemy, że aby zapisać zależność między zmiennymi w postaci funkcji liniowej, musimy znaleźć współczynniki a i b. Ich najlepsze estymatory policzone metodą najmniejszych kwadratów otrzymuje się według poniższych wzorów: b_ N -
a=
2.: XiYi
- (2.: Xi) (2.: Yi) N2.: X;-(2.: Xi)2
2.:Yi - b 2.: Xi
N
gdzie: Xi - wartości, jakie przyjmuje zmienna niezależna w próbie; Yi - wartości, jakie przyjmuje zmienna zależna w próbie; N - liczebność próby. Wzory definicyjne dla obu współczynnikówsą następujące:
b_ -
2.: (Xi - X)
a=Y -
(Yi -
2.:(Xi- X )2
y) '
bX.
Zobaczmy teraz na przykładzie, że obliczenie tych współczynników nie jest czarną magią, choć "normalnie" zrzucamy tę żmudną pracę na komputer.
Oszacujmy zatem krok po kroku współczynniki szukanego równania liniowego: Utworzono indeks społecznego liberalizmu oparty na skali od O (postawy najmniej liberalne) do 10 (postawy najbardziej liberalne). Załóżmy, że badamy związek pomiędzy stopniem liberalizmu społecznego a religijnością - mierzoną częstością udziału w praktykach religijnych, również na skali od O (nieuczestniczenie w praktykach religijnych) do 10 (regularne i częste branie udziału w praktykach religijnych). Zakładamy następującą hipotezę badawczą:
ba jest religijna, tym mniej jest liberalnych. Oto
wartości
skłonna
w im większym stopniu dana osodo przyjmowania postaw społecznie
1. umieszczamy wartości zmiennych w kolumnach Xi i Yi; 2. liczymy wyrażenia XiYi dla każdego rzędu i zapisujemy je w kolejnej kolumnie; 3. podnosimy każdą wartość Xi do kwadratu i zapisujemy w osobnej kolumnie; 4. dokonujemy sumowania w każdej z zapisanych kolumn; 5. sumę wartości Xi podnosimy do kwadratu; 6. podstawiamy obliczone wyrażenia do wzoru na b i obliczamy je; 7. podstawiamy potrzebne wielkości do wzoru na a i obliczamy je; 8. zapisujemy równanie prostej.
obu zmiennych: No to do pracy:
Religijność
Xi
Społeczny
7 8 8 9 10
liberalizm Yi 4,0 4,0 3,5 3,0 2,5
Zacznijmy od umieszczenia tych punktów w układzie współrzędnych (rys. 7.4).
Xi
Yi
XiYi
x2
7 8 8 9 10
4,0 4,0 3,5 3,0 2,5
28 32 28 27 25
49 64 64 81 100
"
L: = 42 L: = 17 L: = 140 L: = 358
y6
Podstawiamy obliczone wielkości do wzorów:
5
• •
4
•
3 2
•
b = NL:XiYi - (L: Xi) (""{-Yi) NL:x; - (L: Xi)
•
700 - 714 1790 - 1764
a=
O+---.-----,--~--~--~-~
O
2
4
6
8
10
12
-14 26
=
-O 5385 ' ,
L:Yi - b L: Xi _ 17 - (-0,5385)·42 _ 17 + 22,617 N 5 5
=
39,617 = 7923. 5'
Po zaokrągleniu poszukiwane równanie prostej przybiera postać:
x
y
Rysunek 7.4.
Nawet przy takiej małej liczbie pomiarów widoczna jest tendencja do liniowej negatywnej między badanymi zmiennymi.
=
5·140 - 42 ·17 5·358 -1764
zależności
= 7,9 -
0,54x.
Narysujmy tę prostą na poprzednio sporządzonym wykresie punktowym (rys. 7.5).
Wzór ten wygląda skomplikowanie i choć zwykle liczy go za nas komputer, nawet za pomocą kalkulatora możemy sobie z tym zadaniem poradzić.
y 6 5
Wzór definicyjny na r jest
następujący:
• •
4 3 2
O+--~--~--.---~-~--~ 2 4 6 12 O 8 10
x Rysunek 7.5.
Wróćmy do naszego przykładu. Jeśli przypomnimy sobie wzór na współczyn nik b z analizy regresji i nasze wcześniejsze obliczenia, to zauważymy, iż prawie wszystkie wyrażenia potrzebne do obliczenia współczynnika korelacji r już mamy, z wyjątkiem kwadratu sumy wartości zmiennej zależnej i sumy kwadratów
tej zmiennej. Uzupełnijmy nasze
Wiemy już, jak znaleźć równanie regresji liniowej, jeśli przypuszczamy, że zwią zek między zmiennymi ma charakter liniowy. Nie wiemy jednak, jaką znaleziona zależność ma moc predykcyjną, czyli jak silny jest to związek - na ile zmiany zmiennej niezależnej wyjaśniają zmiany zmiennej zależnej. Miarą, która pomoże nam to określić jest współczynnik korelacji r Pearsona. ten pokazuje, na ile punkty obrazujące nasze pomiary odzwierciedlają układ liniowy. Jeśli przybiera on wartość O, oznacza to, że pomiary na wykresie są rozrzucone nieregularnie i nie tworzą żadnego wzorca lub też, że układają się w pewien charakterystyczny wzór ale nie jest to zależność liniowa, lecz jakaś inna.
('L Yi) 2 = (17)2 = 289, 'L YT = 16 + 16 + 12,25 + 9 + 6,25 = 59,5, wobec tego r w naszym przykładzie będzie mieć wartość:
Współczynnik
= O,
zmiennymi nie ma zależności liniowej. Jeśli wartość bezwzględna rwynosi 1, to oznacza idealną zależność liniową, a wyznaczona linia regresji liniowej pozwala nam na idealną przewidywalność. Im więc wartość bezwzględna r bliższa jedności, tym związek między zmiennymi jest bliższy idealnie liniowemu i tym większe nasze możliwości predykcyjne. Mówiąc o wartości współczynnika r odnosiliśmy się do jego wartości bezwzględnej, gdyż przybiera on wartości dodatnie dla zależności pozytywnej, a ujemne dla zależności negatywnej. Czas przywołać wzór, który pozwoli nam go obliczyć: Zatem, gdy r
między
obliczenia:
r
=
5 . 140 - 42 . 17
700 - 714
)(5.358 - 1764) (5·59,5 - 289)
)(1790 -1764)(297,5 - 289)
-----;c==========;==;:===~=====::c~
-14 ~
= -14 = -14 = -O 94.
J22I
14,87
'
Warto było się trudzić. Wielkość współczynnika korelacji wskazuje na bardzo silną negatywną zależność liniową między badanymi zmiennymi. Jeśli współczynnik korelacji r podniesiemy do kwadratu, to otrzymamy miarę, która powie nam, jaka część zmienności zmiennej zależnej może być wyjaśniona przez zmienną niezależną·
Przedstawimy tę ideę na rysunku 7.6.
Jeżeli obliczymy średnią arytmetyczną zmiennej zależnej, to będzie to dla danego zbioru danych pewna liczba, która na wykresie przedstawiona jest w postaci linii poziomej. Każdy poszczególny pomiar będzie się odchylał od średniej o odległość, jaka dzieli go od tej linii.
1' i
1i li
llll \
,
y
Współczynnik korelacji T Pearsona jest statystyką obliczoną na podstawie danych z próby i tak jak inne statystyki (np. średnia) może być poddany testom statystycznej istotności. Chcemy bowiem wiedzieć, czy korelacja między badanymi zmiennymi zachodzi również na poziomie populacji. Parametr, którego oszacowaniem jest współczynnik korelacji T, określany jest jako p (ro). x
Rysunek 7.6.
Odległość ta składa się z dwóch części: 11
III
z części pomiędzy linią wyznaczoną przez średnią i linią regresji i tę część zmienności wyjaśnia analiza regresji a obrazuje T 2 ;
Odpowiednie dla takiego testu hipotezy
Ho: p = 0,
Jeżeli p byłoby równe zero, znaczy to, że między zmiennymi nie ma zależności liniowej. Procedurę testowania możemy przeprowadzić w oparciu o statystykę testu t o n - 2 stopniach swobody. Statystykę tę liczymy ze wzoru:
z części pomiędzy linią regresji a danym konkretnym pomiarem i ta część zmienności nie jest wyjaśniona przez analizę regresji; miarą, która określa tę niewyjaśnioną część jest współczynnik alienacji, 1 - T 2 .
Spójrzmy na wzajemne relacje wymienionych współczynników: T
1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0
T
2
1,0 0,81 0,64 0,49 0,36 0,25 0,16 0,09 0,04 0,01 0,0
Widzimy zatem, że już poniżej wartości 0,7 współczynnika korelacji, większa część zróżnicowania zmiennej zależnej pozostaje niewyjaśniona przez analizę regresji, co wyklucza dokładne prognozowanie. Niestety w naukach społecznych takie sytuacje występują najczęściej. Nie zawsze związek między zmiennymi mierzonymi na poziomach silny(;h ma charakter związku liniowego. W takim przypadku miarą jego siły jest stosunek korelacyjny eta, ten który stosujemy jako uzupełnienie analizy wariancji.
przyjmą postać:
t =
Tvn- 2 . Vf=r2
Wróćmy
do naszego przykładu obrazującego związek religijności ze nym liberalizmem. Dla zaprezentowanej wcześniej próby był to silny odwrotnie proporcjonalny. Statystyka testu
istotności dla
t =
tego
społecz związek
przykładu wynosi:
-0,94y!5=2 = -4,772.
VI - (-0,94)2
W tablicach rozkładu Studenta dla testu dwustronnego o poziomie istotności 0,05 i dla df = 3 stopni swobody znajdujemy wartość wyznaczającą obszar krytyczny. Jest to 3,182. Zatem I - 4,7721 > 13,1821, więc hipotezę o braku związku liniowego między religijnością a społecznym liberalizmem w populacji musimy odrzucić. IIIlIIIIlIiI
Badanie związku między zmiennymi oraz jego siły i istotności jest podstawowym przedmiotem analizy statystycznej. Zaprezentowane w tym i poprzednim rozdziale metody pozwalające na takie badanie stanowią podstawy warsztatu socjologa w tym zakresie. Stosując je, trzeba zawsze pamiętać o warunkach i ograniczeniach, jakie ze sobą niosą. Ich dobra znajomość i zrozumienie dają przepustkę do świata bardziej zaawansowanych i wysublimowanych metod analizy, gdzie bogactwu życia społecznego odpowiada zróżnicowane podejście analityczne.
Ćwiczenia
Co
Ćwiczenie 7.1.
Test
Przeprowadź test chi-kwadrat dla następującego zestawu danych. Jeśli związek pomiędzy zmiennymi jest statystycznie istotny, to jaka jest jego siła?
waliśmy,
Studenci UMK według uzyskiwanej średniej i wydziału Średnia
Wydział
Biologii i nauk o ziemi Chemii Fizyki i astronomii Humanistyczny Matematyki i informatyki Nauk ekonomicznych i zarządzania Nauk historycznych Prawa i administracji Sztuk pięknych Suma
Suma
Wysoka
Średnia
Niska
11
20 15 8 28 15 34 31 19 12
9 10 7 17
10 5 25 14 16 19 15 5 120
182
11
20 10 16 8 108
40 35 20 70 40 70 60 50 25
może zrobić
za nas komputer
niezależnościchi-kwadrat
Jedną
ze zmiennych naszego zbioru danych, którą już uprzednio wykorzystyjest liczba osób w rodzinie. Przypuszczamy, że będzie ona różna ze względu na to, gdzie te rodziny zamieszkują. Ze zmiennej mającej kilka kategorii utworzyliśmy zmienną miejsce zamieszkania respondenta (wieś/miasto). Teraz przeprowadzimy test chi-kwadrat dla zmiennych miejsce zamieszkania respondenta i liczba osób w gospodarstwie domowym. Tabela krzyżowa: LICZBA OSÓB W GOSPODARSTWIE DOMOWYM * MIEJSCE ZAMIESZKANIA RESPONDENTA Liczebność
MIEJSCE ZAMIESZKANIA RESPONDENTA wieś
LICZBA OSÓB W GOSPODARSTWIE DOMOWYM
410
Ćwiczenie 7.2. Zbadano roczne dochody głowy rodziny i wysokość kieszonkowego, jakie otrzymują ich dzieci tygodniowo. Zbadaj, czy dla poniższych czterech pomiarów jest to zależność liniowa i na ile? Jeśli zależność liniowa występuje, to czy jest ona statystycznie istotna?
120
238
358
DWIE OSOBY
154
356
510
TRZY OSOBY
138
319
457
CZTERY OSOBY'
136
271
407
PIĘĆ OSÓB
135
132
267
SZEŚĆ OSÓB
100
56
156
SIEDEM OSÓB
56
20
76
OSIEM OSÓB
15
4
19
DZIEWIĘĆ OSÓB
17
2
19
DZIESIĘĆ OSÓB
6
2
8
JEDENAŚCIE OSÓB
4
4
DWANAŚCIE OSÓB Ogółem
881
1
1
1401
2282
Rysunek 7.7.
Pomiar
Dochody roczne w tys. zł
Kieszonkowe
1 2
80 70 52 45
160 95 97 85
3
4
Testy Chi-kwadrat Istotność
Wartość
asymptotyczna (dwustronna)
dl
180,980 8
11
181,392
11
,000
Test związku liniowego
127,473
1
,000
N Ważnych obserwacji
2282
Chi-kwadrat Pearsona Iloraz
Ogółem
miasto
JEDNA (RESP)
wiarygodności
a. 25,0% komórek (6) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność oczekiwana wynosi ,39.
Rysunek 7.8.
,000
Miary symetryczne
Program pod testem chi-kwadrat zapisał nam komunikat, że mamy za dużo pól o zbyt małej liczebności teoretycznej (rys. 7.7, 7.8). Aby tego uniknąć, połączy my mało liczne kategorie zmiennej liczba osób w gospodarstwie domowym od 7 osób do 12 osób w jedną kategorię. Jeszcze raz przeprowadźmytest chi-kwadrat.
Istotność
Wartość
Nominalna przez Nominalna
Phi
,278
,000
V Kramera
,278
,000
,268
,000
Współczynnik
kontyngencji
Tabela krzyżowa: LICZBA OSÓB W GOSPODARSTWIE DOMOWYM' MIEJSCE ZAMIESZKANIA RESPONDENTA
przyblIżona
2282
N Ważnych obserwacji
Rysunek 7.11.
Liczebność
MIEJSCE ZAMIESZKANIA RESPONDENTA miasto
wieś
LICZBA OSÓB W GOSPODARSTWIE DOMOWYM
Ogółem
120
238
2 osoby
154
356
510
3 osoby
138
319
457
4 osoby
136
271
407
5 osób
135
132
267
6 osób
100
56
156
98
29
127
881
1401
2282
7 i więcej osób Ogółem
Analiza regresji
358
1 osoba
Rysunek 7.9.
W PGSS nie ma zbyt wiele takich danych, na których z powodzeniem dałoby się zaprezentować analizę regresji liniowej. Jeżeli założymy, że poziom wykształcenia respondenta powinien mieć wpływ na poziom osiąganych przez niego dochodów, to możemy spróbować zbadać, na ile jest to zależność liniowa. W tym przypadku poziom wykształcenia będziemy mierzyć w liczbie lat edukacji niezbędnej do osiągnięcia poszczególnych jego poziomów (będziemy więc "naciągać" założenie o ciągłości takiej zmiennej). Spójrzmy najpierw na wykres dla obu zmiennych (rys. 7.12).
Testy Chi-kwadrat Istotność Wartość
Chi-kwadrat Pearsona Poprawka na
N
,000
1800
fi;;. J!J c
1600
Q)
"O
1400
c o. 1200
o 173,869
6
,000
liniowego
121,348
1
,000
obserwacji
2282
związku
Ważnych
6
ciąg/ość
Iloraz wiarygodności Test
175,943
asymptotyczna (dwustronna)
dl a
z-
...J
a. ,0% komórek (O) ma liczebność oczekiwaną mniejszą MInimalna liczebność oczekiwana wynosi 49,03.
~ >. u ~
o. N
niż
5.
1000 800
>.
"O
o
.<=
u
600
o
Rysunek 7.10.
Teraz spełnione są warunki stosowalności testu chi-kwadrat (rys. 7.9, 7.10). Poziom jego istotności (mniejszy od 0,05) wskazuje na to, że musimy odrzucić hipotezę zerową o braku związku między miejscem zamieszkania respondenta a liczbą osób w jego rodzinie. Związek taki istnieje i jest istotny statystycznie. A jaka jest jego siła? Miary związku oparte na chi-kwadrat wskazują na niezbyt mocny, ale wyraźny związek między analizowanymi zmiennymi (rys. 7.11).
o
ro
400
'c "O ~
200
(f)
_ _~_ _~_ _~_c::-:-=-=-_~_~
o~
BRAK FORM WYKSZT 4 LATN1
8 LAT/2
12 LAT/4,6
10 LAT/3,4
17LAT/9 14 LATI7,8
Lata nauki szkolnej respondenta
Rysunek 7.12.
Widać, że możemy zaryzykować i poszukać linii prostej obrazującej taką zależ ność jak przedstawiona na wykresie dla obu zmiennych.
Współczynnik
korelacji w tej analizie regresji liniowej (liczba lat edukacjidochód respondenta) nie jest wysoki. Tylko 12,8% zróżnicowania dochodów może być wyjaśnione przez liczbę lat edukacji. Związek ten jest istotny statystycznie (poziom istotności mniejszy od 0,05) (rys. 7.13, 7.14). Model - Podsumowanieb
I11
Model
II
R
a. Predyktory:
.359
3
I
R-kwadrat
Skorygowane R-kwadrat
.1291
1
(Stała),
I
I
I
Błąd standardowy oszacowanIa
698.66
.1281
I
LATA NAUKI SZKOLNEJ RESPONDENTA
b. Zmienna zależna: DOCHODY Z PRACY RESPONDENTA (PLN)
Rysunek
7.13.
Współczynniki"
Współczynniki
Współczynniki
niestandaryzowane
standaryzowane
Błąd
Model
1
standardowy
B (Stała)
-118,499
101,077
96,469
8,387
LATA NAUKI SZKOLNEJ RESPONDENTA a. Zmienna
zależna:
t
Beta
,359
Istotność
-1,172
,241
11,503
,000
DOCHODY Z PRACY RESPONDENTA (PLN)
Rysunek
7.14.
Literatura 1. Blalock M. H.: Statystyka dla socjologów. Warszawa, PWN 1977. 2.
Brzeziński
J.: Metodologia
badań
psychologicznych. Wyd. 3. Warszawa, PWN
1999. 3. Frankfort-Nachmias Ch., Nachmias D.: Metody badawcze w naukach spolecznych. Poznań, Zysk i S-ka 2001. 4.
Gruszczyński
L. A.: Elementy statystyki dla socjologów. Katowice, Uniwersytet
Śląski 1986.
Jak być odkrywcą? Analiza struktur ukrytych
Pojęcia !li II! III
II! II! III
I'i III
podstawowe
zmienna ukryta zmienna wskaźnikowa analiza struktur ukrytych klasa ukryta lokalna niezależność model ogólny prawdopodobieństwoklas ukrytych prawdopodobieństwo warunkowe
II! I!I III
III III III l1li II!
błąd przyporządkowania
ograniczenia określonej wartości ograniczenia równej wartości równoczesna analiza struktur ukrytych model heterogeniczny model homogeniczny model logarytmiczno-liniowy model ścieżkowy
Niniejszy dodatek wykracza poza ramy elementarnego kursu ze statystyki, jaki przedmiotem wszystkich dotychczasowych wywodów. W oparciu o wiedzę pochodzącą tylko z poprzednich rozdziałów nie da się zgłębić wszystkich jego tajników. Niemniej jednak zachęcam do lektury. Staram się tu w przystępny sposób - tam gdzie jest to możliwe w formie zbliżonej do już znajomej czytelnikowi - przedstawić metodę analizy danych pochodzącychz badań społecznych, na świecie już dość rozpowszechnioną,a w Polsce ciągle mało obecną, przyjazną humanistycznemu sposobowi myślenia. Na jej temat napisano już kilka książek - niestety nie w języku polskim - dlatego pozwalam sobie, inaczej niż w poprzednich rozdziałach na zamieszczenie odnośników literaturowych, w nadziei na poszerzenie grona entuzjastów stosowania analizy struktur ukrytych. był
ćwiczeń proponuję dość szczegółowo opisany projekt analityczny, pow nim to, co na ogół w tekstach metodologicznych ukryte. Uprzedzam jednak raz jeszcze, że na podstawie wiedzy zaczerpniętej tylko z tego podręcz nika nie da się prezentowanego tekstu w całości zrozumieć, ale można mieć przedsmak tego, jakie efekty w analizie ilościowej można osiągnąć, przechodząc na wyższe szczeble statystycznego wtajemniczenia.
Zamiast
kazując
W naukach społecznych często mamy do czynienia z luką pomiędzy językiem teorii a językiem badań. Koncepcje, których używamy na poziomie teoretycznym nie mogą być bezpośrednio zaobserwowane w rzeczywistości społecznej. Nie możemy na przykład "zobaczyć" czyjejś lojalności czy solidarności grupowej, ale badamy te pojęcia poprzez obserwację zachowań i odpowiedzi na różnorodne bodźce. Wspomnianą lukę możemy uzupełnić poprzez zastosowanie matematycznych modeli pomiaru, w których związek pomiędzy teoretyczną koncepcją i jej wskaźnikami będzie jasno zarysowany. Takie modele zwykle zawierają bezpośrednio obserwowalne zmienne - wskaźniki, i pośrednio obserwowalne zmienne ukryte - zmienne teoretyczne.
Jedną
z naj starszych i najczQściej stof:lowanych metod takiej analizy jest analiza czynnikowa, której używamy, gdy zmienne są mierzone na poziomie interwałowym, bądź ilorazowym. Jeżeli bezpośrednio obserwowalne zmienne są zmiennymi dyskretnymi, mierzonymi na poziomie nominalnym, to analogiczną do analizy czynnikowej jest tu analiza struktur ukrytych (Andersen 1990; Langeheine i Rost 1988). Punktem wyjściowym tej analizy jest wielozmiennowa tabela cZQstości oddająca związki między zmiennymi jakościowymi. Na jej podstawie próbuje się znaleźć uzasadnione przez racje teoretyczne zmienne ukryte, z których każda ma co najmniej dwie kategorie (czy też klasy), i które to "ukryte kategorie" wyjaśniają (oczywiście w statyf:ltycznym sensie) relacje pomiędzy zmiennymi wskaźnikowymi.
'.
Jeszcze do niedawna analiza struktur ukrytych była stosowana w niewielkim zakresie - pomimo jej potencjalnie dużych możliwości. Spowodowane to było niewątpliwie faktem, że procedury estymacji i testowania modeli rozwijane przez Lazarsfelda i innych (Lazarsfeld 1950a; 1950b; Lazarsfeld i Henry 1968) nie były wystarczająco satysfakcjonujące. Procedury te były bardzo arbitralne i mało elastyczne. Przełornu w stosowaniu anali:oy struktur ukrytych dokonali Haberman i Goodman (Goodman 1974a; 1974b; Haberman 1976; 1977; 1979). Sformułowali oni model tzw. "klaf:l ukrytych" w kategoriach modelu logarytmiczno-liniowego zakładającego występowanie zmiennych ukrytych i pokazali jak otrzymać parametry estymacji dla zależności w takim modelu. Odwołując f:lię do ich podej.ścia łatwo też uogólnić standardowy model z jedną zmienną ukrytą na model z wieloma wielokategorialnymi zmiennymi ukrytymi (Hagenaars 1990; 1993). Takie uogólnione narzędzie znajdzie lepsze zastosowanie w analizie zależności dotyczących złożonych teoretycznych konstruktów. Szczególnie przydatne jest ono wówczas, gdy dane (zmienne dyskretne, bezpośrednio obserwowalne) pochodzą z badań kwestionariuszowych i można, opieraj ąc się na nich, zweryfikować hipotezy dotyczące np. postaw społecznych.
jest uwarunkowany przez nieobserwowalną, ukrytą zmienną, spodziewamy się wzajemnych zależności między tymi wskaźnikami. Badamy te zależności, aby zrozumieć naturę zmiennej ukrytej. Analiza zmiennych ukrytych opiera
się
na
założeniu, że zależności, które wystę
pują między wskaźnikami wynikają ze związku każdego wskaźnika ukrytą
-
to znaczy,
że
nymi wskaźnikowymi. relację
ze zmienną zmienna ukryta "wyjaśnia" związki pomiędzy zmienZatem relacja z rysunku D.1a zostaje zamieniona na
z rYf:lunku D.1b.
b)
a)
A
AD B)
/ X-B ~C
C Rysunek D.l.
Jeśli zmienna ukryta istnieje, to wprowadzając ją jako zmienną kontrolną do zależności między zmiennymi wskaźnikowymi otrzymujemy sytuację lokalnej niezależności zmiennych wskaźnikowych - czyli wskazujemy, że ich wzajemne relacje były zależnościami pozornymi. Zatem to właśnie zmienna sila wiary religijnej wyjaśnia zależności obserwowane pomiędzy częstością wizyt w kościele, modlitw i znaczeniem religii w życiu każdej badanej osoby. Związek zmiennej ukrytej ze zmiennymi wskaźnikowymi ma charakter probabilistyczny. Osoby głęboko religijne czasami z powodów "zewnętrznych" (włączając w to błąd pomiaru) nie chodzą do kościoła, ale prawdopodobieństwo tego jest dużo mniejsze niż wśród osób niewierzących.
Co to jest zmienna ukryta
Analiza struktur ukrytych
Wielu pojęć w naukach społecznych nie możemy obserwować wprost. Rozwoju ekonomicznego, autorytaryzmu, dyskryminacji etnicznej, alienacji, anomii, lojalności, zaufania itp. nie da się "zbadać" za pomocą jednej zmiennej. Mamy do dyspozycji wiele interesujących teoretycznie koncepcji wyjaśniających takie pojęcia, dla których dostępne miary f:lą nieprecyzyjnymi wskaźnikami. Na przykład, chociaż nic możemy bezpośrednio zaobserwować religijnego zaangażowa nia, to skłonni jesteśmy wierzyć, że im większa siła wiary religijnej, tym częściej ludzie chodzą do kościoła, modlą się, uważają religię za bardzo ważną wartość w swoim życiu. Ponieważ wierzymy, że każdy obf:lerwowany przez nas wskaźnik
Najbardziej ogólnie można powiedzieć, że analiza struktur ukrytych umożliwia utworzenie wielowymiarowej zmiennej ukrytej na podstawie wielozmiennowej tabeli częstości oddającej związki między zmiennymi wskaźnikowymi. Pozwala zidentyfikowaćokreśloną liczbę rozłącznych klas ukrytych, będących kategoriami zmiennej ukrytej. Dlatego jednym z ważnych zastosowań analizy struktur ukrytych jest analiza różnych typologii - jako metoda empirycznego wyróż nienia typów ukrytych na podstawie zmiennych wskaźnikowych, bądź też jako metoda testowania teoretycznie stworzonej typologii na danych empirycznych.
Metodę tę stosujemy w odniesieniu do zmiennych na poziomie nominalnym lub porządkowym.
wskaźnikowych mierzonych
Na prostym przykładzie dwóch zmiennych dychotomicznych postaram się wylogiczne podstawy tej metody. Załóżmy, że mamy hipotetyczny rozkład dwóch zmiennych taki, jak w tabeli D.1 (uproszczonej graficznie).
Jeżeli założymy, że powyższa sytuacja ma miejsce, to po wprowadzeniu zmiennej G jako zmiennej kontrolnej, rozkład liczebności pomiędzy zmiennymi A i B dla każdej kategorii zmiennej G przedstawiałby się jak w tabeli D.2.
jaśnić
Tabela D.2. Zmienna C
+
Tabela D.l.
Zmienna B
Zmienna B Zmienna A
8B3E
Zmienna B
+
5
55
150
70
80
150
165
135
Rozkład liczebności
wskazuje, że zmienne te nie są niezależne. Znane są nam już sposoby badania zależności między takim zmiennymi. Test niezależności chi-kwadrat (X 2 = 8,42 dla df = 1, p < 0,01) potwierdza, że nie możemy uznać zmiennych A i B za niezależne. Do tej pory jednoznacznie przyjmowaliśmy interpretację zależności przyczynowo-skutkowej między takimi zmiennymi. Jest to jednak jedna z możliwych interpretacji. Inne interpretacje wychodzą z zało żenia, że jest to związek symetryczny, w wyjaśnianiu którego nie odwołujemy się do pojęcia przyczynowości. Jedna z możliwych koncepcji interpretacji związ ku symetrycznego jest taka, że zmienne w takim związku są alternatywnymi wskaźnikami pewnego wspólnego pojęcia. Do tej właśnie interpretacji odwołuje się analiza struktur ukrytych. Przyjmijmy, że w prezentowanym przykładzie zmienna A, to potwierdzenie "tak" lub zaprzeczenie "nie" dla stwierdzenia: "niezależnie od tego co mówią ludzie, większość przeciętnych ludzi jest coraz gorsza, a nie lepsza". Natomiast zmienna B to ustosunkowanie się ("tak" lub "nie") do stwierdzenia, że "w dzisiejszych czasach, tak naprawdę nie wiadomo, na kogo można liczyć". Jeśli związek między tymi zmiennymi istnieje, a potwierdzają to miary związku, to uznając go za związek przyczynowo-skutkowy musielibyśmy wierzyć, że stanowisko wobec większości przeciętnych ludzi ma wpływ na uczucie zaufania wobec innych, lub odwrotnie. Zamiast tego. skłonni jesteśmy uznać ten zwią zek za symetryczny i poszukiwać jego wyjaśnienia w trzeciej zmiennej G, która opisuje zjawisko anomii społecznej (w badaniu tego problemu są używane twierdzenia przypisane zmiennej A i .13): Teraz możemy postawić hipotezę, że osoba doświadczająca anomii odpowie twierdząco na oba pytania a osoba nie doświadczająca anomii na oba pytania odpowie przecząco. Zatem zmienna G wyj aśnia zależność między zmiennymi A i B.
Zmienna A
+
+
~ ~
+
flT[35J
~
Dla każdej kategorii zmiennej G, zmienne A i B są od siebie niezależne (X 2 = 0,0 dla df = 2), gdzie szacunkowe częstości liczy się ze wzoru: A
A
AC
Pijk = Pik
A
BC
. P jk
AC
. Pk .
Daszek P oznacza wartość estymowaną, co nie jest dla nas żadną nowością, natomiast pozioma kreska nad oznaczeniem jednej ze zmiennych (tu AG i BG) oznacza, że szacowane prawdopodobieństwojest prawdopodobieństwemwarunkowym, tj. szacowane prawdopodobieństwo zmiennej z nadkreśleniem jest liczone dla kategorii zmiennej bez nadkreślenia. Odwołując się do danych z tabeli D.2 powiemy, że szacunkowe prawdopodobieństwo tego iż osoba doświad czająca anomii (zmienna G(+)) uważa większość przeciętnych ludzi za coraz gorszą (zmienna A(+)) wynosi 0,667 (Pil C = 100/150, wszystkie osoby doświadczające anomii zmienna G( +) _. to 150 osób a wśród nich 100 zmienna A( +) - potwierdziło, że przeciętni ludzie są coraz gorsi) a szacunkowe prawdopodobieństwo, że respondenci ci nie wiedzą na kogo można liczyć (zmienna B(+)) wynosi 0,8 (PfiC = 120/150). Wśród osób nie doświadcza jących anomii (zmienna G(-)) szacunkowe prawdopodobiellstwo, że uważają oni większość przeciętnych ludzi za coraz gorszą (zmienna A( +)) wynosi 0,333 (Prl? = 50/150) a szacunkowe prawdopodobieństwo, że nie wiedzą oni na kogo można liczyć (zmienna B(+)) wynosi 0,3 (PEC = 45/150). Łączne prawdopodobieństwo tego, że respondent będzie uważał większość przeciętnych ludzi za coraz gorszą i nie będzie wiedział na kogo można liczyć i będzie cierpiał na anomię wynosi 0,2668 (Pil C . Pfic . Pf = 0,667'0,8·0,5). Częstości teoretyczne A
w tego typu tabelach obliczamy ze wzoru:
fijk =
A
AAC ABC
N . Pijk = N . Pik
. P jk
AC
. Pk ,
gdzie N to liczebność całkowita próby. W prezentowanym przykładzie wszystkie liczebności empiryczne są równe liczebnościom teoretycznym obliczonym według powyższego wzoru (dlatego statystyka chi-kwadrat jest równa zero). Zmienne A i B stają się niezależne od siebie, pod warunkiem zaistnienia zmiennej C. Jeżeli zależność pomiędzy obserwowanymi zmiennymi zanika ze względu na kategorie innej zmiennej, to zmienne obserwowane stają się lokalnie niezależne w stosunku do siebie, w obecności zmiennej wyjaśniającej. Jeśli
grupa zmiennych wzajemnie zależnych okazuje się lokalnie niezależna ze na kategorie jakiejś dodatkowej zmiennej, to ta zmienna dodatkowa "wyjaśnia" obserwowane związki - i to ta zmienna staje się prawdziwym obiektem naszego zainteresowania. To jest nasza zmienna ukryta.
względu
Formalny model analizy struktur ukrytych Lokalna
niezależność
zmiennych A i B ze
względu
na kategorie zmiennej C kombinacji i, j, k jest iloczynem prawdopodobieństwawarunkowego zmiennej A, prawdopodobieństwa warunkowego zmiennej B oraz prawdopodobieństwaznalezienia się w określonej kategorii zmiennej C. Jeśli zmienna wyjaśniającajest zmienną ukrytą, to oznaczamy ją jako zmienną X o T klasach (kategoriach) a prawdopodobieństwo zapisujemy jako 7r. Przy takich oznaczeniach wcześniejszy wzór na częstości szacunkowe przedstawiałby się następująco: wyraża się
tym,
że prawdopodobieństwokażdej
=
Ax 7r it
EX
Liczba stopni swobody w tym modelu jest równa df = I· J. '" . M-l - [T(I - 1)
+ T(J - 1) + ... + T(M - 1) + (T - 1)],
gdzie: I - liczba kategorii zmiennej A; J - liczba kategorii zmiennej B; M liczba kategorii zmiennej E; T -- liczba klas (kategorii) zmiennej X. Dwa kluczowe pojęcia opisują tak zapisany model formalny analizy struktur ukrytych. Są to prawdopodobiCllstwo klas ukrytych i prawdopodobieństwo warunkowe. Prawdopodobieństwoklas ukrytych opisuje rozkład klas (kategorii) zmiennej ukrytej, dla którego zmienne wskaźnikowe pozostają lokalnie niezależne. Rozkład ten odnosi się do liczby klas i do ich relatywnej wielkości. Liczba klas (T) odpowiada liczbie ukrytych typów jednostek analizy zdefini(,lwanych za pomocą modelu na podstawie częstości empirycznych. Jeśli np. liczba klas wynosi trzy, to populacja może być scharakteryzowana przez trzy typy jednostek analizy. Minimalna liczba klas to dwie (przy jednej klasie ukrytej lokalna niezależność między zmiennymi wskaźnikowymi byłaby niezależnością faktyczną)·
Relatywna wielkość klas ukrytych informuje nas o rozkładzie typów ukrytych w populacji, o tym czy któryś z typów jest dominujący w populacji a inny reprezentuje mniejszość, czy też poszczególne typy obejmują zbliżone części populacji. Suma prawdopodobieństwklas ukrytych po wszystkich t równa się jeden
~7r:=1.
. 7r jt
t;
gdzie
ABX 7r ijt
jest
w polu i, j, t losowo
prawdopodobieństwem znalezienia się
Ax
wybranej jednostki analizy; 7rit jest prawdopodobieństwemtego, że jednostka analizy znajdująca się w klasie t zmiennej ukrytej X trafi do kategorii i EX zmiennej A; 7r jt jest prawdopodobieństwemtego, że jednostka analizy znaj-
dująca się w klasie t zmiennej ukrytej
X trafi do kategorii j zmiennej B; 7r: jest do klasy t zmiennej ukrytej X losowo dobranej model ten możemy zapisać jako:
prawdopodobieństwemtrafienia
jednostki analizy.
Uogólniając, AB ... EX 7r ij ... mt
=
Ax 7r it
EX . 7r jt
EX
..... 7rmt
Kiedy relatywna wielkość klas ukrytych różni się w dwóch populacjach o podobnej strukturze klas ukrytych, to mamy do czynienia z dystrybucyjną róż norodnością typów ukrytych w tych dwóch populacjach (np. wśród osób na stanowiskach robotniczych 1/4 doświadcza anomii, a wśród osób wykonują cych wolne zawody tylko 5%). Mogą się one również odnosić do badania tej samej populacji w różnych momentach czasowych i wówczas służą do opisu zachodzących w tej populacji zmian (np. wśród osób na stanowiskach robotniczych 5 lat temu 1/4 doświadczała anomii a teraz jest to 1/3). Do kwestii tych powrócimy przy okazji prezentacji modelu równoczesnej analizy struktur ukrytych.
X
.
7r t
.
Ten ogólny model analizy struktur ukrytych opisuje związek symetryczny zmiennych A, B, ... , E, lokalnie niezależnych ze względu na przynależność do klasy t zmiennej ukrytej X.
Prawdopodobieństwowarunkowe to prawdopodobieństwo,z którym jednostka analizy należąca do klasy t zmiennej ukrytej X zostanie przyporządkowana do określonej kategorii zmiennej wskaźnikowej. Nawiązując do naszego przykła du z anomią, jest to np. prawdopodobiellstwo tego, że osoba doświadczająca
iż większość przeciętnych ludzi
jest coraz gorsza lub jest to prawosoba nie doświadczająca anomii uzna to samo. Dla każdej z T klas zmiennej ukrytej mamy zestaw prawdopodobieństw warunkowych odnoszących się do każdej zmiennej wskf1źnikowej. Ponieważ zmienne wskaźnikowe mogą być dychotomiczne lub wielo;tategorialne, liczba prawdopodobieństw warunkowych dla każdej zmiennej irskaźnikowej jest równa liczbie jej kategorii. anomii uzna,
dopodobieństwo tego, że
Zmienna wskaźnikowa A w przykładzie o anomii ma dwie kategorie: tych, którzy uważają, że większość przeciętnych ludzi jest coraz gorsza i tych, którzy tak nie uważają. Dla tej zmiennej będziemy mieli dwa warunkowe prawdopodobień stwa dla każdej z klas ukrytych. Wewnątrz każdej klasy prawdopodobieństwa warunkowe dla każdej zmiennej wskaźnikowej sumują się do jedności
Prawdopodobieństwa warunkowe pozwalają
nam charakteryzować naturę typów jednostek analizy zdefiniowanych przez klasy ukryte. Wewnątrz każdej klasy (kategorii zmiennej ukrytej X) prawdopodobieństwawarunkowe wskazują, na ile dany typ posiada w mniejszym lub większym stopniu charakterystykę każdej ze zmiennych wskaźnikowych. Jeżeli
w jednej klasie zmiennej wyjaśniającej C 90% respondentów uważa, że jest coraz gorsza a 80% nie wie na kogo można liczyć; natomiast w drugiej klasie zmiennej C jest to odpowiednio 30% i 25%, to jesteśmy skłonni uznać, że klasa pierwsza to osoby doświadczone anomią a klasa druga to osoby nie doświadczające anomii. To jest nasza typologia zmiennej ukrytej. To właśnie ze względu na interpretację prawdopodobieństwwarunkowych analiza struktur ukrytych bywa określana jako metoda analogiczna do analizy czynnikowej . większość przeciętnych ludzi
Analiza struktur ukrytych może mieć charakter eksploracyjny lub konfirmacyjny. W eksploracyjnej analizie struktur ukrytych badaczowi chodzi o skonstruowanie zmiennej ukrytej na podstawie zmiennych wskaźnikowych, bez wstęp nych hipotez dotyczących prawdopodobieństw warunkowych i prawdopodobieństw klas ukrytych. Model w takiej analizie jest modelem bez ograniczeń (badacz nie zakłada ograniczeń a priori na żaden z parametrów modelu). Konfirmacyjna analiza struktur ukrytych daje nam możliwość testowania hipotez dotyczących typów ukrytych z ich empirycznie wywiedzioną postacią. Modele w takiej analizie są modelami z ograniczeniami, które są nakładane na te parametry modelu, których dotyczą testowane hipotezy.
W prezentowanym przykładzie chciałabym się odwołać do zagadnień, które już przedmiotem mojej analizy (Nawojczyk, McCutcheon 1996), tak aby dociekliwy czytelnik miał szansę na dokonanie szerszych porównań i studiów. Problemem badawczym będzie stosunek Polaków do legalizacji aborcji. Przedstawię tu tylko samą metodę analizy struktur ukrytych nie wchodząc w żadne kwestie społecznego kontekstu tego problemu. W PGSS jest cała seria pytall dotyczących aprobaty respondentów dla legalizacji aborcji ze względu na prezentowane powody. Pytania te są sformułowane w sposób następujący:
kiedyś były
Czy uważa Pan(i), że kobieta powinna mieć, czy też nie możliwość legalnego przerwania ciąży jeśli: A. Ciąża poważnie zagraża zdrowiu kobiety? B. Istnieje wysokie prawdopodobiellstwo, że dziecko urodzi się z poważnymi wadami? C. Ciąża była wynikiem gwałtu? D. Rodzina ma bardzo niskie dochody nie może sobie pozwolić na więcej dzieci? E. Kobieta jest mężatką i nie chce mieć już więcej dzieci? F. Kobieta nie jest mężatką i nie chce wyjść za mężczyznę, z którym zaszła w ciążę? Kolejność
w PGSS była inna niż wyżej wymieniona. Ta została ułożona według koncepcji dwóch typów sytuacji obejmujących "etyczno-medyczne" powody aborcji (to zmienne A, B i C) i "społeczne" powody aborcji (to zmienne D, E i F). Wszystkie te zmienne to zmienne mające dwie kategorie odpowiedzi: potwierdzającą "tak" i zaprzeczającą "nie". Ich rozkład dla danych PGSS z roku 1999 jest następujący: zadawania
pytań
Wskaźnik
A. zagrożenie zdrowia kobiety B. poważne uszkodzenie płodu C. ciąża po gwałcie D. zbyt biedna E. nie chce więcej dzieci F. samotna kobieta
Tak
Nie
86,7% 82,0% 77,6% 49,7% 43,0% 34,1%
13,3% 18,0% 22,4% 50,3% 57,0% 65,9%
Z rozkładu tego wynika, że zdecydowana większość respondentów uznaje prawo do legalnej aborcji z powodów "etyczno-medycznych" a ponad połowa odmawia takiego prawa z powodów "społecznych". Jak wiele jest takich osób, które
akceptują wszystkie powody legalizacji aborcji? Jak wiele jest takich osób, które nie akceptują żadnego powodu legalizacji aborcji? Czy są osoby przyjmujące postawy pośrednie? Jeśli tak, to jakie są to postawy i jak wiele jest takich osób? Oto pytania, na które jesteśmy w stanie udzielić odpowiedzi z pomocą eksploracyjnej analizy struktur ukrytych. Pierwszą decyzją, jaką
decyzja dotycząca liczby klas ukrytych, które chcemy zidentyfikować. W analizie eksploracyjnej nie musimy posiadać gotowej hipotezy tę liczbę określającej. Możemy do niej dochodzić stopniowo, tworząc kolejne modele o różnej liczbie klas ukrytych. Wybierzemy ten z nich, którego parametry opisujące model będą wskazywały na najlepsze jego dopasowanie do zmiennych wskaźnikowych. musimy
to oznaczało, że większość obywą,teli prezentuje postawy zgodne z przyjętymi w Polsce rozwiązaniami legisla7jnymi tej kwestii. /
Formalny model dla analizowanego przykładu przybierze następującą postać:
Gdyby liczba klas ukrytych w naszym przykładzie wynosiła jeden, oznaczało by to, że zmienna ukryta nie jest konieczna do wyjaśnienia zależności między zmiennymi wskaźnikowymi- co jest równoznaczne z tym, że taka zmienna nie istnieje. Przy dwóch klasach ukrytych mielibyśmy do czynienia z dwoma typami respondentów: takimi, którzy akceptują wszystkie powody legalizacji aborcji i takimi, którzy nie akceptują żadnego powodu legalizacji aborcji. Zaprezentowany powyżej rozkład odpowiedzi na poszczególne pytania wskaźnikowe wskazuje, że nie jesteśmy w stanie przyporządkować wszystkich respondentów do takich przeciwstawnych grup (różnice w poziomie aprobaty i dezaprobaty dla poszczególnych zmiennych). W mojej wcześniejszej analizie odnoszącej się do tego samego problemu, ale dla danych z 1992 i 1993 roku, najlepszym modelem okazał się model z trzema klasami ukrytymi. Zapewne w stosunku do danych z roku 1999 też okaże się on trafny. Model ten zakłada istnienie trzech klas ukrytych - kategorii zmiennej opisują cej postawy wobec legalizacji aborcji. W klasie pierwszej znajdą się osoby, które akceptują legalizację wszystkich powodów aborcji. Jeśli założymy, że wszystkie osoby, które akceptują legalizację aborcji w sytuacji, gdy niezamężna kobieta nie chce poślubić mężczyzny, z którym jest w ciąży (najniższy wskaźnik aprobaty 34,1%), akceptują również pozostałe powody legalizacji aborcji, to klasa ta może obejmować co najmniej 34% populacji. Przeciwne postawy, tzn. nie akceptowania żadnego powodu legalizacji aborcji, będą reprezentować przedstawiciele klasy trzeciej. Jeśli przyjmiemy, że respondenci, którzy nie akceptują legalizacji aborcji w sytuacji, gdy ciąża zagraża zdrowiu kobiety (naj niższy wskaźnik braku akceptacji 13,3%) nie akceptują również żadnego jej innego powodu, to mogą oni stanowić co najmniej 13% populacji. Pozostałe osoby znajdą się w klasie drugiej wśród respondentów, którzy akceptują legalizację aborcji z powodów "etyczno-medycznych" a nie akceptują jej z powodów "społecz nych". Powinna to być większość badanej populacji. Jeśli tak będzie, to będzie
Ax
ADCDEFX 7rijklmnt
podjąć, jest
=7r it
ex
EX '7rjt
'7r kt
DX '7r lt
EX '7r mt
Px '7r nt
X ·7r t
·
Estymacji takiego modelu można dokonać za pomocą programu MLL5A (Maxim um Likelihood Latent Structure Analysis) (Clogg 1977). Parametrami pozwalającymi nam określić dopasowanie takiego modelu do zmiennych wskaźniko wych są liczba stopni swobody oraz statystyka chi-kwadrat przy standardowo określonym poziomie istotności. Statystyka chi-kwadrat jest "wrażliwa" na liczbę pól w tabeli, dla których liczebności teoretyczne wynoszą zero. Przy takich wielowymiarowych tabelach, jakie są podstawą analizy struktur ukrytych to bardzo istotna wada. Tabela będąca podstawą analizy w prezentowanym przykładzie ma 64 pola (2.2.2·2.2·2). Lepszą statystyką dla takich modeli będzie iloraz wiarygodności L 2 : 2
L = 2
L
Fijklmn
in
(Fijklrrm/ Fijklmn) .
ijklmn
Dodatkowązaletą tej statystyki jest możliwość jej dzielenia. Oznacza to, że gdy raz ustalimy liczbę klas ukrytych (T) zmiennej (X), to możemy dokonywać efektywnego testowania hipotez dotyczącychwartości prawdopodobieństwklas ukrytych i prawdopodobieństw warunkowych. Parametry modelu 3-klasowego dla analizowanego przykładu (L 2 = 30,19; df = 48) wskazują, że jest to model, który możemy zaakceptować (określa to stosunek liczby stopni swobody do ilorazu wiarygodności, przy standardowym poziomie istotności).
Mamy zatem trzy typy postaw wobec legalizacji aborcji: akceptującą legalizację wszystkich III II
powodów aborcji, powodu legalizacji aborcji, akceptującą legalizację aborcji z powodów "etyczno-medycznych" a nie akceptującą legalizacji z powodów "społecznych".
nie
akceptującą żadnego
Prawdopodobieństwa klas ukrytych są odpowiednikami proporcji populacji w stosunku do każdego zidentyfikowanego przez model typu postawy. Suma tych prawdopodobieństw musi wynosić jeden, aby podział na typy postaw (klasy ukryte) spełniał warunek rozłączności i wyczerpywalności. Prawdopodobieństwa klas ukrytych są nośnikami dwóch istotnych informacji: ile mamy klas oraz jaka proporcja populacji jest przypisana do każdej klasy.
Prawdopodobierlstwa warunkowe pozwalają nam scharakteryzowaćwyróżnione typy ze względu na zmienne wskaźnikowe, są miarą stopnia związku pomiędzy każdą zmienną wskaźnikową i każdą klasą ukrytą.
aprobujące podstawy "etyczno-medyczne" legalizacji aborcji i nie aprobujące podstaw "społecznych" stanowią 37,25% populacji (klasa II). Osoby przeciwne legalizacji aborcji z jakichkolwiek powodów, to 17,31% populacji (klasa III).
Prawdopodobieństwa klas ukrytych i prawdopodobieństwa warunkowe dla modelu 3-klasowego opisującego postawy Polaków wobec legalizacji aborcji, opartego na zmiennych z PGSS z roku 1999 roku zawiera tabela D.3.
Zatem eksploracyjna analiza struktur ukrytych dała nam możliwość takiej analizy postaw wobec legalizacji podstaw aborcji, która pozwoliła na wyodrębnie nie typów postaw, określenie ich liczby oraz ich wewnętrzną charakterystykę w odniesieniu do zmiennych wskaźnikowych.
Tabela 0.3.
Prawdopodobieństwa klas ukrytych i prawdopodobieństwa warunkowe dla modelu 3-klasowego opisującego postawy Polaków wobec legalizacji aborcji
II
III
1,000 1,000 1,000 0,982 0,926 0,834
0,968 0,916 0,813 0,236 0,163 0,056
0,142 0,062 0,026 0,000 0,007 0,000
Często analiza struktur ukrytych jest tylko pierwszym krokiem w procesie analizy danego zjawiska. Po zdefiniowaniu klas ukrytych i przypisaniu respondentów do odpowiedniej klasy chcielibyśmy, aby zmienna ukryta stanowiła jedną z charakterystyk badanej zbiorowości. Powinniśmy sobie jednak zdawać sprawę z pewnych jej ograniczeń. Dotyczą one procesu przyporządkowywaniarespondentów do odpowiednich klas ukrytych. Oczywiste jest, że respondenci, którzy dla zmiennych wskaźnikowych udzielili takich samych odpowiedzi znajdą się w tej samej klasie ukrytej. Przyporządkowanie to opiera się na porównaniach miejsca (pola wewnętrznego) w wielowymiarowej tabeli kontyngencji utworzonej ze wszystkich zmiennych wskaźnikowych, jakie zajmują w niej poszczególni respondenci.
0,4544
0,3725
0,1731
Prawdopodobieństwotego, że
Klasa
Wskaźnik
A. zagrożenie zdrowia kobiety B. poważne uszkodzenie płodu C. ciąża po gwałcie D. zbyt biedna E. nie chce więcej dzieci F. samotna kobieta Prawdopodobieństwa klas
ukrytych
Prawdopodobieństwa warunkowe wskazują na
to, że wcześniejsze określenie typów postaw wobec legalizacji aborcji było prawidłowe. Respondenci z klasy I aprobują legalizację wszystkich powodów aborcji, w tym z powodów "etyczno-medycznych" bez zastrzeżeń (dla zmiennych A, B i C ~ 1,000) a z powodów "społecznych" prawie bez zastrzeżeń (zmienna D prawie wszyscy ~ 0,982; E częściej niż 9 na 10 osób ~ 0,926; F częściej niż 8 na 10 osób ~ 0,834). W klasie III respondenci nie aprobują żadnych podstaw legalizacji aborcji, z lekkim wahaniem przy zagrożeniu zdrowia kobiety (A więcej niż 1 osoba na 10 skłonna by była ten powód zaakceptować ~ 0,142). W klasie II aprobowane są w wysokim stopniu "etyczno-medyczne" podstawy aborcji (A więcej niż 19 na 20 osób ~ 0,968; B więcej niż 9 na 10 osób ~ 0,916; C więcej niż 8 na 10 osób ~ 0,813) i w niskim stopniu podstawy "społeczne" (D, 1 na 5 osób ~ 0,205; E więcej niż 1 na 10 osób ~ 0,163; F, 1 na 20 osób ~ 0,056). Nie sprawdziły się natomiast nasze wcześniejsze przewidywania co do liczebnoposzczególnych klas. Najliczniejszą okazała się proporcja osób aprobujących legalizację aborcji ze wszystkich powodów ~ klasa I, 45,44% populacji. Osoby ści
respondent w polu ijk (powracam do wcześniej szego zapisu dla trzech zmiennych wskaźnikowych, który z łatwością można rozszerzyć dla potrzeb konkretnej analizy) znajdzie się w kategorii t zmiennej ukrytej obliczymy ze wzoru: ABCX ABCX ""' ABCX 1rijkt = 1rijkt / ~ 1rijkt . t
Zatem przypisanie respondenta do danej klasy ukrytej ma charakter probabilistyczny ~ na podstawie największego prawdopodobieństwa. Z tego wynika, że w procedurze przyporządkowania respondentów do klas ukrytych możemy mieć do czynienia z błędami przyporządkowania. Są dwie miary pozwalające nam oszacować błąd przyporządkowaniaposzczególnych respondentów do klas ukrytych. Pierwsza miara to procent prawidłowo przypisanych:
gdzie 1r~:t~X jest największym prawdopodobieństwemdla danego pola tabeli a Pijk jest proporcją tego pola w populacji.
Drugą miarą błędu przypisania jest .\ Goodmana i Kruskala, dla której B z to błąd przypisania wszystkich respondentów do najliczniejszej klasy ukrytej, natomiast BN to błąd wynikający z użycia największego prawdopodobieństwa dla każdego pola tabeli. Zatem:
Bz
Lambda jest lający
nam
określić,
relacji
ograniczeń są
Innym typem
dopodobieństw warunkowych. Możemy sprawdza.ć hipotezę, że
X a
wspólną
ABC. Może być ona użyta jako dodatek do L 2 , pozwa-
na ile wprowadzenie zmiennej ukrytej pozwala na lepsze zmiennymi wskaźnikowymi.
pomiędzy
Prowadząc eksploracyjną analizę
struktur ukrytych nie zakładamy żadnych na prawdopodobieństwa warunkowe ani na prawdopodobieństwa klas ukrytych, dlatego model klas ukrytych jest w tym przypadku modelem bez ograniczeń. Może się jednak tak zdarzyć, że mamy określone hipotezy co do wartości prawdopodobieństw klas ukrytych (czyli rozkładu typów postaw w populacji), jak również co do wartości prawdopodobieństw warunkowych (czyli charakterystyk typów postaw). Przeprowadzenie takiej analizy wymaga założenia określonych ograniczeń na pewne prawdopodobieństwa.Analiza modelu klas ukrytych z ograniczeniami jest analizą konfirmacyjną. Ograniczenia można zakładać na oba typy prawdopodobieństw. ograniczeń
charakter. Mogą to być ograniczenia przez prawdopodobieństwo, którego dotyczą, bądź mogą to być ograniczenia dotyczące przyjmowania takiej samej wartości przez wskazane prawdopodobieństwa. Jeżeli restrykcje dotyczą prawdopodobieństw warunkowych, to możemy np. sprawdzać hipotezę, że respondenci klasy I w przykładzie o aborcji dla wszystkich zmiennych wskaźniko wych powinni mieć prawdopodobieństwowarunkowe równe 1,0. W naszym modelu bez ograniczeń jest to prawdą dla zmiennych A, B i C odnoszących się do "medyczno-etycznych" powodów aborcji, ale już nie jest prawdą w przypadku zmiennych D, E i F .dotyczących "społecznych" powodów aborcji. Moglibyśmy nałożyć na te ostatnie zmienne ograniczenia przyjmowania wartości 1,0 prawdopodobieństw warunkowych i sprawdzić, czy model nadal jest akceptowalny ze względu na dopasowanie struktury ukrytej do zmiennych wskaźnikowych. Te ograniczenia byłyby ograniczeniami dotyczącymi przyjmowania przez prawdopodobieństwa warunkowe określonych z góry wartości. Najbardziej użyteczne
ograniczenia
dotyczące równości określonych praw-
x
t
7f , ,
miarą bliskości związku między zmienną ukrytą
zmienną wskaźnikową wyjaśnienie
= 1-
są one wówczas, gdy w sprawdzanej hipotezie zakładamy, że prawdopodobień stwa warunkowe przyjmują wartość 1,0 (tak jak w propozycji powyżej), bądź 0,0 (takie ograniczenia moglibyśmy spróbować nałożyć w stosunku do prawdopodobieństw warunkowych respondentów klasy III).
np. respondenci klasy II z jednakowym prawdopodobieństwembędą akceptowali legalizację aborcji z powodu zagrożenia zdrowia kobiety, co z powodu poważnego uszkodzenia płodu. Ograniczenia co do równej wartości prawdopodobieństw warunkowych można zakładać wewnątrz klas ukrytych (tak jak to proponowałam wyżej) lub między klasami ukrytymi (np. respondenci klasy I i II będą mieli takie samo prawdopodobieństwo akceptowania legalizacji aborcji z powodu zagrożenia zdrowia kobiety). Ograniczenia dotyczące wskazanej wartości, jaką powinny przyjmować prawdojak i ograniczenia dotyczące równej wartości mogą być nakładane jednocześnie nawet na wszystkie występujące w modelu prawdopodobieństwa warunkowe.
podobieństwa warunkowe,
W modelu będącym naszym przykładem nie udało się nałożyć ograniczeń dotyczących przyjmowania "czystych" wartości prawdopodobieństw warunkowych w skrajnych klasach (1,0 - dla klasy I oraz 0,0 - dla klasy III). Parametry takiego modelu nakazywały jego odrzucenie. Udało się natomiast nałożyć ograniczenia dotyczące równości wartości prawdopodobieństwwarunkowych na pięć z sześciu zmiennych wskaźnikowych w klasach I i III. Model taki przedstawiony jest w tabeli D.4.
Zakładane ograniczenia mogą mieć różny
dotyczące
przyjmowania
określonej wartości
Tabela D.4.
Prawdopodobieństwa klas ukrytych i prawdopodobieństwa warunkowe dla modelu 3-klasowego opisującego postawy Polaków wobec legalizacji aborcji
Klasa Wskaźnik
I
II
III
A. zagrożenie zdrowia kobiety B. poważne uszkodzenie płodu C. ciąża po gwałcie D. zbyt biedna E. nie chce więcej dzieci F. samotna kobieta
0,999' 0,999' 0,999' 0,999' 0,999' 0,844
0,965 0,927 0,828 0,273 0,171 0,128
0,142 0,014' 0,014• 0,014' 0,014' 0,014'
Prawdopodobieństwaklas
0,4099
0,4203
0,1698
ukrytych
W modelu tym gwiazdką oznaczono prawdopodobieństwawarunkowe, na które zostały nałożone ograniczenia. Model ten jest akceptowalny (L 2 = 86,413; df = 51), ale ze względu na dużo gorsze parametry (na 1 stopiell swobody przypada dużo większa, choć jeszcze akceptowalna, proporcja ilorazu wiarygodności niż w modelu bez ograniczeń) oraz na znaczne przesunięcie w liczebnościach klas ukrytych -- od postaw przeciwstawnych do postaw pośrednich - należy uznać model bez ograniczeń za lepiej dopasowany do zmiennych wskaźniko wych, niż model z ograniczeniami.
wych. W drugim zaś - modelu homogenicznym, możemy mieć do czynienia nie tylko z jednakową liczbą klas i ich wewnętrzną charakterystyką, ale z równością odpowiednich prawdopodobieństw warunkowych i prawdopodobieństw klas ukrytych. Równoczesna analiza struktur ukrytych przebiega w następujących etapach: III
ustalenie liczby klas ukrytych dla
każdej
z grup;
jeśli
liczba klas jest taka sama, porównujemy strukturę (prawdopodobień stwa warunkowe) tych klas pomiędzy grupami; jeśli struktura klas jest taka sama, sprawdzamy, czy istnieją różnice w rozkładzie populacji (prawdopodobieństwa klas ukrytych) w poszczególnych klasach obu grup.
Ograniczenia można nakładać również na prawdopodobieństwaklas ukrytych, zarówno te dotyczące konkretnej wartości takiego prawdopodobieństwa, jak i te dotyczące równości prawdopodobieństw. Ograniczenia wskazujące konkretną wartość prawdopodobieństw klas ukrytych odnoszą się do testowania hipotez sprawdzających zasięg występowania badanych typów postaw w populacji. Ograniczenia dotyczące równości prawdopodobiel'lstw pozwalają nam sprawdzić hipotezy o równoliczności badanych typów postaw, np. "czy może my uznać, że klasa I i II obejmują taką samą cześć populacji" . Ten ostatni typ ograniczeń częściej jest stosowany w modelach dotyczących porównań między populacjami. Omawiając takie modele powrócimy również do tych ograniczeń.
B i G, które X. Przez G oznaczymy zmienną określającą przynależność do odrębnych, badanych grup, których może być s = 1, ... , S. Zatem dla każdego s mamy odrębną wielowymiarowątabelę kontyngencji zmiennych wskaźnikowych.
Porównywanie struktur ukrytych między grupami
Wszystkie prawdopodobieństwa w równoczesnym modelu analizy struktur ukrytych są liczone w oparciu o całkowitą liczbę pomiarów wszystkich zmiennych wskaźnikowych we wszystkich grupach, stąd:
Załóżmy, że w dalszym ciągu mamy trzy zmienne wskaźnikowe A,
pozwalają
nam
zdefiniować zmienną ukrytą
Do tej pory przedmiotem naszej analizy było oszacowanie modelu struktur ukrytych na podstawie danych pochodzących z jednej badanej populacji. Teraz analizę tę możemy poszerzyć do dwóch i więcej grup populacji. Narzędziem umożliwiającymtakie porównania jest równoczesna analiza struk-
tur ukrytych. Z jej
pomocą możemy badać,
czy w badanych populacjach występują takie same typy postaw w odniesieniu do interesującego nas problemu. Jeśli tak, to na ile charakterystyki tych typów są do siebie podobne, na ile poszczególne typy występują z taką samą częstością w badanych populacjach. Analiza ta może być stosowana nie tylko do różnych populacji, ale również do tej samej populacji w różnych momentach czasowych.
Wynik analizy porównawczej struktur ukrytych w dwóch populacjach (w dalszym ciągu wywodu będziemy się odwoływać do dwóch populacji ale należy pamiętać, że analizę tę można rozszerzyć na więcej grup - populacji) może zawierać się między całkowitą heterogenicznością a całkowitą homogenicznością powstałego na podstawie ich danych modelu. W pierwszym przypadku -- modelu heterogenicznym, różnice mogą dotyczyć zarówno liczby klas ukrytych, jak i ich wewnętrznej charakterystyki w odniesieniu do zmiennych wskaźniko-
e 7r s
ABce
= ~ 7rijks
'
ijk
e
gdzie L7r s
= 1,0.
s
Jeżeli
w
każdej
grupie s istnieje t-klasowa struktura ukryta, to prawdopodotego, że jednostka analizy z grupy s znajdzie się w określonym polu tabeli U, j, k) jest równe sumie po t prawdopodobieństw warunkowych dla (i, j, k, t) zmiennych wskaźnikowych i zmiennej ukrytej: bieństwo
7r~~sce = ~7r~~s:ex. t
Zatem ogólny model równoczesnej analizy struktur ukrytych jako: Ascex 7r'ij kst
=
Aex 7rist
.
Sex cex ex 7r jst . 7r kst . 7r st .
możemy zapisać
Dla jednostki analizy z grupy s, prawdopodobieństwo znalezienia się w określo nym polu tabeli (i, j, k, t) wielowymiarowej zmiennych wskaźnikowychi zmiennej ukrytej jest równe iloczynowi prawdopodobieństw warunkowych dla każdej zmiennej wskaźnikowej z klasy t i grupy s oraz prawdopodobieństwaklas ukrytych dla danej klasy t w grupie s. Liczba parametrów takiego modelu, którą bez żadnych ograniczeń nakładanych na model, musimy oszacować, wynosi:
S(T - 1)
+ [ST(I -
1)
+ ST(J -
1)
+ ST(K -
1)].
W analizie struktur ukrytych chcieliśmy oszacować prawdopodobieństwotego, że jednostka analizy znajdzie się w klasie t, natomiast w równoczesnej analizie struktur ukrytych chcemy oszacować prawdopodobieństwo tego, że jednostka z grupy s znajdzie się w klasie t. Jeszcze większe różnice między tymi dwoma modelami dotyczą szacowania prawdopodo bieństw warunkowych. W analizie struktur ukrytych musieliśmy oszacować (I - l)T oddzielnych prawdopodobieństw zmiennej wskaźnikowej A. Teraz taki.ch prawdopodobieństw dla zmiennej A musimy oszacować (I -l)ST, ponieważ prawdopodobieństwoprzynależ ności do kategorii i zmiennej A może być różne dla jednostek analizy z klasy t w każdej badanej grupie. Może się więc okazać, że charakterystyka danej klasy ukrytej w odniesieniu do zmiennych wskaźnikowych jest różna dla każdej z grup. Równoczesną analizę struktur ukrytych rozpoczynamy od modelu heteroge-
nicznego. Chcemy ustalić, jaka jest struktura klas ukrytych i ich wewnętrzna charakterystyka dla każdej badanej grupy. Prezentując taki model powrócimy do przykładu analizy postaw wobec aprobowanych podstaw legalizacji aborcji przez respondentów PGSS. Poprzedni model przedstawiał postawy respondentów PGSS z roku 1999 w tej kwestii. Ponieważ pytania dotyczące aborcji pojawiają się w każdej edycji PGSS, jako drugą grupę dla prezentacji modelu równoczesnego wybierzemy respondentów PGSS z roku 1995. Prawdopodobieństwa aprobaty legalności aborcji dla danych z lat 1995 i 1999 przedstawia tabela D.5.
L 2 wskazuje (74,598 dla df = 95), że 3-klasowy model dla danych z roku 1999 i 1995 jest odpowiedni przy standardowym poziomie istotności. Oznacza to, że nie zmieniła się struktura postaw w takim sensie, iż w dalszym ciągu mamy do czynienia z trzema typami postaw wobec legalizacji aborcji:
Wartość
III
iii
III
klasa I, której respondenci aprobują legalizację wszystkich powodów aborcji; klasa II z aprobatą "medyczno-etycznych" podstaw legalizacji aborcji i dezaprobatą "społecznych" podstaw; klasa III, której respondenci nie aprobują żadnych przyczyn legalizacji aborcji.
Tabela 0.5.
Prawdopodobieństwa klas ukrytych i prawdopodobieństwa warunkowe dla modelu 3-klasowego opisującego postawy Polaków wobec legalizacji aborcji
Klasa I
Wskaźnik
Klasa III
1995
1999
1995
1999
1995
1999
1,000 0,996 0,999 0,994 0,957 0,844
1,000 1,000 1,000 0,987 0,926 0,834
0,949 0,940 0,831 0,259 0,138 0,056
0,968 0,916 0,813 0,205 0,163 0,056
0,150 0,062 0,063 0,000 0,000 0,000
0,142 0,062 0,026 0,000 0,007 0,000
ukrytych 0,5372 0,4554 0,3227 0,372
0,14
0,1729
A. zagrożenie zdrowia kobiety B. poważne uszkodzenie płodu C. ciąża po gwałcie D. zbyt biedna E. nie chce więcej dzieci F. samotna kobieta Prawdopodobieństwa klas
Klasa II
Prawdopodobieństwa warunkowe wskazują, że taką charakterystykę typów postaw możemy zachować dla obu momentów czasowych (grup analizy), choć widoczne są drobne różnice w wartościach poszczególnych odpowiednich prawdopodobieństw warunkowych w obu grupach. Jednak najbardziej istotną różnicą jest przesunięcie w rozkładzie poszczególnych typów w populacji w badanych latach.
Udział respondentów klasy I w roku 1999 spadł do 45,54% z 53,72% w roku 1995. Grupa osób akceptująca legalizację aborcji bez względu na jej powód znacznie się zmniejszyła. Zwiększyła się liczebność klas II i III, odpowiednio z 32,27% do 37,2% oraz z 14% do 17,29%. Wzrosła zatem akceptacja do legalnego ograniczania aborcji w ogóle, bądź z powodów społecznych. Możliwość odpowiedzi na pytanie, jak bardzo różnice te są istotne, daje nam analiza homogeniczności modelu równoczesnego.
Struktura ukryta jest częściowo homogeniczna, jeżeli możemy nałożyć ograniczenia równości wartości na pewne prawdopodobieństwawarunkowe i prawdopodobieństwa klas ukrytych. Jeśli ograniczenia takie można nałożyć na wszystkie prawdopodobieństwa w modelu, to mamy do czynienia z całkowitą homogenicznością·
Model równoczesnej analizy struktur ukrytych dla danych z lat 1995 i 1999 dotyczących aprobaty dla legalizacji aborcji w Polsce jest modelem częściowo homogenicznym. Możliwe okazało się nałożenie ograniczeń na 28 z 36 prawdopodobieństw warunkowych. Nie można było nałożyć żadnych ograniczeń na prawdopodobieństwaklas ukrytych. Częściowo homogeniczny model równoczesny aprobaty podstaw aborcji zamieszczony został w tabeli D.6.
Tabela D.6.
Prawdopodobieństwa klas ukrytych i prawdopodobieństwa warunkowe dla modelu 3-klasowego opisującego postawy Polaków wobec legalizacji aborcji
Klasa I
Wskaźnik
A. zagrożenie zdrowia kobiety B. poważne uszkodzenie płodu C. ciąża po gwałcie D. zbyt biedna E. nie chce więcej dzieci F. samotna kobieta Prawdopodobieństwa klas
Klasa II
Klasa III
1995
1999
1995
1999
1995
1999
0,999* 0,999* 0,999* 0,991 * 0,958 0,841 *
0,999* 0,999* 0,999* 0,991* 0,927 0,841*
0,957* 0,938 0,831 0,262 0,150* 0,058*
0,957* 0,918 0,813 0,205 0,150* 0,058*
0,147* 0,066* 0,047* 0,001* 0,001* 0,001*
0,147* 0,066* 0,047* 0,001* 0,001* 0,001*
0,14
0,1729
ukrytych 0,5372 0,4554 0,3227 0,372
Różnice w statystykach modelu (L 2 = 88,596 - 74,598 = 13,998 dla liczby stopni swobody df = 104 - 95 = 9, gdzie pierwsza wartość to statystyki mode-
lu częściowo homogenicznego a druga modelu heterogenicznego) wskazują, że zaznaczone gwiazdką ograniczenia są akceptowalne (przyrost ilorazu wiarygodności nie przekracza 3,84 na jeden stopień swobody). Oznacza to, że struktura postaw wobec legalizacji aborcji w Polsce w roku 1999 jest bardzo podobna (ale nie identyczna) do struktury tych postaw w roku 1995. Jedynie postawy respondentów klasy III, tzn. osób nie akceptujących legalizacji aborcji z żadne go powodu możemy uznać za takie same (ograniczenia równości na wszystkich zmiennych wskaźnikowych), z tym że w roku 1999 osób przyjmujących takie postawy było więcej (prawdopodobieństwaklas ukrytych). Prawie nie zmienił się charakter postaw osób aprobujących legalizację aborcji ze wszystkich wymienionych powodów (tylko na zmienną wskaźnikową E dotyczącą aprobaty dla legalizacji aborcji w sytuacji, kiedy kobieta zamężna nie chce już mieć wię cej dzieci, nie dało się nałożyć ograniczeń równości - w roku 1995 aprobata dla tego powodu była większa) ale znacznie spadła liczba osób przyjmujących takie postawy. Największe różnice w charakterystyce typu postaw dotyczą respondentów klasy II (tylko na połowę zmiennych wskaźnikowych dało nałożyć się ograniczenia). W roku 1995 w klasie tej był mniejszy odsetek populacji o więk szym poziomie aprobaty dla aborcji, w roku 1999 klasa ta jest liczniejsza, ale poziom aprobaty wśród respondentów do niej należących się obniżył. Analiza struktur ukrytych, czy to za pomocą modelu prostego, czy równoczesnego pozwoliła nam dotrzeć do istoty postaw wobec legalizacji aborcji, pozwoliła nam uchwycić je w sposób kompleksowy.
Budowanie modeli
zależności
Określenie zmiennej ukrytej (jej charakteru i rozkładu) jest na ogół pierwszym krokiem analizy interesującego nas problemu badawczego. Teraz chcielibyśmy sprawdzić związki zmiennej ukrytej z innymi zmiennymi, czyli zbudować model zależności między interesującymi nas zmiennymi, włączając w to zmienną "odkrytą"· Możliwość estymacji parametrów takiego modelu została zapoczątko wana wraz z zapisaniem formalnego modelu analizy struktur ukrytych w formie modelu logarytmiczno-liniowego ze zmiennymi ukrytymi. Dla trzech zmiennych wskaźnikowych A, B i e model ten przybrałby formę:
ln(f"' ]"kt) = fi
+ AA + A B + ACk + AAX + \l3X + Akt ,ex + ,x 2]
,t
A]t
At·
Do tak zapisanego modelu logarytmiczno-liniowego możemy teraz włączać dodatkowe zmienne, a estymatory parametrów lambda pozwolą nam ocenić siłę związku między zmiennymi. Taki możliwie naj prostszy model przedstawiony jest na rysunku D.2.
D
~/
A
X-B
E
/~
C
Rysunek D.2.
Zmienna X, to zmienna ukryta, odnosząca się do zmiennych wskaźnikowych A, B i e, natomiast zmienne D i E, to zmienne zewnętrzne, wprowadzone do modelu struktur ukrytych - to również zmienne oparte o rzeczywiste obserwacje pochodzące z badań, tak jak zmienne wskaźnikowe. Model przedstawiony na rysunku w konwencjonalnym zapisie przyjętym dla modeli logarytmiczno-liniowych zapisalibyśmy jako {DEX, AX, BX, eX}. Do takiego modelu możemy włączać kolejne zmienne, budując cały system zależności badanego przez nas problemu. Taki całościowy model będzie modelem ścieżkowym. Estymacjajego parametrów pozwoli nam na ocenę związków między analizowanymi zmiennymi - obserwowalnymi i ukrytymi. Model taki może zawierać więcej niż jedną zmienną ukrytą. Wprowadzenie czytelnika w tajniki takiego modelowania, to historia na dużo dłuższą opowieść. IllllilIl!II
W podsumowaniu wypada wspomnieć o pewnych niedogodnościach stosowania tego typu analizy. Najpoważniejszą z nich są ograniczenia wynikające ze
zbyt małej liczebności próby i związanej z tym zbyt dużej liczby pustych pól w tabelach częściowych. Proponowano wiele rozwiązal1 tego problemu, m.in. modyfikację standardowych statystyk chi-kwadrat, czy dodawanie małej stałej do wszystkich pól tabel. Najlepszym źródłem wiedzy, jak radzić sobie w takich sytuacjach są prace Agrestiego (1990). Kolejnym, związanym z tym problemem, są "braki odpowiedzi". Zdarza się, że znacząca część respondentów nie zostaje włączona do analizy, ponieważ nie udzieliła odpowiedzi na jedno lub dwa pytania wchodzące w zakres budowanego modelu. Ze względu na problem małych częstości lepiej jednak by było, gdyby nawet częściowa informacja od respondentów była włączona do modelu. Podjęte zostały więc próby stworzenia takiej procedury estymacji parametrów modeli logarytmiczno-liniowych, które wykorzystywałybywszelką dostępną informację (Haberman 1988; Little i Rubin 1987). Zastosowanie omawianego typu analizy wymaga losowego doboru próby, lub przy doborze warstwowym - losowego doboru na poziomie warstw, ze wzglę du na używanie do oceny efektów estymacji standardowych statystyk opartych na ilorazie wiarygodności. Coraz częściej jednak stosuje się bardziej skomplikowane metody doboru próby, co będzie wymagało stworzenia praktycznych procedur estymacji uwzględniających to. Jest to obiektem naj nowszych prac prowadzonych nad tym sposobem analizy danych. Innym jeszcze problemem rozwiązywanym aktualnie przez metodologów zajmujących się modelami logarytmiczno-liniowymi ze zmiennymi ukrytymi jest kwestia włączenia do jednego modelu zmiennych mierzonych w różnych skalach. Obecnie jest to oczywiście możliwe, z takim zastrzeżeniem, że w trakcie analizy wszystkie zmienne są traktowane jako zmienne nominalne. Chodzi o to, by w modelu możliwe było rozróżnienie skali ich pomiaru, co wzmocniłoby moż liwości eksplanacyjne budowanych modeli.
Zamiast
ćwiczeń. Projekt
analityczny od kuchni
W socjologicznych analizach społeczel1stwa, w okresie transformacji, badanie postaw społecznych wobec dokonujących się zmian staje się ich ważnym elementem. Postawy te stają się istotną przesłanką determinującą przebieg zmian w poszczególnych sferach życia. Same też ulegają przeobrażeniom w zmieniaj ącej się rzeczywistości społecznej. Myślę
tu o postawach egalitarnych, które, jak wynika z dotychczasowych badal1, należą do dominujących postaw w naszej rzeczywistości. W związku z tym powstaje kilka pytal1: czy postawy egalitarne są przeszkodą we wprowadzaniu nowego ładu, w tym zwłaszcza ekonomicznego? Jak bardzo one faktycznie dominują? Czy są jakieś wskaźniki położenia społeczno-ekonomicznego,które determinują deklarowany egalitaryzm? Badanie postaw społecznych jest materią wielce delikatną i trudno poddającą się jakimkolwiek obiektywnym ogólnie akceptowalnym miarom, więc przedstawiony przeze mnie w tym tekście sposób analizy i próba odpowiedzi na postawione wyżej pytania jest dobrym, szkolnym przykładem na połączenie języka teorii i języka badal1 empirycznych. Zaletą tego podejścia jest właśnie fakt, że stwarza ono możliwości zmierzenia tego, co w zasadzie jest "niemierzalne". Jak już wcześniej wspomniałam, postaw nie da się badać wprost - analizując je, zawsze musimy dokonać wyboru jakichś wskaźników, które będą je według nas najlepiej identyfikować. Badając postawy na skali od egalitarnych do elitarnych, można znaleźć wiele takich zagadniell, w odniesieniu do których prezentowane poglądy będą wyznaczały tak określone postawy. Jednym z takich zagadnieil jest postrzeganie roli rządu w zakresie jego zadal1 socjalnych. Ogólnie można powiedzieć, że jeżeli ktoś skłonny jest ograniczać rolę rządu w jego funkcjach socjalnych, świadczy to o postawie liberalnej ekonomicznie, a więc bardziej elitarnej społecznie. Z kolei im bardziej ktoś jest skłonny przypisywać rządowi uprawnienia w zakresie zadal1 socjalnych, tym bardziej przesuwa się na skali postaw w kierunku postaw egalitarnych. Traktując poglądy na temat poszczególnych zadal1 socjalnych rządu jako wyznaczniki postaw wobec tych zadal1 rządu w ogóle, wyspecyfikuję najpierw, używając modelu analizy struktur ukrytych (Clogg i Goodman 1984; McCutcheon 1987), skalę tych poglądów oraz ich rozkład w populacji. Następnie poszukam takich wyznaczników położe nia ekonomicznego i społecznego, które mogą oddziaływać na badane postawy i ustalę siłę tych zależności, używając ścieżkowego modelu logarytmiczno-liniowego ze zmiennymi ukrytymi (Hagenaars 1993; Heinen 1993; Vermunt 1996). Dane, które posłużyły do budowy powyższych modeli, pochodzą z Polskiego Generalnego Sondażu Społecznego z roku 1995 (Cichomski i Morawski 1995).
Sondaż
ten prowadzony jest na reprezentatywnej próbie dorosłej ludności Polski (w wieku powyżej 18 lat). Na wszystkie interesujące mnie pytania zawarte w końcowym modelu odpowiedziało 1586 osób. Modele prezentowane w tekście analizowane będą przy użyciu programu LEM (Vermunt 1993). Pierwsza
cześć
analizy ma na celu
identyfikację
struktury zmiennej ukrytej
Pierwszy z nich dotyczył liczby kategorii odpowiedzi w trzech pytaniach, które potraktowałamjako wskaźnikowe. Najprostsze analizy struktur ukrytych mogą być prowadzone na dychotomicznych zmiennych wskaźnikowych. Możliwa jest estymacja modeli opartych o zmienne o wielu kategoriach (McCutcheon 1994), ale dla przejrzystości modelu lepiej jest, gdy tych kategorii jest jak najmniej.
(X) obrazującej postawy respondentów wobec socjalnych zadań rządu. Struk-
W pytaniach
tury tej poszukuję przy zastosowaniu podstawowego modelu analizy struktur ukrytych w oparciu o trzy zmienne wskaźnikowe (A, B, C). Model ten, przy klasycznej parametryzacji Lazarsfelda, można zapisać w postaci (w notacji stosowanej w przykładzie analitycznym pominę subskrypty dotyczące wymiaru analizowanych zmiennych - ich forma podręcznikowa została przedstawiona wcześniej w dodatku):
sześć:
1f XABC
= 1fX· 1f ABC/X = 1fX· 1f A/X' 1f B/X'
1f
c /x ,
lub przy parametryzacji logarytmiczno-liniowej Habermana jako:
1. zdecydowanie
2. 3. 4. 5. 6.
Odpowiedzi na poniżej przedstawione pytania będą zmiennymi wskaźnikowy mi tego modelu. Respondenci PGSS zostali zapytani o to, w jakim stopniu zgadzają się (lub nie) z następującymi stwierdzeniami: Obowiązkiem rządu
powinno
być
zmniejszenie
różnic pomiędzy
wysokimi
i niskimi dochodami. B. Rząd powinien zapewnić pracę każdemu, kto chce pracować. C. Rząd powinien zapewnić każdemu podstawowe minimum dochodów. Wstępny
model
przybrał więc znaną postać, przedstawioną na
/
rysunku D.3.
A
X-B
~C
Rysunek
się
socjalnych
zadań rządu
kategorii odpowiedzi
D.3.
W trakcie poszukiwania odpowiednio dopasowanego wzorca modelu klas ukrytych do zmiennych wskaźnikowych pojawiły się dwa problemy - typowe dla tego rodzaju analiz, które musiały znaleźć rozwiązanie w trakcie estymacji.
iII !II
było
zgadzam,
zgadzam się, ani się zgadzam, ani się nie zgadzam, nie zgadzam się, zdecydowanie nie zgadzam się, trudno powiedzieć.
Początkowo zakładałam, że tę kategoryzację da się ograniczyć do Ił
A.
dotyczących
trzech:
tych, którzy zgadzają się z prezentowanymi stwierdzeniami, tych którzy nie są zdecydowani co o tym sądzić, tych którzy się nie zgadzają,
jednakże statystyki modelu, oparte na ilorazie wiarygodności że możliwe
L2 wskazywały,
do zaakceptowania jest ograniczenie kategorii odpowiedzi tylko do
czterech: 1.
zgadzających się
zdecydowanie,
2. zgadzających się, 3. niezdecydowanych, 4. nie zgadzających się w
różnym
stopniu.
Skala odpowiedzi na pytania wskaźnikowe jest więc asymetryczna, co rodzi przypuszczenia, że poszukiwana skala postaw wobec socjalnych zadań rządu może być również asymetryczna. Drugim problemem, jaki pojawił się przy estymacji tego modelu był fakt niejego dopasowania w oparciu tylko o wymienione zmienne wskaźniko we. W PGSS sekwencja pytań dotyczących socjalnych zadań rządu była poprzedzona pytaniem o to, czy respondent zgadza się lub nie zgadza (z taką samą 6-stopniową skalą odpowiedzi) ze stwierdzeniem, iż "różnice dochodów są w Polsce zbyt duże". Okazało się, że bez włączenia tej zmiennej (D) do modelu, jako zmiennej mającej wpływ tak na teoretyczny ("ukryty") konstrukt możności
identyfikujący postawy respondentów wobec socjalnych zadań rządu
Tabela 0.7.
(X), jak
i na jedną ze zmiennych wskaźnikowych, określającą obowiązki rządu w zakresie zmniejszania różnic pomiędzy wysokimi i niskimi dochodami (A), nie można uzyskać zadowalających statystyk budowanego modelu. Kategoryzacja odpowiedzi zmiennej D została zmieniona w taki sam sposób jak dla zmiennych wskaźnikowych. Wstępny model przedstawia teraz rysunek D.4.
D
Klasa
Wskaźnik
II
III
IV
0,6080 0,2715 0,0712 0,0493
0,0600 0,7472 0,0922 0,1006
0,0000 0,1762 0,6779 0,1458
0,0403 0,1327 0,2146 0,6123
0,9454 0,0388 0,0128 0,0030
0,1462 0,8114 0,0370 0,0054
0,0801 0,3708 0,5491 0,0000
0,0822 0,3370 0,0584 0,5223
0,8355 0,0918 0,0378 0,0349
0,0531 0,8727 0,0365 0,0378
0,0202 0,1442 0,7550 0,0807
0,0863 0,3952 0,0403 0,4782
1. zgadza się zdecydowanie 2. zgadza się 3. niezdecydowany 4. nie zgadza się
0,6813 0,2144 0,0453 0,0590
0,1662 0,6640 0,0773 0,0926
0,1259 0,3634 0,4268 0,0838
0,2013 0,3882 0,1705 0,2400
Prawdopodobieństwa klas
0,4364
0,3914
0,0581
0,1141
A. zmniejszenie
różnic między
dochodami
1. zgadza się zdecydowanie 2. zgadza się 3. niezdecydowany 4. nie zgadza się
·A
~/
B. zapewnienie pracy
X-B
~C
1. 2. 3. 4.
Rysunek 0.4.
zgadza się zdecydowanie zgadza się niezdecydowany nie zgadza się
C. zapewnienie minimalnego dochodu
Po rozwiązaniu tych problemów pozostała końcowa kwestia w tej CZęSCl analizy, a mianowicie ustalenie liczby klas ukrytych w poszukiwanym modelu. Na podstawie statystyk opartych na ilorazie wiarygodności L 2 można stwierdzić, że rozsądną reprezentację danych empirycznych stanowi model 4-klasowy (L 2 = 219,7671; df = 195). Rozkład prawdopodobieństw warunkowych dla zmiennych wskaźnikowych we wszystkich "klasach ukrytych" teoretycznego konstruktu X oraz prawdopodobieństw klas ukrytych został przedstawiony w tabeli D.7.
1. zgadza się zdecydowanie 2. zgadza się 3. niezdecydowany 4. nie zgadza się
D.
W klasie pierwszej (I) znalazły się osoby, które w największym stopniu kładą nacisk na spełnianie przez rząd funkcji socjalnych. Z największym prawdopodobieństwem są one skłonne udzielać odpowiedzi zdecydowanie twierdzącej na wszystkie pytania wskaźnikowe: zakres prawdopodobieństwwarunkowych wynosi tu od 0,608 dla "zmniejszania różnic między dochodami", do 0,9454 dla "zapewnienia pracy wszystkim tego oczekującym". Chociaż rozpiętość ta jest dość znaczna, to zachowany wzorzec udzielania odpowiedzi zdecydowanie twierdzącej w porównaniu do respondentów innych klas pozwala na wyodrębnienie klasy I respondentów, jako tych, którzy przyjmują skrajnie egalitarne postawy. Jak wskazuje prawdopodobieństwo klas ukrytych, wśród badanych jest około 44% takich osób.
różnice
w dochodach
są
zbyt
duże
ukrytych
"oceny różnic między dochodami w Polsce" do 0,8727 dla "zapewnienia przez wszystkim minimalnego dochodu". Wśród badanych znajduje się prawie 40% respondentów klasy II.
rząd
Następna klasa III, najmniej liczna tylko około 6% - to osoby niezdecydowane, nie mające w tych kwestiach zdania. Na skali postaw od skrajnego egalitaryzmu do elitaryzmu ich postawy można by określić jako neutralne. Ich niechęć do zajmowania stanowiska, zwłaszcza skrajnego, potwierdza występowanie zerowych prawdopodobieństw warunkowych dla skrajnych kategorii zmiennych wskaźnikowych A i B. Z największym prawdopodobieństwem udzielają oni odpowiedzi unikających wyboru (trudno powiedzieć lub ani potwierdzających ani zaprzeczających) zakres odpowiednich prawdopodobieństw
Klasa II to również respondenci, którzy uznają konieczność spełniania przez funkcji socjalnych, ale w swoich postawach nie są aż tak kategoryczni, jak respondenci klasy I. Można więc uznać, że prezentują oni również postawy egalitarne, ale nie skrajnie egalitarne. Są to osoby, które z największym prawdopodobieństwem udzielają odpowiedzi twierdzących na wszystkie pytania wskaźnikowe: w zakresie prawdopodobieństw warunkowych od 0,664 dla rząd
v;
11111
'I"
I',
warunkowych wynosi od 0,4268 dla "oceny różnic między dochodami" do 0,755 dla "zapewnienia przez rząd wszystkim minimalnego dochodu" . Klasa IV respondentów, to osoby prezentujące postawy najbardziej elitarne Z największym prawdopodobieństwem są oni skłonni udzielać odpowiedzi przeczących na pytania wskaźnikowe, a więc w największym stopniu nie uważają, aby rząd miał pełnić funkcje socjalne. Zakres prawdopodobieństw warunkowych wynosi od 0,24 dla oceny różnic w dochodach do 0,6223 dla zmniejszania tych różnic przez rząd. W klasie tej zachowana jest prawidłowość, że odpowiedzi przeczących udzielają oni z największym prawdopodobieństwem w porównaniu do respondentów innych klas. Zachwiana natomiast została prawidłowość, że takich odpowiedzi udzielają oni również z największym prawdopodobiellstwem w swojej klasie. W odniesieniu do pytania o ocenę rozpiętości dochodów w Polsce są oni bardziej skłonni zgodzić się, że różnice te są za duże, niż nie zgodzić się z tym twierdzeniem wcale, ale jednocześnie nie uważają, że by likwidacja tych różnic była zadaniem rządu. Ponieważ pytanie o ocenę tych różnic było zmienną uzupełniającąpodstawowy model, można przyjąć, że klasa ta prezentuje jednolite postawy wobec socjalnych zadań rządu. Respondentów klasy IV uważających, że funkcje te powinny być ograniczone jest około 11% wśród badanych. wśród badanych.
Z zaprezentowanych powyżej typów postaw wobec socjalnych zadań rządu wynika, że zdecydowaną przewagę mają respondenci przybierający postawy skrajnie egalitarne i egalitarne, a tylko co dziesiąty badany prezentuje postawy elitarne. Skala tych postaw jest więc wyraźnie asymetryczna. Zastosowanie analizy struktur ukrytych pozwoliło nie tylko na utworzenie zmiennej teoretycznej (ukrytej) w oparciu o zmienne wskaźnikowe, ale dało możliwość zbadania relacji między nimi oraz określenia rozkładu badanych postaw w populacji. Następnie można postawić
pytanie, czy
istnieją
takie
wskaźniki położenia
społeczno-ekonomicznego,które warunkują przyjmowanie
takiej a nie innej postawy? Uzupełnię teraz wyjściowy model o zmienne opisujące takie wskaźniki i zbadam ich oddziaływanie na postawy wobec socjalnych zadań rządu. Postawa wobec danego zjawiska jest kategorią subiektywną, więc jej uwarunkosubiektywnej ocenie własnej sytuacji społecz nej i ekonomicznej każdego z respondentów. Oceny własnej pozycji w strukturze społecznej respondenci dokonywali umieszczając się na skali od 1 (na dole) do 10 (na górze). Skala ta oznacza dziesięć kategorii, jakie może przyjąć zmiennato stanowczo za dużo, jak na zmienną jakościową dla tego typu modeli. Najrozsądniejszym wydawało mi się więc przekategoryzowanie jej poprzez kwartyle. Zmienna ta po zmianie kategoryzacji została włączona do modelu jako wskaźnik wań również będę poszukiwać w
położenia społecznego społecznej
(R) i jest pomiarem tego, w której ćwiartce struktury respondent sam siebie umieszcza.
W zbiorze danych PGSS nie było jednej zmiennej, która mogła by być syntetycznym wskaźnikiem położenia ekonomicznego. Wobec tego na podstawie trzech kolejnych zmiennych wskaźnikowych (E, F, G) została utworzona druga zmienna ukryta (Y), która charakteryzuje ocenę własnej sytuacji materialnej respondenta. Zmienna ta stanowiła wskaźnik położenia ekonomicznego respondenta w ramach modelu. Zmiennymi wskaźnikowymi położenia ekonomicznego były odpowiedzi na następujące pytania: Biorąc pod uwagę swoją sytuację i sytuację Pana rodziny, czy jest Pan zadowolony, czy też niezadowolony ze swojej obecnej sytuacji finansowej? F. Czy w ciągu ostatnich kilku lat Pana sytuacja finansowa poprawiała się, pogarszała, czy też pozostawała taka sama?
E.
G. Czy, ogólnie biorąc, uważa Pan, że w porównaniu z dochodami innych rodzin w Polsce, dochody Pana rodziny są znacznie niższe niż przeciętne, nieco niższe, nieco wyższe, czy znacznie wyższe niż przeciętne? Estymacja prostego modelu klas ukrytych (według takich samych założeń jak w odniesieniu do poprzedniej zmiennej ukrytej) opisującego położenie ekonomiczne respondentów przyniosła rezultat w postaci modelu 3-klasowego, gdzie: II
III
II
respondenci klasy I, to osoby oceniające swoje położenie ekonomiczne jako niekorzystne; respondenci klasy II, to osoby oceniające to położenie jako przeciętne stabilne; respondenci klasy III, to osoby
uważające
je za korzystne.
Model ten został w całości włączony do zmodyfikowanego końcowego modelu ścieżkowego.Tymsamym końcowy, pełny model zawierał dwie zmienne ukryte. Do pełnego modelu zostały włączone jeszcze dwie zmienne niezależne: wiek (T) i poziom wykształcenia (8) respondentów. Obie te zmienne zoperacjonalizowano w postaci trzech kategorii. Jeśli
chodzi o wiek, to respondenci zostali podzieleni na:
naj młodszych, tych którzy w momencie rozpoczęcia transformacji systemowej nie przekroczyli 25 roku życia; .. w średnim wieku, tych którzy w tym czasie mieli między 25 a 40 lat; .. starszych, tych którzy w roku 1989 mieli więcej niż 40 lat.
II
W przypadku fil!
III iIII
wykształcenia kategorie zostały określone następująco:
osoby, które mają mniej niż średnie wykształcenie; osoby ze średnim wykształceniem; osoby, które mają więcej niż średnie wykształcenie.
W rezultacie struktura pełnego modelu ścieżkowego przedstawia się następują co (w konwencjonalnym zapisie przyjmowanym w analizach logarytmiczno-liniowych): R/ST {RST}
interakcja 3-go rzędu wiekiem, wykształceniem i pozycją społeczną;
pomiędzy
Y/RST {RSTY}
interakcja 4-go rzędu wiekiem, wykształceniem, pozycją społeczną i pozycją ekonomiczną;
się,
na ile da
się uprościć (sprowadzić do zależności mniej złożonych)
interakcje a następnie, które z nich można w ogóle wyeliminować bez szkody dla statystycznych parametrów modelu. Jest to mrówcza praca, sprawdzania po kolei, czy da się ograniczyć (czy nie) kolejne kombinacje zmiennych w modelu. O ile model buduje się niejako "od dołu", biorąc pod uwagę to, jak został on zapisany powyżej (najpierw określając zmienne ukryte na podstawie zmiennych wskaźnikowych a potem dołączając kolejne zmienne charakteryzują ce respondentów), to eliminowanie ścieżek nieistotnych dokonuje się "od góry", badając możliwość obniżenia rzędu interakcji kolejnych kombinacji zmiennych. Wielkości określające stopień dopasowania kolejnych modeli, po wyłączeniu z nich sukcesywnie wybranych parametrów przedstawiono w tabeli D.8. W tabeli tej znalazły się tylko te modele, które okazały się być akceptowalne, czyli dla odpowiedniego poziomu istotności, przy pozostającym do przyjęcia przyroście ilorazu wiarygodności na jeden stopień swobody. wyższych rzędów,
pomiędzy
D/RSTY {RSTYD}
interakcja 5-go rzędu wiekiem, wykształceniem,
pomiędzy
pozycją społeczną, pozycją ekonomiczną
i X/RSTYD {RSTYDX}
oceną zróżnicowania
dochodów w Polsce;
interakcja 6-go rzędu wiekiem, wykształceniem,
Tabela 0.8.
dl
Model 1. 2. 3. 4. 5.
z taką strukturą jak opisana powyżej zmiana w stosunku do modelu 1 R/ST {RS, RT} zmiana w stosunku do modelu 2 Y/RST {RY, SY, TY} zmiana w stosunku do modelu 3 D/RSTY {RD, TD, YD} zmiana w stosunku do modelu 4 X/RSTYD {SX, TX, DX, YX}
7893,86 7901,04 7968,00 8233,89 8953,53
329982 329994 330050 330350 331616
pomiędzy
pozycją społeczną, pozycją ekonomiczną,
dochodów w Polsce wobec socjalnych zadań rządu;
oceną zróżnicowania
i A/DX {AX, AD}
B/X {BX} C/X {CX}·
postawą
trzy kolejne wiersze są opisem teoretycznego konstruktu X;
Warunkowy test ilorazu wiarygodności dla modeli 1. i 2. wskazuje, że interakcję 3-go rzędu pomiędzy wiekiem (T), wykształceniem (S) i położeniem społecznym (R) oraz zależność pomiędzy samym wiekiem i wykształceniem można pominąć bez istotnego zakłócenia statystycznej dokładności modelu 2 (L 2 = 7901,04 ~ 7893,86 = 7,18; df = 329994 - 329982 = 12). Różnice między modelem 2. i modelem 3. są również nieistotne
(L 2 = 7968,00+
trzy kolejne wiersze są opisem teoretycznego konstruktu Y.
-7901,04 = 66,96; df = 330050 - 329994 = 56), co pozwala ograniczyć interakcje 4-go i 3-go rzędu ze zmienną ukrytą położenia ekonomicznego do zera.
Jest to model podstawowy, prezentujący postawy respondentów wobec socjalnych zadań rządu oraz wpływ położenia społecznego i ekonomicznego, wieku i poziomu wykształcenia respondentów na te postawy.
Model 4. wskazuje, że możliwe jest pominięcie wszystkich interakcji wyższych rzędów zmiennej wskaźnikowej oceny rozpiętości dochodów w Polsce (D) ze zmiennymi R, T i Y (L 2 = 8233,89-7968,00 = 265,89; df = 330350-330050 = = 300). Co ciekawe, statystycznie nieistotny okazał się również bezpośredni wpływ poziomu wykształceniarespondentów na ich ocenę istniejących w Polsce rozpiętości dochodów.
E/Y {EY}
{FY} G/Y {GY}
F/Y
W trakcie dalszych analiz starałam się stworzyć model dopasowany do danych empirycznych, ale w możliwie "zredukowanej" postaci, tzn. taki, który wyklucza wszystkie statystycznie nieistotne ścieżki. W pierwszej kolejności sprawdza
Wreszcie model 5., zredukowany końcowy model ścieżkowy, pozwala również pominąć wszystkie interakcje wyższego rzędu ze zmienną ukrytą postaw wobec socjalnych zadań rządu (L 2 = 8953,53 - 8233,89 = 719,64; df = 331616 - 330350 = 1266). Interesującym okazał się fakt, że wskaźnik położenia społecznego (R) nie ma bezpośredniegowpływu na postawy respondentów wobec socjalnych zadań rządu. W dalszej części analiz starałam się sprawdzić, czy zależności pomiędzy zmiennymi w modelu dadzą się sprowadzić do zależności liniowych. Okazało się, że tylko na zależność pomiędzy poziomem wykształcenia (S) a położeniem ekonomicznym (Y) respondentów oraz pomiędzy ich położeniem ekonomicznym (Y) i postawami wobec socjalnych zadań rządu (X) da się nałożyć restrykcje liniowości, tzn. zależność między tymi zmiennymi jest liniowa. Przyjęłam wobec tego, że końcowy model zależności pomiędzy rozpatrywanymi zmiennymi pozostaje taki, jak model 5 z tabeli D.8. Jego struktura w formalnym zapisie i graficzna prezentacja zależności zostały zaprezentowane poniżej.
W kategoriach
prawdopodobieństwamodel
ten
można opisać jako:
1rTSRYDXABCEFG = 1rT . 1r S '1r R/ST . 1ry / RST ' '1r D/RSTy'
1r
X/RSTYD'
1r
ABCEFG/XY'
W porównaniu do zwykłych, zmodyfikowanych, modeli ścieżkowych, model ten zawiera dodatkowy komponent opisujący relacje pomiędzy zmiennymi wskaź nikowymi a zmiennymi ukrytymi, w tym przypadku 1rABCEFG/XY. Ta część modelu może być nazwana wyjaśniającą, podczas gdy pozostała jest częścią strukturalną (Hagenaars 1993; Vermunt 1996). W oparciu o relacje między zmiennymi przedstawione na rysunku, model ten może być zapisany w uproszczonej postaci jako: 1rTSRYDXABCEFG
= 1rT
. 1rS . 1r R/ST . 1rD/RTY . 1r X/STDY . 1r A/XD'
. 1rB/X '1r c / x
. 1rE/Y' 1r F/Y '1r G / y '
R/ST {RS, RT} Y/RST {RY, SY, TY} D/RSTY {RD, TD, YD} X/RSTYD {SX, TX, DX, YX} A/DX {AX, AD} B/X {BX}
Stopień wzajemnego oddziaływania na siebie zmiennych z końcowego zmodyfikowanego modelu ścieżkowego obrazują wielkości współczynnikówlogarytmiczno-liniowych (.:\). Te z nich, które dla analizy prezentowanego modelu są najistotniejsze zostały zaprezentowane w tabeli D.9.
e/x {ex}
Analizując
parametry estymacji zawarte w tabeli D.9 odnoszące się do modelu przedstawionego na rysunku D.5 można wysnuć cztery podstawowe wnioski:
E/Y {EY} F/Y {FY} G/Y {GY}
Pierwszy z nich dotyczy wpływu wieku respondenta na jego położenie społeczne i ekonomiczne oraz postawę wobec socjalnych zadań rządu.
Rysunek 0.5.
Respondenci z naj starszej grupy wiekowej są najbardziej skłonni umiejscawiać się w naj niższym kwartylu struktury społecznej (),~T = 0,2609), oni też uważa ją swoje położenie ekonomiczne za najbardziej stabilne (),~l = 0,3551), natomiast respondenci w średnim wieku w najwyższym stopniu nie uważają aby zajmowali miejsca w najwyższym kwartylu struktury społecznej (),!({ = -0,0683) i są najbardziej skłonni oceniać swoje położenie ekonomiczne jako niekorzystne (),i~r = 0,2150). Rozpiętość między dochodami w Polsce za zbyt dużą są najmniej skłonni uznać najmłodsi (),fY = -0,0997) ale to respondenci w średnim wieku są najmniej skłonni przyjmować postawy skrajnie egalitarne w stosunku do socjalnych zadań rządu (),fl = -0,1408). Respondenci najstarsi są najmniej skłonni uznać, że różnice w dochodach nie są za duże (),gT = -0,1718) i oni też są najmniej skłonni do przyjmowania postaw elitar'XT nych (.:\43 = -0,4146).
Tabela 0.9.
Tabela
RS
11 12 13 41 42 43
Tabela
YR
XY
RT
11 12 13 41 42 43
-0,1081 -0,1525 0,2609 0,0596 -0,0683 0,0087
11 12 13
0,6444 -0,0048 -0,6396
Trzeci wniosek odnosi się do wpływu położenia społecznego respondenta na jego postawę wobec socjalnych zadań rządu. W trakcie analiz okazało się, że bezpośredni związek między położeniem społecznym a postawami wobec socjalnych zada!} rządu jest statystycznie nieistotny. Występuje tylko zależność pośrednia, poprzez związek położeniaspołecznego z ekonomicznym oraz położe nia społecznego z oceną zróżnicowania dochodów w Polsce. Im wyższa pozycja społeczna respondenta, tym lepsza jego pozycja ekonomiczna; osoby sytuujące się w naj niższym kwartylu struktury społecznej są najbardziej skłonne uważać swoją sytuację finansową za niekorzystną = 1,1316). Postrzeganie wielkości różnic w dochodach występujących w Polsce jest związane z zajmowaną pozycją społeczną, w taki sposób, że ci, którzy plasują się w dolnej połowie struktury społecznej są bardziej skłonni niż pozostali uważać różnice w dochodach za zdecydowanie zbyt duże (>-RR = 0,0913 i >-R,R = 0,2235). Nie zgadzają się z tym twierdzeniem ci, którzy zajmują miejsca w górnej połowie struktury społecznej (>-,BR = 0,3058 i >-,f.R = 0,2726).
YRST
1,1316 -0,1546 -0,3702 -0,6069
YS
DYRT 0,6645 DR
YT
11 12 13 21 22 23
-0,0948 0,2150 -0,1203 -0,0427 -0,3124 0,3551
(>-ilR
częściowa
11 12 13 14
Tabela
szym (>-~s = 0,5914). Im wyższe wykształcenie, tym lepsze również położenie ekonomiczne respondenta. Na ten związek dało się nawet nałożyć restrykcje liniowości, co świadczy o jego dużej sile. Wielkość parametrów estymacji to potwierdza - najsłabiej wykształceni uważają swoje położenie ekonomiczne za najbardziej niekorzystne (>-r;s = 0,6444). Oni też w największym stopniu są skłonni przyjmować postawy skrajnie egalitarne (>-r;.s = 0,5122).
RST
0,4653 0,0966 -0,5619 -0,2559 -0,3355 0,5914
częściowa
11 12 13 14
Tabela
YD
częściowa
0,0720 -0,5566 -0,1799
częściowa
11 12 13 41 42 43
11 12 13 14 41 42 43 44
0,0913 0,2235 -0,1678 -0,1470 -0,2503 -0,3281 0,3058 0,2726
DT 11 -0,0997
11 12 13 14
1,2239 -0,3417 -0,7677 -0,1145
XS
12 13 41 42 43
0,0108 0,0889 0,1149 0,0570 -0,1718
XYDST
0,4806 -0,0283 -0,4523 -0,3631 -0,2501 0,6132
XD
11 12 13
0,5122 -0,1910 -0,3212
XT
11 12 13 41 42 43
-0,1193 -0,1408 0,2601 0,1937 0,2210 -0,4146
Drugi wniosek sygnalizuje wpływ poziomu wykształcenia respondenta na jego położenie społeczne i ekonomiczne oraz postawę wobec socjalnych zadań rządu. Okazuje się, że im wyższe wykształcenie, tym wyższa pozycja społeczna resp.o~ denta; osoby z wykształceniem więcej niż średnim są najmniej ~kłonne uwazac, że znajdują się w naj niższym kwartylu struktury społecznej (A~S = -0,~61~) a w największym stopniu są skłonne uważać, że znajdują się w kwartylu naJwyz-
Na koniec poddam analizie wpływ położenia ekonomicznego respondenta na jego postawę wobec socjalnych zadań rządu. Z analiz tych wynika, że zależność pomiędzy sytuacją ekonomiczną a postawami wobec socjalnych zadań rządu wykazywała charakter liniowy. Im korzystniejsze było położenie ekonomiczne, tym większa była skłonność do przyjmowania postaw elitarnych; ci, którzy oceniali swoją sytuację ekonomiczną jako niekorzystną byli najbardziej skłonni przyjmować postawy skrajnie egalitarne = 0,4806) a ci, którzy oceniali swoją sytuację jako korzystną najbardziej skłaniali się do postaw elitarnych ~xy (A43 = 0,6132).
(>-r;.y
Podsumowując wynik analiz od strony merytorycznych ustaleń, można wskazać na kilka interesujących prawidłowości. Przede wszystkim potwierdza się dość znaczną przewagę postaw egalitarnych, a nawet skrajnie egalitarnych nad elitarnymi w badanej próbie. Można nawet powiedzieć, że powszechne są oczekiwania aktywnego spełniania przez rząd jego funkcji socjalnych. Druga rzecz - na badane postawy większy wpływ ma postrzeganie własnej sytuacji ekonomicznej niż swojego miejsca w strukturze społecznej. Istotne znaczenie dla
prezentowanych postaw ma także poziom wykształcenia i wiek respondentów; o ile można powiedzieć, że wpływ wykształcenia jest tu jednokierunkowy, tzn.
Dodatek
im wyższe wykształcenie, tym większa skłonność do postaw elitarny~h., o tyle nie da się jednoznacznie powiedzieć, że im ktoś jest młodszy, tym mmeJ nast~ wiony egalitarnie. Można więc założyć, że podnoszenie poziomu wy.kształcema i poziomu życia będą tymi czynnikami, które w największym stopmu będą oddziaływały na badane postawy.
11. Hagenaars A. J. 1990: Categorical Longitudinal Data. Newbury Park, Sage.
Prezentowany tu przykład dał, mam nadzieję, możliwość oceny zale~ ~rowa dzenia analizy tego typu zagadnień z użyciem modeli logarytmiczn~-hm?wyc? ze zmiennymi ukrytymi. Modele te są na tyle elastyczne, że stwarz~]ą tez m?zliwości zbadania takich zmian w czasie, wprowadzając ów czas Jako kolejną zmienną do modelu. Kolejne edycje PGSS stwarzają taką okazję·
14. Langeheine R., Rost J. 1988: Latent Trait and Latent Class Models. New York, Plenum Press.
Mam również nadzieję, że zaprezentowana tu analiza raczej zachęciła do zdobywania wiedzy niezbędnej do jej rozumienia i prowadzenia.
16. Lazarsfeld P. F. 1950b: The Logical and Mathematical Foundation of Latent Structure Analysis. (w:) S. Stauffer (red.), Measurement and Prediction. Princeton NJ, Princeton University Press.
Literatura
17. Lazarsfeld P. F., Henry N. W. 1968: Latent Structure Analysis. Boston, Houghton Miffiin.
12. Hagenaars A. J. 1993: Loglinear Models with Latent Variabies. Newbury Park, CA: Sage. 13. Heinen T. 1993: Discrete Latent Variable Models. Tilburg, Tilburg University Press.
15. Lazarsfeld P. F. 1950a: The Interpretation and Mathematical Foundation of Latent Structure Analysis. (w:) S. Stauffer (red.), Measurement and Prediction. Princeton NJ, Princeton University Press.
1. Agresti A. 1990: Categorical Data Analysis. New York, John Wiley. 2. Andersen E. B. 1990: The Statistical Analysis of Categorical Data. Berlin,
18. Little R. J., Rubin N. W. 1987: Statistical Analysis with Missing Data. New York, John Wiley.
Springer-Verlag. 3. Cichomski B., Morawski P. 1995: Polski Generalny Sondaż Społeczn\lr:~-1995. Komputerowy zbiór danych. Warszawa, Instytut Studiów Społecznyc, lllwersy-
19. McCutcheon L. Allan 1987: Latent Class Analysis. Beverly Hills, CA: Sage.
tet Warszawski. 4. Clogg C. C., Goodman L. A. 1984: Latent Structure An~lysis of ~ ~etl 0Af Mu~ti dimensional Contingency Tables. "Journal of the Amencan Statlstlca SSOClation" 79, s. 762-771. 5. Goodman A. L. 1974a: Exploratory Latent Structure Analysis Using Both Identifiable and Unidentifiable Models. "Biometrika" 61, s. 215-231. 6. Goodman A. L., 1974b: The Analysis of Systems of Qualitative Variabies when Some of the Variabies are Unobservable. Part I: A Modified Latent Structure Approach. "American Journal of Sociology" 79, s. 1179-1259. 7. Haberman J. S. 1976: Interactive Scaling Procedures for Log-linear Model~ for Frequency Data Derived by Indirect Observation. Proceedings of the Amencan Statistical Association 1975: Statistical Computing Section, s. 45-50. 8. Haberman J. S. 1977: Product Models for Frequency Tables Involving Indirect Observations. "AnnaIs of Statistics" 5, s. 1124-1147. 9. Haberman J. S. 1979: Analysis of Qualitative Data. Vol. 2. New Developments. New York, Academic Press. 10. Haberman J. S. 1988: A Stabilized Newton-Raphson Algorithm for Log-linear Models for Frequency Tables Derived by Indirect Observation. [w:] Clo~g C. C. ~red), "Sociological Methodology" 1988 (vol. 18); Washington DC, Amencan SoclOloglcal Association.
20. McCutcheon L. A. 1994: Latenł Logit Models with Polytomous Effects Variabies. [w:] von Eye A., Clogg C. C. (red.), Latent Variable Analysis: Applications for Developmental Research. Newbury Park, CA: Sage. 21. Nawojczyk M., McCutcheon A. 1996: Rozdźwięk z doktryną. Postawy amerykań skich i polskich katolików świeckich wobec legalności aborcji. "Studia Socjologiczne" 1, s. 49-76. 22. Vermunt K. J. 1993: LEM: Loglinear and Event History Analysis with Missing Data Using EM Algorithm. WORC Paper 93.09.015/7, University of Tilburg. 23. Vermunt K. J. 1996: Log-linear Event History Analysis. Tilburg, Tilburg University Press.
I
k Pola pod krzywą normalną
Załąc"nik
A
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40 0,41
-z A
:I.
B
A ,0000 ,0040 ,0080 ,0120 ,0160 ,0199 ,0239 ,0279 ,0319 ,0359 ,0398 ,0438 ,0478 ,0517 ,0557 ,0596 ,0636 ,0675 ,0714 ,0753 ,0793 ,0832 ,0871 ,0910 ,0948 ,0987 ,1026 ,1064 ,1103 ,1141 ,1179 ,1217 ,1255 ,1293 ,1331 ,1368 ,1406 ,1443 ,1480 ,1517 ,1554 ,1591
C
A
~
z
0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 0,3446 0,3409
0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79 0,80 0,81 0,82 0,83
~ ~ B
C
-z A
B
A 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,2881 0,2910 0,2939 0,2967
C
A
~
z
0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 0,2119 0,2090 0,2061 0,2033
0,84 0,85 0,86 0,87 0,88 0,89 0,90 0,91 0,92 0,93 0,94 0,95 0,96 0,97 0,98 0,99 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,18 1,19 1,20 1,21 1,22 1,23 1,24 1,25
~ ~ B
C
-z A
B
A
C
/\...
0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289· 0,3315 0,3340 0,3365 0,3389 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944
0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056
~ ~ B
C
(.~r'kk:i::~iC::;:::]L:/,)U:;:
A
B
z 1,26 1,27 1,28 1,29 1,30 1,31 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,39 1,40 1,41 1,42 1,43 1,44 1,45 1,46 1,47 1,48 1,49 1,50 1,51 1,52 1,53 1,54 1,55 1,56 1,57 1,58 1,59 1,60 1,61 1,62 1,63 1,64 1,65 1,66 1,67
0,3962 0,3980 0,3997 0,4015 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525
-z A
B
C
A
~
z
0,1038 0,1020 0,1003 0,0985 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475
1,68 1,69 1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,81 1,82 1,83 1,84 1,85 1,86 1,87 1,86 1,89 1,90 1,91 1,92 1,93 1,94 1,95 1,96 1,97 1,98 1,99 2,00 2,01 2,02 2,03 2,04 2,05 2,06 2,07 2,08 2,09
~
-z
C
A
B
0,4535 0,4545 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
B
C
A
~
z
0,0465 0,0455 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
2,10 2,11 2,12 2,13 2,14 2,15 2,16 2,17 2,18 2,19 2,20 2,21 2,22 2,23 2,24 2,25 2,26 2,27 2,28 2,29 2,30 2,31 2,32 2,33 2,34 2,35 2,36 2,37 2,38 2,39 2,40 2,41 2,42 2,43 2,44 2,45 2,46 2,47 2,48 2,49 2,50 2,51
~
-z
C
A
B
C
A
~ 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 0,4938 0,4940
B
0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064 0,0062 0,0060
~ C
'1
B
-z A
A
h
z 2,52 2,53 2,54 2,55 2,56 2,57 2,58 2,59 2,60 2,61 2,62 2,63 2,64 2,65 2,66 2,67 2,68 2,69 2,70 2,71 2,72 2,73 2,74 2,75 2,76 2,77 2,78 2,79
C
0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
~ ~ B
C
z 2,80 2,81 2,82 2,83 2,84 2,85 2,86 2,87 2,88 2,89 2,90 2,91 2,92 2,93 2,94 2,95 2,96 2,97 2,98 2,99 3,00 3,01 3,02 3,03 3,04 3,05 3,06 3,07
-z A
B
/k h 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989
c
0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011
~ ~ B
C
A
z
B
A
3,08 0,4990 3,09 0,4990 3,10 0,4990 3,11 0,4991 3,12 0,4991 3,13 0,4991 3,14 0,4992 3,15 0,4992 3,16 0,4992 3,17 0,4992 3,18 0,4993 3,19 0,4993 3,20 0,4993 3,21 0,4993 3,22 0,4994 3,23 0,4994 3,24 0,4994 3,25 0,4994 3,30 0,4995 3,35 0,4996 3,40 0,4997 3,45 0,4997 3,50 0,4998 3,60 0,4998 3,70 0,4999 3,80 0,4999 3,90 0,49995 4,00 0,49997
-z A
C
h 0,0010 0,0010 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0005 0,0004 0,0003 0,0003 0,0002 0,0002 0,0001 0,0001 0,00005 0,00003
~ ~ B
i~ lL
C
a
Rozkład
t Studenta
Załącznik
df
l
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 00
0,10
Poziom istotności dla testu jednostronnego 0,05 0,025 0,01 0,005
0,20
Poziom istotności dla testu dwustronnego 0,05 0,02 0,01 0,001
3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,303 1,296 1,289 1,282
6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,684 1,671 1,658 1,645
12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,021 2,000 1,980 1,960
31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,423 2,390 2,358 2,326
63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,704 2,650 2,617 2,576
0,0005
636,619 31,598 12,941 8,610 6,859 5,959 5,405 5,041 4,781 4,587 4,437 4,318 4,221 4,140 4,073 4,015 3,965 3,922 3,883 3,850 3,819 3,792 3,767 3,745 3,725 3,707 3,690 3,674 3,659 3,646 3,551 3,460 3,373 3,391
załącz Rozkład
F
" 2ałączl:l.ilK
Rozkład
n2/ n l 1 2 3 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 60 120 CXl
3
F dla o: = 0,05 1
2
3
4
5
6
8
12
24
CXl
161,40 199,50 215,70 224,60 230,20 234,00 238,90 243,90 249,00 254,30 18,51 19,25 19,00 19,16 19,30 19,33 19,37 19,41 19,45 19,50 10,13 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,64 8,53 6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,68 4,53 4,36 5,99 5,14 4,76 4,53 4,28 4,15 4,39 4,00 3,84 3,67 5,59 4,74 4,35 4,12 3,97 3,87 3,73 4,57 3,41 3,23 5,32 4,46 4,07 3,84 3,58 3,44 3,28 3,69 3,12 2,93 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,07 2,90 2,71 4,96 4,10 3,71 3,48 3,33 3,22 3,07 2,91 2,74 2,54 4,84 3,98 3,59 3,20 3,36 3,09 2,95 2,79 2,61 2,40 4,75 3,88 3,49 3,26 3,11 3,00 2,85 2,69 2,50 2,30 4,67 3,80 3,41 3,18 2,92 3,02 2,77 2,60 2,42 2,21 4,60 3,74 3,34 3,11 2,96 2,85 2,70 2,53 2,35 2,13 4,54 3,68 3,29 3,06 2,90 2,79 2,64 2,48 2,29 2,07 4,49 3,63 3,24 3,01 2,85 2,74 2,42 2,59 2,24 2,01 4,45 3,59 3,20 2,96 2,81 2,70 2,55 2,38 2,19 1,96 4,41 3,55 3,16 2,93 2,66 2,77 2,51 2,34 2,15 1,92 4,38 3,52 3,13 2,90 2,74 2,63 2,48 2,31 2,11 1,88 4,35 3,49 3,10 2,87 2,71 2,60 2,43 2,28 2,08 1,84 4,32 3,47 2,84 2,68 2,57 2,42 2,25 3,07 2,05 1,81 4,30 3,44 3,05 2,82 2,66 2,55 2,40 2,23 2,03 1,78 4,28 3,42 3,03 2,80 2,64 2,53 2,38 2,20 2,00 1,76 4,26 3,40 3,01 2,78 2,62 2,51 2,36 2,18 1,98 1,73 4,24 3,38 2,99 2,76 2,60 2,49 2,34 2,16 1,96 1,71 4,22 3,37 2,98 2,74 2,59 2,47 2,32 2,15 1,95 1,69 4,21 3,35 2,96 2,46 2,30 2,13 2,73 2,57 1,93 1,67 4,20 2,12 1,91 3,34 2,95 2,71 2,56 2,44 2,29 1,65 4,18 3,33 2,93 2,70 2,54 2,43 2,28 2,10 1,90 1,64 4,17 3,32 2,53 2,42 2,27 2,09 1,89 2,92 2,69 1,62 4,00 3,15 2,76 2,52 2,37 2,25 2,10 1,92 1,70 1,39 3,92 3,07 2,17 2,02 1,83 1,61 2,68 2,45 2,29 1,25 3,84 2,99 2,60 2,37 2,21 2,09 1,94 1,75 1,52 1,00
295
''ll
Załącznik 3
Rozkład
n2/ n l
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 00
Rozkład
F dla ex = 0,01
4052 98,49 34,12 21,20 16,26 13,74 12,25 11,26 10,56 10,04 9,65 9,33 9,07 8,86 8,68 8,53 8,40 8,28 8,18 8,10 8,02 7,94 7,88 7,82 7,77 7,72 7,68 7,64 7,60 7,56 7,31 7,08 6,85 6,64
2
3
4
4999 99,01 30,81 18,00 13,27 10,92 9,55 8,65 8,02 7,56 7,20 6,93 6,70 6,51 6,36 6,23 6,11 6,01 5,93 5,85 5,78 5,72 5,66 5,61 5,57 5,53 5,49 5,45 5,42 5,39 5,18 4,98 4,79 4,60
5403 99,17 29,46 16,69 12,06 9,78 8,45 7,59 6,99 6,55 6,22 5,95 5,74 5,56 5,42 5,29 5,18 5,09 5,01 4,94 4,87 4,82 4,76 4,72 4,68 4,64 4,60 4,57 4,54 4,51 4,31 4,13 3,95 3,78
5625 99,25 28,71 15,98 11,39 9,15 7,85 7,01 6,42 5,99 5,67 5,41 5,20 5,03 4,89 4,77 4,67 4,58 4,50 4,43 4,37 4,31 4,26 4,22 4,18 4,14 4,11 4,07 4,04 4,02 3,83 3,65 3,48 3,32
5
6
8
12
24
00
n2/ n l
5764 99,30 28,24 15,52 10,97 8,75 7,46 6,63 6,06 5,64 5,32 5,06 4,86 4,69 4,56 4,44 4,34 4,25 4,17 4,10 4,04 3,99 3,94 3,90 3,86 3,82 3,78 3,75 3,73 3,70 3,51 3,34 3,17 3,02
5859 99,33 27,91 15,21 10,67 8,47 7,19 6,37 5,60 5,39 5,07 4,82 4,62 4,46 4,32 4,20 4,10 4,01 3,94 3,87 3,81 3,76 3,71 3,67 3,63 3,59 3,56 3,53 3,50 3,47 3,29 3,12 2,96 2,80
5981 99,36 27,49 14,80 10,27 8,10 6,84 6,03 5,47 5,06 4,74 4,50 4,30 4,14 4,00 3,89 3,79 3,71 3,63 3,56 3,51 3,45 3,41 3,36 3,32 3,29 3,26 3,23 3,20 3,17 2,99 2,82 2,66 2,51
6106 99,42 27,05 14,37 9,89 7,72 6,47 5,67 5,11 4,71 4,40 4,50 3,96 3,80 3,67 3,55 3,45 3,37 3,30 3,23 3,17 3,12 3,07 3,03 2,99 2,96 2,93 2,90 2,87 2,84 2,66 2,50 2,34 2,18
6234 99,46 26,60 13,93 9,47 7,31 6,07 5,28 4,73 4,33 4,02 4,16 3,59 3,43 3,29 3,18 3,08 3,00 2,92 2,86 2,80 2,75 2,70 2,66 2,62 2,58 2,55 2,52 2,49 2,47 2,29 2,12 1,95 1,79
6366 99,50 26,12 13,46 9,02 6,88 5,65 4,86 4,31 3,91 3,60 3,78 3,16 3,00 2,87 2,75 2,65 2,57 2,49 2,42 2,36 2,31 2,26 2,21 2,17 2,13 2,10 2,06 2,03 2,01 1,80 1,60 1,38 1,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 00
F dla ex = 0,001
1 2 3 4 5 6 8 12 24 00 405284 500000 540379 562500 576405 585937 398144 610667 623497 636619 998,5 999,0 999,2 999,2 999,3 999,3 999,4 999,4 999,5 999,5 148,5 141,1 167,5 137,1 134,6 132,8 30,6 128,3 125,9 123,5 74,14 61,25 56,18 53,44 51,71 50,53 49,00 47,41 45,77 44,05 47,04 36,61 33,20 31,09 29,75 28,84 17,64 26,42 25,14 23,78 35,51 27,00 23,70 20,81 19,03 21,90 20,03 17,99 16,89 15,75 29,22 21,69 18,77 14,63 17,19 16,21 15,52 13,71 12,73 11,69 25,42 18,49 15,83 14,39 12,86 12,04 13,49 11,19 10,30 9,34 22,86 16,39 13,90 12,56 11,71 11,13 10,37 9,57 8,72 7,81 21,04 14,91 12,55 9,92 9,20 11,28 10,48 8,45 7,64 6,76 19,69 13,81 11,56 9,58 9,05 8,35 10,35 7,63 6,85 6,00 18,64 12,97 10,80 8,69 8,38 7,71 9,63 7,00 6,25 5,42 17,81 12,31 10,21 7,21 9,07 8,33 7,86 6,52 5,78 4,97 17,14 11,78 9,73 8,62 7,92 7,43 6,80 6,13 5,41 4,60 16,59 11,34 9,34 6,47 8,25 7,57 7,09 5,81 5,10 4,31 16,12 10,97 9,00 7,94 7,27 6,81 6,19 5,55 4,85 4,06 15,72 10,66 8,73 7,02 6,56 7,68 5,96 5,32 4,63 3,85 15,38 10,39 8,49 7,46 6,81 6,35 5,76 5,13 4,45 3,67 15,08 10,16 8,28 7,26 6,61 6,18 5,59 4,97 4,29 3,52 14,82 9,95 8,10 7,10 6,46 6,02 5,44 4,82 4,15 3,38 14,59 9,77 7,94 6,32 5,88 6,95 5,31 4,70 4,03 3,26 14,38 9,61 7,80 6,81 6,19 5,76 5,19 4,58 3,92 3,15 14,19 9,47 7,67 6,08 6,69 5,65 5,09 4,48 3,82 3,05 14,03 9,34 7,55 6,59 5,98 5,55 4,99 4,39 3,74 2,97 13,88 9,22 7,45 6,49 5,88 5,46 4,91 4,31 3,66 2,89 13,74 9,12 7,36 4,83 6,41 5,80 5,38 4,24 3,59 2,82 13,61 9,02 7,27 5,73 5,31 4,76 6,33 4,17 3,52 2,75 13,50 8,93 7,19 5,24 4,69 6,25 5,66 4,11 3,46 2,70 13,39 8,85 7,12 6,19 5,59 5,18 4,64 4,05 3,41 2,64 13,29 8,77 7,05 6,12 5,12 4,58 5,53 4,00 2,59 3,36 12,61 8,25 6,60 4,21 5,70 5,13 4,73 3,64 3,01 2,23 11,97 7,76 6,17 5,31 4,76 4,37 3,87 3,31 2,69 1,90 11,38 7,31 5,79 4,95 4,42 4,04 3,55 3,02 2,40 1,56 10,83 6,91 5,42 4,62 4,10 3,74 3,27 2,74 2,13 1,00
297
'k
Załącllnik
4
df
0,10
0,05
0,01
0,001
1 2 3 4 5
2,71 4,60 6,25 7,78 9,24
3,84 5,99 7,81 9,49 11,07
6,64 9,21 11,34 13,28 15,09
10,83 13,82 16,27 18,47 20,52
6 7 8 9 10
10,64 12,02 13,36 14,68 15,99
12,59 14,07 15,51 16,92 18,31
16,81 18,48 20,09 21,67 23,21
22,46 24,32 26,12 27,88 29,59
11 12 13 14 15
17,28 18,55 19,81 21,06 22,31
19,68 21,03 22,36 23,68 25,00
24,72 26,22 27,69 29,14 30,58
31,26 32,91 34,53 36,12 37,70
16 17 18 19 20
23,54 24,77 25,99 27,20 28,41
26,30 27,59 28,87 30,14 31,41
32,00 33,41 34,80 36,19 37,57
39,25 40,79 42,31 43,82 45,32
21 22 23 24 25
29,62 30,81 32,01 33,20 34,38
32,67 33,92 35,17 36,42 37,65
38,93 40,29 41,64 42,98 44,31
46,80 48,27 49,73 51,18 52,62
26 27 28 29 30
35,56 36,74 37,92 39,09 40,26
38,88 40,11 41,34 42,56 43,77
45,64 46,96 48,28 49,59 50,89
54,05 55,48 56,89 58,30 59,70
40 50 60 70
51,80 63,17 74,40 85,53
55,76 67,50 79,08 90,53
63,69 76,15 88,38 100,42
73,40 86,66 99,61 112,32
l \