Wprowadzenie do metodologii badań społecznych

Analiza danych ilościowych

Ben Stanley

Wydział Nauk Społecznych, Uniwersytet SWPS

27 stycznia 2026

Poziomy pomiaru w analizie ilościowej

Techniczne aspekty analizy danych ilościowych

  • Kwantyfikacja – nadanie danym formy liczbowej
    • Podstawowy proces przekształcania odpowiedzi w dane numeryczne
    • Umożliwia stosowanie metod statystycznych
  • Kodowanie – szczególnie istotne przy pytaniach otwartych i półotwartych
    • Tworzenie kategorii dla odpowiedzi tekstowych
    • Przypisywanie kodów numerycznych do kategorii
  • Wsparcie komputerowe: SPSS, Stata, R, ale też Excel
    • Wybór narzędzia zależy od złożoności analizy i preferencji badacza

Książka kodowa

Książka kodowa to dokument zawierający:

  • Listę wszystkich zmiennych w badaniu
  • Kody przypisane do poszczególnych wartości
  • Instrukcje dotyczące interpretacji danych
POLVIEWS (poglądy polityczne) ATTEND (uczestnictwo w obrzędach)
1 = Zdecydowanie liberalny 0 = Nigdy
2 = Liberalny 1 = Rzadziej niż raz w roku
3 = Umiarkowanie liberalny 2 = Mniej więcej raz, dwa razy w roku

Poziomy pomiaru zmiennych - przegląd

Istnieją cztery poziomy pomiaru zmiennych:

  1. Nominalny - najmniej precyzyjny
  2. Porządkowy
  3. Przedziałowy
  4. Ilorazowy - najbardziej precyzyjny

Każdy kolejny poziom zawiera właściwości poprzednich i dodaje nowe możliwości analityczne.

Poziom nominalny (jakościowy)

Charakterystyka:

  • Rozróżnienie kategorii bez naturalnego porządku (np. kierunek studiów, płeć, stan cywilny)
  • Kategorie są wzajemnie wykluczające się
  • Nie można ich sensownie uszeregować

Dozwolone operacje:

  • Zliczanie częstości
  • Obliczanie dominanty (mody)
  • NIE: średnia, mediana, odchylenie standardowe

Przykład analizy zmiennej nominalnej

Pytanie: “Z której platformy społecznościowej korzystasz najczęściej?”

Poziom porządkowy

Charakterystyka:

  • Istnieje logiczny porządek między kategoriami (np. oceny szkolne, ranking ulubionych potraw, “zgadzam się / nie zgadzam się”)
  • Możemy powiedzieć, że coś jest “więcej” lub “mniej”
  • NIE wiemy, jak duże są różnice między kategoriami

Dozwolone operacje:

  • Wszystko co dla nominalnego PLUS:
  • Mediana, kwartyle, percentyle
  • Średnia jest dyskusyjna (niektórzy akceptują, inni nie)

Przykład analizy zmiennej porządkowej

Pytanie: “W jakim stopniu zgadzasz się z twierdzeniem: Media społecznościowe pozytywnie wpływają na moje samopoczucie psychiczne?”

Poziom przedziałowy

Charakterystyka:

  • Ma porządek i równe odległości między wartościami (np. rok urodzenia, temperatura)
  • Brak „prawdziwego zera” – zero jest umowne
  • Różnice są mierzalne i porównywalne

Dozwolone operacje:

  • Wszystko co dla porządkowego PLUS:
  • Średnia arytmetyczna
  • Odchylenie standardowe
  • NIE można: dzielić jednej wartości przez drugą (proporcje)

Przykład analizy zmiennej przedziałowej

Pytanie: “Ile godzin dziennie spędzasz w mediach społecznościowych?”

Poziom ilorazowy (stosunkowy)

Charakterystyka:

  • Szczególny przypadek poziomu przedziałowego (np. wiek, dochód, waga)
  • Posiada prawdziwe zero (oznacza brak cechy)
  • Można sensownie tworzyć proporcje i stosunki

Dozwolone operacje:

  • Wszystkie operacje matematyczne
  • Proporcje i stosunki (np. “dwa razy więcej”)

Przykład analizy zmiennej ilorazowej

Pytanie: “Ile masz obserwujących (followers) na platformie, z której korzystasz najczęściej?”

Podsumowanie poziomów pomiaru

Poziom Kategorie Porządek Równe odstępy Prawdziwe zero
Nominalny
Porządkowy
Przedziałowy
Ilorazowy

Zasada: Im wyższy poziom pomiaru, tym więcej możliwości analitycznych.

Analiza danych ilościowych

Przygotowanie bazy danych

Przed rozpoczęciem analizy należy:

  1. Sprawdzić kompletność danych
    • Zidentyfikować braki danych (missing values)
    • Zdecydować, jak traktować braki
  2. Zweryfikować poprawność kodowania
    • Sprawdzić, czy wartości mieszczą się w dozwolonych zakresach
    • Zidentyfikować wartości odstające
  3. Utworzyć nowe zmienne (jeśli potrzebne)
    • Przekodowanie zmiennych
    • Tworzenie indeksów i skal

Sprawdzenie kompletności danych

Problem: Braki danych (missing values) - respondenci nie odpowiedzieli na wszystkie pytania

           Zmienna Kompletne Braki Procent_brakow
1        Platforma       228    22            8.8
2 Godziny dziennie       228    22            8.8
3      Satysfakcja       232    18            7.2

Wizualizacja braków danych

Decyzja: Czy usunąć przypadki z brakami, czy je imputować (uzupełnić)?

Weryfikacja poprawności kodowania

Problem: Wartości poza dozwolonym zakresem lub odstające

Sprawdzenie wieku:
Min: -5 Max: 999 
Wartości poza zakresem 18-30: 5 
Sprawdzenie godzin dziennie:
Min: -2 Max: 30 
Wartości niemożliwe (<0 lub >24): 4

Wizualizacja wartości odstających

Decyzja: Usunąć błędne wartości lub zamienić na NA?

Tworzenie nowych zmiennych

Problem: Potrzeba kategoryzacji lub łączenia zmiennych

Przykładowe dane przed i po kategoryzacji:
   godziny_dziennie       intensywnosc
1          4.972954      Wysoka (4-6h)
2          4.203073      Wysoka (4-6h)
3          3.338043 Umiarkowana (2-4h)
4          3.180683 Umiarkowana (2-4h)
5          5.237148      Wysoka (4-6h)
6          5.438532      Wysoka (4-6h)
7          4.301971      Wysoka (4-6h)
8          3.309448 Umiarkowana (2-4h)
9          1.662687        Niska (<2h)
10         1.817973        Niska (<2h)

Wizualizacja nowej zmiennej

Zastosowanie: Łatwiejsza analiza i interpretacja wyników

Analiza jednozmiennowa – opis próby

Cel: Opisać rozkład każdej zmiennej osobno

Elementy analizy:

  • Rozkład wartości
    • Częstości (liczby bezwzględne i procenty)
    • Ważne odpowiedzi vs braki odpowiedzi
  • Miary tendencji centralnej
    • Dominanta (modalna) – wartość najczęstsza
    • Mediana – wartość środkowa
    • Średnia arytmetyczna
  • Miary rozproszenia
    • Zakres (rozstęp) wartości
    • Odchylenie standardowe

Rozkład wartości: Częstości

Interpretacja: Instagram dominuje (36.4%), wysokie braki odpowiedzi (8.8%)

Miary tendencji centralnej

Interpretacja: Wszystkie trzy miary są podobne (~3.5h), co wskazuje na symetryczny rozkład

Miary rozproszenia

Interpretacja: Wyższe SD = większe zróżnicowanie w czasie korzystania

Dobór miar do typu zmiennej

Poziom pomiaru Tendencja centralna Rozproszenie
Nominalny Dominanta -
Porządkowy Dominanta, Mediana Rozstęp kwartylowy
Przedziałowy Średnia, Mediana Odch. standardowe
Ilorazowy Średnia, Mediana Odch. standardowe

Uwaga: Zawsze można użyć miar z niższych poziomów, ale nie z wyższych.

Przykład analizy jednozmiennowej

Pytanie: “Jak oceniasz ogólny wpływ mediów społecznościowych na Twoje życie?”

Odpowiedź %
Bardzo pozytywny 8%
Raczej pozytywny 27%
Ani pozytywny, ani negatywny 35%
Raczej negatywny 22%
Bardzo negatywny 8%

Źródło: Dane przykładowe, 2025

Test istotności różnic między kategoriami

Pytanie badawcze: Czy rozkład odpowiedzi różni się istotnie od rozkładu równomiernego?

TEST CHI-KWADRAT DOPASOWANIA
================================
Hipoteza zerowa (H0): Wszystkie kategorie są równie prawdopodobne (20% każda)
Hipoteza alternatywna (H1): Rozkład różni się od równomiernego
Obserwowane częstości:
  Bardzo pozytywny: 20 (8.0%)
  Raczej pozytywny: 68 (27.1%)
  Neutralny: 88 (35.1%)
  Raczej negatywny: 55 (21.9%)
  Bardzo negatywny: 20 (8.0%)

Oczekiwane częstości (przy H0):
  Bardzo pozytywny: 50.2 (20.0%)
  Raczej pozytywny: 50.2 (20.0%)
  Neutralny: 50.2 (20.0%)
  Raczej negatywny: 50.2 (20.0%)
  Bardzo negatywny: 50.2 (20.0%)


Wyniki testu:
χ² = 71.57 
df = 4 
p-value = 0 
WNIOSEK: Odrzucamy H0 (p < 0.05)
Rozkład odpowiedzi różni się ISTOTNIE od równomiernego.
Respondenci nie odpowiadają losowo - widoczny wzorzec:
najwięcej osób wybiera odpowiedzi neutralne i raczej pozytywne.

Wizualizacja testu dopasowania

Interpretacja: Rozkład odpowiedzi różni się istotnie od równomiernego (χ² = 71.57, p < 0.001). Respondenci najczęściej wybierają odpowiedzi neutralne (35%) i raczej pozytywne (27%), co sugeruje umiarkowanie pozytywne nastawienie do mediów społecznościowych z dużą dozą ambiwolencji.

Analiza dwuzmiennowa – wyjaśnienie

Cel: Zbadać związek między dwiema zmiennymi

Kiedy możemy mówić o wpływie?

  • Gdy mamy porównanie między grupami
  • I to nie zawsze – korelacja ≠ przyczynowość!

Narzędzia:

  • Tabele krzyżowe (kontyngencji)
  • Testy statystyczne (np. test chi-kwadrat)
  • Miary korelacji

Przykład: Korelacja dodatnia

Związek między czasem w mediach społecznościowych a liczbą postów

Przykład: Korelacja ujemna

Związek między czasem w mediach społecznościowych a jakością snu

Przykład: Brak korelacji

Związek między czasem w mediach społecznościowych a wiekiem

Kroki tworzenia tabeli dwuzmiennowej

  1. Zdefiniuj zmienne
    • Zmienna niezależna (np. płeć)
    • Zmienna zależna (np. plany zawodowe)
  2. Podziel przypadki na grupy
    • Zgodnie z wartościami zmiennej niezależnej
  3. Opisz każdą podgrupę
    • W kategoriach wartości zmiennej zależnej
  4. Odczytaj porównanie
    • Jakie są różnice między grupami?

Przykład analizy dwuzmiennowej

Pytanie: “Czy zgadzasz się z twierdzeniem: Media społecznościowe pozytywnie wpływają na moje życie społeczne?” (według płci)

Tabela krzyżowa (procenty wierszowe):
           odpowiedzi
plec        Raczej nie Raczej tak Zdecydowanie nie Zdecydowanie tak
  Kobiety         36.2       26.7             29.3              7.8
  Mężczyźni       17.2       35.8              6.7             40.3


Liczebności bezwzględne:
           odpowiedzi
plec        Raczej nie Raczej tak Zdecydowanie nie Zdecydowanie tak
  Kobiety           42         31               34                9
  Mężczyźni         23         48                9               54


Test chi-kwadrat:
χ² = 54.88 
df = 3 
p-value = 0 

Wynik: Różnice między płciami są statystycznie istotne (p < 0.05)

Wizualizacja analizy dwuzmiennowej

Interpretacja: Mężczyźni znacznie częściej wyrażają pozytywne opinie o wpływie mediów społecznościowych na życie społeczne (około 80% odpowiedzi pozytywnych vs około 30% u kobiet). Kobiety wykazują silny sceptycyzm - około 70% odpowiedzi negatywnych. Test chi-kwadrat potwierdza, że różnice między płciami są statystycznie wysoce istotne (p < 0.001).

Analiza wielozmiennowa – wyjaśnienie

Cel: Zbadać złożone zależności między wieloma zmiennymi jednocześnie

Narzędzia:

  • Tabele wielozmiennowe (z kontrolą trzeciej zmiennej)
  • Modele regresji
    • Regresja liniowa (zmienna zależna ciągła)
    • Regresja logistyczna (zmienna zależna binarna)

Zastosowanie:

  • Kontrolowanie wpływu zmiennych zakłócających
  • Przewidywanie wartości jednej zmiennej na podstawie innych

Przykład analizy wielozmiennowej

Pytanie: “Jak oceniasz wpływ mediów społecznościowych na Twoje samopoczucie?” (według płci i roku)

Analiza uwzględnia trzy zmienne:

  1. Rok badania (2018-2025)
  2. Płeć (kobiety/mężczyźni)
  3. Ocena wpływu na samopoczucie (skala 1-10)

Wizualizacja analizy wielozmiennowej

Obserwacje:

  • Oceny wpływu mediów społecznościowych spadły od 2018 roku u obu płci
  • Różnica między płciami rośnie z czasem: w 2018 obie grupy miały podobne oceny (~6.5), w 2025 różnica wynosi około 2 punkty
  • Kobiety wykazują bardziej stromy spadek ocen (efekt interakcji między rokiem a płcią)
  • Możliwe interpretacje: rosnąca świadomość negatywnego wpływu mediów społecznościowych szczególnie wśród kobiet

Podsumowanie: typy analizy

Typ analizy Liczba zmiennych Cel Przykładowe narzędzia
Jednozmiennowa 1 Opis Częstości, średnia
Dwuzmiennowa 2 Związek Tabele krzyżowe, chi²
Wielozmiennowa 3+ Wyjaśnienie Regresja

Kluczowe zasady analizy ilościowej

  1. Dobierz metodę do poziomu pomiaru
  2. Pamiętaj o brakach danych
  3. Korelacja ≠ przyczynowość
  4. Interpretuj w kontekście

Dobierz metodę do poziomu pomiaru

Problem: Obliczanie średniej dla zmiennej nominalnej jest bez sensu

  • Błędne podejście

    • Pytanie: “Z której platformy korzystasz najczęściej?”
    • Kodowanie: Instagram=1, TikTok=2, Facebook=3, YouTube=4, X=5
    • Obliczona “średnia”: 2.47
    • Co to znaczy? Nic.
  • Poprawne podejście:

    • Dominanta (najczęstsza wartość): Instagram
    • Procenty: Instagram (35%), TikTok (25%), Facebook (15%), YouTube (15%), X (10%)
    • To ma sens - pokazuje najpopularniejszą platformę

Zmienna nominalna → dominanta, częstości, procenty.

Pamiętaj o brakach danych

Problem: Braki danych mogą być systematyczne i wprowadzać błąd

  • Scenariusz:
    • Badanie: “Ile godzin dziennie spędzasz w mediach społecznościowych?”
    • Osoby spędzające sporo czasu (>6h) częściej nie odpowiadają (wstyd, unikanie)
    • 40% osób z wysokim użyciem nie odpowiada
    • Tylko 5% osób z niskim użyciem nie odpowiada
  • Konsekwencje:
    • Prawdziwa średnia: 4.2 godziny
    • Obserwowana średnia (z brakami): 3.5 godziny
    • Zaniżenie o prawie godzinę

Zawsze sprawdzaj wzorzec braków - czy są losowe czy systematyczne?

Korelacja ≠ przyczynowość

Problem: Związek statystyczny nie oznacza związku przyczynowego

  • Pozorny związek:

    • Obserwacja: Im więcej czasu w mediach społecznościowych, tym więcej znajomych (r = 0.75)
  • Błędna interpretacja:

    • “Media społecznościowe POWODUJĄ więcej znajomości!”
  • Prawdziwa przyczyna - zmienna zakłócająca:

    • Ekstrawersja wpływa zarówno na:
      • Czas w mediach społecznościowych (ekstrawertyczni więcej korzystają)
      • Liczbę znajomych (ekstrawertyczni mają więcej znajomych)

Korelacja może być efektem trzeciej zmiennej.

Interpretuj w kontekście

Problem: Te same liczby mogą znaczyć co innego w różnych kontekstach

  • Przykład: 3 godziny dziennie w mediach społecznościowych

    • Kontekst 1: Student
      • Średnia dla studentów: 5 godzin dziennie
      • 3 godziny = poniżej średniej
      • Interpretacja: Umiarkowane użycie
    • Kontekst 2: Pracujący full-time
      • Średnia dla pracujących: 2 godziny dziennie
      • 3 godziny = powyżej średniej
      • Interpretacja: Intensywne użycie

Liczby nabierają sensu tylko w kontekście teorii, norm grupowych i problemu badawczego.

Podsumowanie: Krok po kroku analiza ilościowa

Krok 1: Przygotowanie danych

Przed analizą:

  1. Import i weryfikacja danych
    • Wczytaj dane do programu (SPSS, R, Excel)
    • Sprawdź, czy wszystkie zmienne są poprawnie zakodowane
    • Zweryfikuj typy zmiennych (nominalna, porządkowa, przedziałowa, ilorazowa)
  2. Czyszczenie danych
    • Zidentyfikuj braki danych (missing values)
    • Sprawdź wartości odstające i błędne
    • Zdecyduj o strategii radzenia sobie z brakami
  3. Tworzenie nowych zmiennych (jeśli potrzebne)
    • Przekodowanie (np. wiek → grupy wiekowe)
    • Tworzenie skal i indeksów
    • Odwracanie skal (jeśli potrzebne)

Krok 2: Analiza jednozmiennowa (opisowa)

Cel: Poznaj rozkład każdej zmiennej osobno

Dla każdej zmiennej:

  1. Oblicz podstawowe statystyki (dostosowane do poziomu pomiaru)
  2. Stwórz wizualizację (wykres słupkowy, histogram)
  3. Opisz rozkład (jaka jest typowa wartość? jak bardzo zróżnicowana?)

Typowe pytania:

  • Jaka jest średnia/mediana/dominanta?
  • Jak bardzo zróżnicowane są odpowiedzi?
  • Ile jest braków danych?
  • Czy rozkład jest symetryczny czy skośny?

Krok 3: Analiza dwuzmiennowa (relacyjna)

Cel: Zbadaj związki między parami zmiennych

Proces:

  1. Wybierz parę zmiennych do analizy

    • Zmienna niezależna (ta, która może wpływać)
    • Zmienna zależna (ta, na którą wpływa)
  2. Dobierz metodę (zależy od typów zmiennych - patrz następne slajdy)

  3. Wykonaj analizę i test statystyczny

  4. Zinterpretuj wyniki

    • Czy jest związek?
    • Jak silny jest związek?
    • Czy jest statystycznie istotny?

Krok 4: Analiza wielozmiennowa (zaawansowana)

Cel: Kontroluj wpływ zmiennych zakłócających, buduj modele predykcyjne

Podejścia:

  1. Tabele wielopolowe
    • Analiza związku między dwiema zmiennymi z kontrolą trzeciej
    • Sprawdź, czy związek jest pozorny czy rzeczywisty
  2. Modele regresji
    • Przewiduj wartość zmiennej zależnej na podstawie wielu predyktorów
    • Kontroluj jednocześnie wpływ wielu zmiennych

To już bardziej zaawansowane - wykracza poza ten kurs

Krok 5: Raportowanie wyników

Co zawrzeć w raporcie?

  1. Opis próby
    • Liczebność, struktura demograficzna
    • Braki danych
  2. Wyniki analiz
    • Tabele i wykresy
    • Statystyki opisowe
    • Testy statystyczne (jeśli stosowane)
  3. Interpretacja
    • Co wyniki oznaczają w kontekście pytania badawczego?
    • Jakie są ograniczenia?

Dobór metody analizy do typu zmiennych

Przegląd: Jaką metodę wybrać?

Kluczowe pytanie: Jakiego typu są moje zmienne?

Metoda analizy zależy od poziomu pomiaru zmiennych:

  • Zmienna niezależna (ta, która wpływa)
  • Zmienna zależna (ta, na którą wpływa)

Podstawowe zasady:

  1. Dla zmiennych nominalnych → częstości, tabele krzyżowe
  2. Dla zmiennych porządkowych → mediany, testy nieparametryczne
  3. Dla zmiennych przedziałowych/ilorazowych → średnie, korelacje, regresje

Schemat decyzyjny: Jedna zmienna

Analiza jednozmiennowa (opisowa)

Typ zmiennej Miary tendencji centralnej Miary rozproszenia Wizualizacja
Nominalna Dominanta
Częstości
Liczba kategorii Wykres słupkowy
Wykres kołowy
Porządkowa Dominanta
Mediana
(Średnia - dyskusyjne)
Rozstęp
Rozstęp kwartylowy
Wykres słupkowy
Przedziałowa / Ilorazowa Średnia
Mediana
Dominanta
Odchylenie standardowe
Wariancja
Zakres
Histogram
Boxplot

Przykłady:

  • Nominalna: Płeć → “60% kobiet, 40% mężczyzn”
  • Porządkowa: Wykształcenie → “Mediana: średnie wykształcenie”
  • Przedziałowa: Wiek → “Średnia: 24.3 lat, SD = 3.2”

Schemat decyzyjny: Dwie zmienne

Analiza dwuzmiennowa - zależności między zmiennymi

Zmienna niezależna Zmienna zależna Metoda analizy Test statystyczny Wizualizacja
Nominalna Nominalna Tabela krzyżowa
Procenty
Chi-kwadrat (χ²) Wykres słupkowy grupowany
Nominalna Porządkowa Porównanie median Test U Manna-Whitneya
Test Kruskala-Wallisa
Boxplot dla grup
Nominalna Przedziałowa/Ilorazowa Porównanie średnich Test t-Studenta
ANOVA
Wykres słupkowy średnich
Boxplot
Porządkowa Porządkowa Korelacja rang Korelacja Spearmana (ρ) Wykres punktowy
Porządkowa Przedziałowa/Ilorazowa Korelacja Korelacja Spearmana Wykres punktowy
Przedziałowa/Ilorazowa Przedziałowa/Ilorazowa Korelacja liniowa Korelacja Pearsona (r)
Regresja liniowa
Wykres punktowy z linią trendu

Przykład 1: Nominalna × Nominalna

Pytanie badawcze: Czy płeć wpływa na wybór platformy społecznościowej?

Zmienne:

  • Niezależna: Płeć (nominalna: Kobieta, Mężczyzna)
  • Zależna: Platforma (nominalna: Instagram, TikTok, Facebook, YouTube)

Metoda:

  1. Tabela krzyżowa z procentami wierszowymi
  2. Test chi-kwadrat (χ²) - czy różnice są statystycznie istotne?

Wizualizacja:

  • Wykres słupkowy grupowany
  • Każda platforma = osobny słupek, podzielony według płci

Interpretacja:

  • “Kobiety częściej wybierają Instagram (45%) niż mężczyźni (25%)”
  • “Różnice są statystycznie istotne (χ² = 23.4, p < 0.001)”

Przykład 2: Nominalna × Przedziałowa

Pytanie badawcze: Czy płeć wpływa na czas spędzany w mediach społecznościowych?

Zmienne:

  • Niezależna: Płeć (nominalna: Kobieta, Mężczyzna)
  • Zależna: Godziny dziennie (ilorazowa: 0-24)

Metoda:

  1. Porównanie średnich dla grup
  2. Test t-Studenta - czy różnica między średnimi jest istotna?

Wizualizacja:

  • Wykres słupkowy średnich z błędami standardowymi
  • Boxplot dla każdej grupy

Interpretacja:

  • “Kobiety spędzają średnio 4.2h dziennie (SD=1.8), mężczyźni 3.1h (SD=1.5)”
  • “Różnica jest statystycznie istotna (t = 4.32, p < 0.001)”

Przykład 3: Przedziałowa × Przedziałowa

Pytanie badawcze: Czy czas w mediach społecznościowych wpływa na jakość snu?

Zmienne:

  • Niezależna: Godziny dziennie (ilorazowa: 0-24)
  • Zależna: Jakość snu (przedziałowa: skala 1-10)

Metoda:

  1. Korelacja Pearsona (r) - siła i kierunek związku
  2. Regresja liniowa (jeśli chcemy przewidywać)

Wizualizacja:

  • Wykres punktowy (scatter plot) z linią trendu

Interpretacja:

  • “r = -0.52 - umiarkowana korelacja ujemna”
  • “Więcej czasu w mediach wiąże się z gorszą jakością snu”
  • “10% wariancji jakości snu wyjaśniane czasem w mediach (R² = 0.10)”

Przykład 4: Nominalna × Porządkowa

Pytanie badawcze: Czy wykształcenie różni się według płci?

Zmienne:

  • Niezależna: Płeć (nominalna: Kobieta, Mężczyzna)
  • Zależna: Wykształcenie (porządkowa: podstawowe < średnie < wyższe)

Metoda:

  1. Porównanie median (nie średnich!)
  2. Test U Manna-Whitneya - dla 2 grup
  3. Test Kruskala-Wallisa - dla 3+ grup

Wizualizacja:

  • Wykres słupkowy z rozkładem procentowym dla każdej kategorii
  • Tabela krzyżowa z procentami

Interpretacja:

  • “Mediana dla kobiet: wykształcenie wyższe”
  • “Mediana dla mężczyzn: wykształcenie średnie”
  • “Różnica statystycznie istotna (U = 1245, p = 0.003)”

Przykład 5: Porządkowa × Porządkowa

Pytanie badawcze: Czy wykształcenie wiąże się z poziomem satysfakcji z życia?

Zmienne:

  • Niezależna: Wykształcenie (porządkowa: podstawowe < średnie < wyższe)
  • Zależna: Satysfakcja (porządkowa: skala Likerta 1-5)

Metoda:

  1. Korelacja rang Spearmana (ρ)

Wizualizacja:

  • Wykres punktowy
  • Lepiej: tabela krzyżowa z procentami

Interpretacja:

  • “ρ = 0.34 - słaba do umiarkowanej korelacja dodatnia”
  • “Wyższe wykształcenie wiąże się z wyższą satysfakcją życia”
  • “Związek statystycznie istotny (p < 0.001)”