Proces analizy danych i narzędzia
Wydział Nauk Społecznych, Uniwersytet SWPS
27 stycznia 2026
Od pytania badawczego do publikacji - jak wygląda cały proces?
Schemat wspólny dla wszystkich projektów:
Pytanie badawcze → Dane → Analiza → Historia/Artykuł
Każdy projekt dziennikarstwa danych przechodzi przez te same etapy, niezależnie od tematu
Oficjalne statystyki:
Badania naukowe i ankietowe:
Inne źródła:
Idealne:
Wymagające konwersji:
Przykład na żywo:
Typowe problemy
Braki danych:
Niespójności:
G1 (kosmetyki eko):
G3, G5, G7, G8:
Przykład dokumentacji:
Podstawowe miary:
Dodatkowe dla niektórych grup:
Korelacje:
Porównania między grupami:
Tabele:
Wykresy:
Mapy: - Choroplethy (różnice regionalne)
G1: Wykres słupkowy - różnice między grupami wiekowymi w częstotliwości rutyn pielęgnacyjnych
G3: Mapa - procent pensji na czynsz w różnych miastach
G5: Choropleth - odsetek kobiet z cytologią w województwach
G7: Wykres słupkowy - odsetek gospodarstw z oszczędnościami
G8: Mapa dzielnic - liczba miejsc w schronach na 1000 mieszkańców
Zalety:
Wady:
Dla początkujących:
Dla zaawansowanych (Python):
GUI (bez kodowania):
Z kodowaniem:
GUI (statystyki):
Z kodowaniem:
Bez kodowania:
Z kodowaniem - wykresy:
Desktopowy GIS:
Mapy interaktywne (web):
Hosting statyczny:
Aplikacje interaktywne:
| Etap | Narzędzie |
|---|---|
| Pozyskiwanie | Browser DevTools, Google Sheets |
| Czyszczenie | OpenRefine, LibreOffice Calc |
| Analiza | Jamovi, Google Sheets |
| Wizualizacja | Datawrapper, RAWGraphs |
| Publikacja | GitHub Pages |
| Etap | Narzędzie |
|---|---|
| Pozyskiwanie | Python (Requests, Beautiful Soup) |
| Czyszczenie | pandas, dplyr |
| Analiza | Jupyter Notebooks, tidyverse |
| Wizualizacja | ggplot2, plotly, Flourish |
| Publikacja | Quarto, Streamlit |
Podstawowe pytania:
Każda grupa (30–40 min):
Wypełnijcie 5 punktów:
Każda grupa (20 min): Przedstawcie kluczowe statystyki opisowe dla waszych głównych zmiennych (średnia, mediana, rozkład, odsetki itp.)
Przykładowe zmienne:
G1: Rozkład częstotliwości rutyn, odsetek użytkowników produktów eko, wskaźniki dobrostanu
G3: Średni procent pensji na czynsz w 6 miastach
G5: Odsetek kobiet z cytologią w województwach
G7: Odsetek gospodarstw z oszczędnościami ≥ 3-miesięczne wydatki
G8: Liczba miejsc w schronach na 1000 mieszkańców dzielnicy
Każda grupa (10 min): Poszukajcie związków między kluczowymi zmiennymi w waszych danych (korelacje, porównania między grupami)
Przykładowe związki:
Każda grupa (10 min):
Wypiszcie:
Każda grupa przechodzi przez 4 etapy:
Dziennikarstwo danych