Źródła i pozyskiwanie danych
Wydział Nauk Społecznych, Uniwersytet SWPS
18 kwietnia 2026
Zanim przejdziemy do źródeł danych, przypomnijmy sobie, do czego to wszystko zmierza.
Termin: 06.06.2026. Punktacja: 0–50 (zaliczenie od 25 pkt).
| Element | Maks. pkt | Co oceniamy |
|---|---|---|
| Jakość źródeł danych | 10 | Wiarygodność, aktualność, udokumentowanie, różnorodność |
| Jakość analizy | 10 | Pogłębienie, krytyczność, świadomość ograniczeń, kontekst porównawczy |
| Wizualizacja | 6 | Czytelność, dobór do typu danych, wsparcie narracji |
| Narracja dziennikarska | 10 | Spójność, forma gotowa do publikacji, integracja danych z opowieścią |
| Etyka i dokumentacja | 4 | Świadomość etyczna, brak manipulacji, kompletność dokumentacji |
| Prezentacja końcowa | 10 | Przygotowanie, zrozumienie tematu, odpowiedzi na pytania |
| SUMA | 50 |
Zasada: za „wystarczająco” dostajecie ok. 5–6 pkt w każdej kategorii. Za „bardzo dobrze” — 9–10. Różnicę robi pogłębienie, krytyczność, gotowość do publikacji.
Żeby pokazać, jak to wygląda w praktyce, przygotowałem przykładowy projekt: „Wykluczeni cenowo — geografia dostępności mieszkań w Wielkiej Brytanii”. Prześledźmy, jak taka grupa przechodziłaby od idei do gotowego materiału.
Pomysł początkowy: „kryzys mieszkaniowy w UK” — zbyt szeroki.
Pytanie zawężone:
Jak zmienia się dostępność mieszkań w UK w podziale na regiony, pokolenia i grupy etniczne, i co to oznacza dla mobilności społecznej?
| Źródło | Dostępność | Format | Aktualność | Wiarygodność |
|---|---|---|---|---|
| ONS Housing Affordability | Publicznie | CSV | 2023 | Najwyższa (urząd statystyczny) |
| English Housing Survey | Publicznie | Excel | 2022–23 | Najwyższa |
| ONS ASHE (zarobki) | Publicznie | Excel | 2023 | Najwyższa |
| Valuation Office Agency | Publicznie | CSV | 2023 | Wysoka |
Świadomie odrzucono:
Lekcja: udokumentowany wybór źródeł = pierwsze 10 punktów w rubryce.
Cztery kluczowe ustalenia (każde z jednym wykresem):
Narzędzia: R + tidyverse + ggplot2 + Quarto. Paleta: niebieski (historycznie) vs czerwony (teraz).
Struktura artykułu (~1500 słów + 6 wizualizacji):
Elementy dziennikarskie: tytuł przyciągający, cytat eksperta (LSE), dane w kontekście ludzkich historii, jasne źródła w stopce każdego wykresu.
Wyzwania, o których grupa otwarcie pisze:
Czego unikali:
Pytanie etyczne, które grupa stawia otwarcie:
Czy wizualizacja nierówności etnicznych może wzmacniać stereotypy, nawet jeśli dane są prawdziwe?
Lekcja: krytyczna refleksja = ostatnie 4 punkty rubryki.
Dokument towarzyszący (1–2 strony), który musicie złożyć razem z materiałem:
Pełny przykład: folder Example Project — UK Housing Affordability na Classroom (slajdy prezentacji, artykuł, dokumentacja).
Szczegółową mapę źródeł krajowych, lokalnych, europejskich i specjalistycznych znajdziecie w notatkach do seminarium 2. Tutaj skupimy się na trzech narzędziach, z których będziecie korzystać naprawdę: dane.gov.pl, GUS BDL, i procedura dostępu do informacji publicznej.
| Narzędzie | Kiedy używać | Format |
|---|---|---|
| dane.gov.pl | Zaczynasz projekt — szukasz, czy ktoś już zebrał dane | CSV, JSON, API CKAN |
| GUS BDL | Potrzebujesz danych społeczno-ekonomicznych w podziale terytorialnym | Excel, API |
| Dostęp do informacji publicznej | Dane nie są opublikowane, ale instytucja je posiada | Dowolny (warto prosić o CSV) |
Reguła: zawsze zaczynaj od dane.gov.pl. Jeśli tam nie ma, sprawdź BDL. Jeśli i tam nie ma — rozważ wniosek o informację publiczną.
Ale hierarchia to tylko punkt wyjścia. Umiejętnością, którą macie zbudować na tym kursie, jest ocena konkretnego źródła — nie rozpoznawanie GUS-u jako wiarygodnego, tylko decydowanie, czy dane źródło X, którego wcześniej nie widzieliście, nadaje się do waszej historii.
Gdzie umieścicie w hierarchii następujące polskie źródła? Uzasadnijcie w jednym zdaniu.
Dlaczego to ważne dla was: to jedno z waszych najsilniejszych narzędzi. Państwo posiada dużo więcej danych niż publikuje. Wasza umiejętność składania skutecznych wniosków jest umiejętnością zawodową.
Anna Kowalska
ul. Marszałkowska 100/5
00-950 Warszawa
e-mail: a.kowalska@przyklad.pl
Dyrektor Mazowieckiego Oddziału Wojewódzkiego
Narodowego Funduszu Zdrowia
ul. Chałubińskiego 8, 00-613 Warszawa
Wniosek o udostępnienie informacji publicznej
Na podstawie art. 2 ust. 1 oraz art. 10 ust. 1 ustawy z dnia 6 września 2001 r. o dostępie do informacji publicznej (Dz.U. 2001 nr 112 poz. 1198 z późn. zm.), zwracam się o udostępnienie następujących informacji:
Zakres wniosku:
Forma udostępnienia: Preferowanym formatem jest plik CSV lub XLSX. Dopuszczam także format PDF, jeśli dane nie są dostępne w innym formacie, przy czym uprzejmie proszę w takim wypadku o wskazanie, czy istnieje wersja maszynowo-czytelna.
Sposób przekazania: Proszę o przesłanie informacji na adres e-mail: a.kowalska@przyklad.pl.
Jednocześnie informuję, że zgodnie z art. 13 ust. 1 ustawy, termin realizacji wniosku wynosi 14 dni od dnia złożenia.
Z poważaniem,
Anna Kowalska
Wniosek: ten list dostanie rzetelną odpowiedź. Ale z pięcioma poprawkami powyżej dostanie odpowiedź szczegółową, porównywalną i bezdyskusyjną. Każde z tych usprawnień to 10 dodatkowych słów w treści wniosku.
Prześledźmy workflow na jednym, konkretnym przykładzie. To będzie model dla waszego ćwiczenia po przerwie.
Temat ogólny: „Zdrowie w Polsce” — zbyt szeroki.
Pytanie badawcze: „Jak zmieniła się liczba zachorowań na cukrzycę typu 2 w latach 2015–2023 w województwie mazowieckim, w podziale na powiaty?“
Co jest konkretnego w tym pytaniu:
| Element | Nasz wybór |
|---|---|
| Co mierzymy? | Nowe rozpoznania cukrzycy typu 2 (nie wszystkie) |
| Gdzie? | Województwo mazowieckie, podział powiatowy |
| Kiedy? | 2015–2023 |
| W podziale na co? | Powiat + rok |
| Źródło | Potencjalna wartość |
|---|---|
| NFZ | Hospitalizacje, wizyty — bezpośrednio odpowiada na pytanie |
| GUS BDL | Populacja powiatów (do obliczania wskaźnika na 100k) |
| Ministerstwo Zdrowia | Sprawozdania, ale często zagregowane |
| NIZP-PZH | Raporty epidemiologiczne |
| Polski Związek Diabetyków | Dane wtórne, zagregowane — mało użyteczne dla nas |
Nauka: dwa źródła wystarczą na starcie — NFZ (główne) + GUS BDL (populacja dla wskaźnika). Reszta to rezerwa.
| Źródło | Dostępność | Format | Aktualność | Podział |
|---|---|---|---|---|
| NFZ | dane.gov.pl | CSV | 2023 | Województwa ✓ Powiaty? |
| GUS BDL | API / portal | CSV, Excel | 2023 | Wszystkie poziomy ✓ |
Decyzja: NFZ jako główne źródło. Sprawdzamy od razu (zanim przejdziemy dalej), czy dane są dostępne w podziale powiatowym. Jeśli tylko wojewódzkie — trzeba zawęzić pytanie, albo złożyć wniosek o informację publiczną o dane szczegółowe.
Cały ten workflow mieści się na dwóch stronach A4. To jest plan, który zastosujecie do swojego projektu.
Zanim zainwestujecie tygodnie w projekt, określcie z góry warunki, w których się wycofacie.
Dlaczego to ważne: dyscyplina kill criteria oszczędza wam wstydu w tygodniu 8, gdy okazuje się, że dane nigdy nie istniały.
Cel: każda grupa wychodzi z tej części z trzema elementami, na których zbuduje workflow:
Dalszym krokiem będą konkretne źródła i plan ich sprawdzenia — ale najpierw wiemy, o co pytamy i dlaczego akurat tak.
Pracujcie w tempie “szkicu” — nie szukacie dziś idealnych odpowiedzi, tylko roboczych wersji na których zbudujecie workflow.
Przy tworzeniu lub doszlifowaniu pytania sprawdźcie, czy temat spełnia wszystkie sześć:
Jeśli któryś z sześciu punktów nie działa, zmieńcie pytanie teraz — nie za dwa tygodnie.
Jeśli widzicie którąś flagę — macie jeszcze 5 minut. Użyjcie ich na poprawienie pytania albo zmianę kierunku. Nie bójcie się zacząć od nowa teraz.
Po tych 10 minutach w waszym dokumencie grupy powinny się znaleźć:
Teraz, gdy wiecie o co pytacie i dlaczego, workflow 1–3 ma dużo większe szanse powieść się za pierwszym razem.
Zasada: lepiej każdy krok solidnie niż wszystkie powierzchownie. Wchodzicie na stronę źródła — nie wpisujecie tylko nazwy instytucji.
Jedna osoba z grupy wysyła na Classroom dokument (2–3 strony, styl planu, nie eseju) obejmujący:
Dokument ma być roboczy — tabele, listy, punkty. Będziecie do niego wracać przez cały semestr. Na jego podstawie prezentujecie plan na początku seminarium 3.
Podstawy dziennikarstwa danych (DZ.N13.T26.A)