Dokumentacja projektu

Dziennikarstwo danych — Projekt zaliczeniowy

Autorzy

Aleksandra Wójcik

Tomasz Krawczyk

Katarzyna Lewandowska

Michał Dąbrowski

Opublikowano

15 maja 2026

1. Temat projektu

Tytuł: Wymieranie polskiej prowincji: kryzys demograficzny w powiatach Polski wschodniej i zachodniej

Uzasadnienie wyboru tematu

Kryzys demograficzny jest jednym z najważniejszych, a zarazem najmniej nagłośnionych medialnie problemów strukturalnych współczesnej Polski. Wybraliśmy ten temat z kilku powodów:

  1. Waga problemu — procesy demograficzne determinują niemal wszystkie inne polityki publiczne: edukację, system emerytalny, ochronę zdrowia, rynek pracy, politykę regionalną. Bez zrozumienia skali depopulacji trudno racjonalnie dyskutować o którymkolwiek z tych obszarów.

  2. Nierówność regionalna — Polska demograficzna od dwóch dekad dzieli się na dwie wyraźnie odrębne rzeczywistości: rozrastające się aglomeracje i wyludniające się peryferie. Temat pozwala pokazać, jak zagregowane statystyki krajowe ukrywają dramatyczne różnice wewnątrzkrajowe.

  3. Dostępność danych — GUS publikuje w Banku Danych Lokalnych bardzo szczegółowe dane demograficzne na poziomie powiatów. Dane Eurostatu umożliwiają porównanie z innymi państwami UE. Łatwość pozyskania danych otwiera pole dla analiz, które wykraczają poza proste cytowanie wskaźników ogólnokrajowych.

  4. Potencjał wizualizacyjny — temat pozwala zastosować różnorodne formy prezentacji: piramidy wieku, mapy choropletyczne, wykresy typu dumbbell pokazujące zmiany w czasie, wykresy rozrzutu wiążące różne zmienne demograficzne.

2. Źródła danych

Wszystkie wykorzystane dane pochodzą z oficjalnych, publicznych źródeł statystycznych lub z raportów eksperckich publikowanych przez uznane instytucje badawcze.

Źródło Dane Link
GUS Bank Danych Lokalnych Ludność powiatów 2004–2024, mediana wieku, saldo migracji bdl.stat.gov.pl
GUS Rocznik Demograficzny 2024 Urodzenia, zgony, struktura wieku Polski 1990–2024 stat.gov.pl/demografia
GUS Narodowy Spis Powszechny 2021 Struktura demograficzna według gmin i powiatów spis.gov.pl
Eurostat (demo_r_mlifexp) Dzietność i długość życia w regionach UE ec.europa.eu/eurostat
Instytut Pokolenia — Raport „Dzietność w polskich powiatach 2024” Zróżnicowanie TFR na poziomie powiatowym instytutpokolenia.pl
Zakład Demografii SGH Komentarze eksperckie, wywiady z prof. Markiem Sierakowskim n/d (wywiad własny)

Metoda pozyskania: Dane tabelaryczne pobrane zostały bezpośrednio ze stron instytucji w formacie CSV/XLSX (GUS BDL udostępnia eksport do CSV). Dane Eurostatu pobrane przez pakiet R eurostat. Raport Instytutu Pokolenia udostępniony w formacie PDF, dane zostały wyekstrahowane ręcznie do tabeli CSV. Wszystkie pliki źródłowe znajdują się w katalogu data/ projektu.

3. Metody analizy danych

Wskaźniki i miary

  • Współczynnik dzietności (TFR) — teoretyczna liczba dzieci urodzonych przez jedną kobietę w wieku rozrodczym przy utrzymaniu bieżących cząstkowych współczynników urodzeń
  • Przyrost naturalny — różnica między liczbą urodzeń żywych i liczbą zgonów w danym okresie
  • Mediana wieku — wartość dzielącą populację na dwie równoliczne części pod względem wieku
  • Saldo migracji wewnętrznych — różnica między napływem a odpływem ludności wyrażona na 1000 mieszkańców
  • Zmiana ludności — procentowa zmiana liczby mieszkańców w okresie 2004–2024

Techniki analityczne

  1. Analiza szeregów czasowych — trendy urodzeń i zgonów w latach 1990–2024 w celu ukazania momentu demograficznego przełomu
  2. Analiza porównawcza regionalna — zestawienie 20 powiatów (10 peryferyjnych + 5 metropolitalnych + 5 podmiejskich) dla zilustrowania polaryzacji
  3. Analiza zmian strukturalnych — porównanie piramid wieku z lat 1990 i 2024
  4. Analiza korelacyjna — wizualne powiązanie salda migracji z medianą wieku na poziomie województw
  5. Analiza powiatowa TFR — zestawienie dzietności w metropoliach i powiatach peryferyjnych

Ograniczenia metodologiczne

  • Współczynnik dzietności na poziomie powiatowym obliczony na małych liczbach urodzeń ma wyższy błąd losowy — zastosowano średnie trzyletnie (2022–2024)
  • Analiza nie uwzględnia migracji międzynarodowych, w tym napływu uchodźców z Ukrainy po 2022 roku, który częściowo rekompensuje ujemne saldo migracji wewnętrznych w niektórych regionach
  • Granice administracyjne niektórych powiatów zmieniały się w analizowanym okresie — dane skorygowane do aktualnego podziału
  • Porównania piramid wieku dotyczą całej Polski, nie pozwalają zobaczyć wewnątrzkrajowych różnic regionalnych

4. Narzędzia wizualizacyjne

Narzędzie Zastosowanie
R (tidyverse, ggplot2) Przetwarzanie danych i tworzenie wszystkich wizualizacji
Quarto Integracja kodu, tekstu i wizualizacji w formacie publikacyjnym HTML
showtext Typografia (czcionka Jost z Google Fonts)
ggtext Formatowanie tekstu w wykresach (kolorowe podpisy inline)
scales Formatowanie etykiet osi (procenty, jednostki tysiąca)
eurostat (R package) Dostęp programistyczny do bazy Eurostat

Decyzje projektowe dotyczące wizualizacji

  • Paleta kolorów: niebieski (#2E86AB) dla wartości referencyjnych i pozytywnych (zyskujące regiony, dane z przeszłości); czerwony (#E94F37) dla wartości negatywnych i alarmujących (tracące regiony, dane bieżące); zielony (#4CAF50) dla kategorii pośredniej (obwarzanki metropolitalne)
  • Typ wykresów: wykresy typu dumbbell dla pokazania zmian między dwiema datami (mediana wieku 2004 vs 2024); piramida wieku jako klasyczny wykres słupkowy lustrzany; wykres rozrzutu dla relacji migracja–starzenie; wykres słupkowy poziomy dla porównań powiatowych (dla czytelności nazw)
  • Przejrzystość: minimalistyczny design, ograniczenie linii siatki, bezpośrednie etykiety liczbowe zamiast legend, gdzie to możliwe
  • Progi referencyjne: oznaczono wartość 2,1 (próg zastępowalności pokoleń) na wykresie TFR, aby dać czytelnikowi punkt odniesienia

5. Podział zadań w grupie

Osoba Odpowiedzialność
Aleksandra Wójcik Koordynacja projektu, research źródeł, wywiady z ekspertami, redakcja tekstu narracyjnego
Tomasz Krawczyk Pobranie i wstępne przetworzenie danych z GUS BDL i Eurostatu, kontrola jakości danych, dokumentacja CSV
Katarzyna Lewandowska Analiza danych w R, tworzenie wizualizacji, kodowanie w Quarto, renderowanie finalnego dokumentu
Michał Dąbrowski Kontekst tematyczny (polityka regionalna, demografia), kontakty z Instytutem Pokolenia, korekta redakcyjna

Wspólnie: Dyskusja nad narracją i hipotezami, wybór kluczowych powiatów i województw do prezentacji, decyzje kolorystyczne i typograficzne, przygotowanie prezentacji końcowej.

6. Refleksja krytyczna

Mocne strony projektu

  • Wykorzystanie wyłącznie oficjalnych źródeł statystycznych oraz jednego raportu eksperckiego instytucji niekomercyjnej
  • Wielowymiarowa analiza łącząca perspektywę krajową, regionalną i powiatową
  • Spójna narracja łącząca dane z kontekstem społecznym — otwarcie i zamknięcie reportażowe („case study” nauczycielki z Dubicz Cerkiewnych) wprowadzają ludzką skalę do statystycznych trendów
  • Klarowne oddzielenie danych od ich interpretacji — metodologia opisana w osobnej sekcji, założenia kalkulacji jawnie podane

Ograniczenia i wyzwania

  • Największym wyzwaniem była integracja danych z różnych poziomów agregacji (kraj, województwo, powiat) — różne źródła używają różnych roczników bazowych, co wymagało ręcznej harmonizacji
  • Brak dostępu do danych jednostkowych (mikrodanych NSP 2021) — opieramy się na agregatach publikowanych przez GUS
  • Pominięcie migracji międzynarodowych — zwłaszcza po 2022 roku — stanowi znaczące ograniczenie, którego nie udało nam się usunąć ze względu na brak wiarygodnych danych na poziomie powiatowym
  • Wybór 20 powiatów prezentowanych na wykresie porównawczym jest arbitralny — zostały dobrane jako skrajne przypadki trzech kategorii, nie są statystycznie reprezentatywne

Kwestie etyczne

  • Nie manipulowaliśmy skalami osi w celu wyolbrzymienia różnic — wszystkie wykresy zaczynają się od zera lub od wartości merytorycznie uzasadnionej (wykres mediany wieku od 32 lat, bo wartości niższe nie występują)
  • Unikaliśmy generalizacji na podstawie pojedynczych wskaźników — szczególnie w przypadku niskiego TFR na poziomie powiatowym, gdzie podkreśliliśmy wysoki błąd losowy
  • Cytaty mieszkańców wyludniających się regionów wykorzystaliśmy za ich wyraźną zgodą i po pokazaniu im finalnej wersji tekstu
  • Staraliśmy się unikać tonu sensacyjnego czy apokaliptycznego — tytuł „Wymieranie polskiej prowincji” jest świadomie mocny, ale treść reportażu pokazuje procesy stopniowe, a w zakończeniu wprowadzamy perspektywę polityki publicznej zamiast zamykać tekst katastroficzną konkluzją
  • Respektujemy podmiotowość mieszkańców peryferyjnych powiatów — oddaliśmy głos nauczycielce jako narratorce otwierającej i zamykającej tekst, nie traktując jej wyłącznie jako ilustracji statystyk