Dokumentacja projektu
Dziennikarstwo danych — Projekt zaliczeniowy
1. Temat projektu
Tytuł: Wymieranie polskiej prowincji: kryzys demograficzny w powiatach Polski wschodniej i zachodniej
Uzasadnienie wyboru tematu
Kryzys demograficzny jest jednym z najważniejszych, a zarazem najmniej nagłośnionych medialnie problemów strukturalnych współczesnej Polski. Wybraliśmy ten temat z kilku powodów:
Waga problemu — procesy demograficzne determinują niemal wszystkie inne polityki publiczne: edukację, system emerytalny, ochronę zdrowia, rynek pracy, politykę regionalną. Bez zrozumienia skali depopulacji trudno racjonalnie dyskutować o którymkolwiek z tych obszarów.
Nierówność regionalna — Polska demograficzna od dwóch dekad dzieli się na dwie wyraźnie odrębne rzeczywistości: rozrastające się aglomeracje i wyludniające się peryferie. Temat pozwala pokazać, jak zagregowane statystyki krajowe ukrywają dramatyczne różnice wewnątrzkrajowe.
Dostępność danych — GUS publikuje w Banku Danych Lokalnych bardzo szczegółowe dane demograficzne na poziomie powiatów. Dane Eurostatu umożliwiają porównanie z innymi państwami UE. Łatwość pozyskania danych otwiera pole dla analiz, które wykraczają poza proste cytowanie wskaźników ogólnokrajowych.
Potencjał wizualizacyjny — temat pozwala zastosować różnorodne formy prezentacji: piramidy wieku, mapy choropletyczne, wykresy typu dumbbell pokazujące zmiany w czasie, wykresy rozrzutu wiążące różne zmienne demograficzne.
2. Źródła danych
Wszystkie wykorzystane dane pochodzą z oficjalnych, publicznych źródeł statystycznych lub z raportów eksperckich publikowanych przez uznane instytucje badawcze.
| Źródło | Dane | Link |
|---|---|---|
| GUS Bank Danych Lokalnych | Ludność powiatów 2004–2024, mediana wieku, saldo migracji | bdl.stat.gov.pl |
| GUS Rocznik Demograficzny 2024 | Urodzenia, zgony, struktura wieku Polski 1990–2024 | stat.gov.pl/demografia |
| GUS Narodowy Spis Powszechny 2021 | Struktura demograficzna według gmin i powiatów | spis.gov.pl |
| Eurostat (demo_r_mlifexp) | Dzietność i długość życia w regionach UE | ec.europa.eu/eurostat |
| Instytut Pokolenia — Raport „Dzietność w polskich powiatach 2024” | Zróżnicowanie TFR na poziomie powiatowym | instytutpokolenia.pl |
| Zakład Demografii SGH | Komentarze eksperckie, wywiady z prof. Markiem Sierakowskim | n/d (wywiad własny) |
Metoda pozyskania: Dane tabelaryczne pobrane zostały bezpośrednio ze stron instytucji w formacie CSV/XLSX (GUS BDL udostępnia eksport do CSV). Dane Eurostatu pobrane przez pakiet R eurostat. Raport Instytutu Pokolenia udostępniony w formacie PDF, dane zostały wyekstrahowane ręcznie do tabeli CSV. Wszystkie pliki źródłowe znajdują się w katalogu data/ projektu.
3. Metody analizy danych
Wskaźniki i miary
- Współczynnik dzietności (TFR) — teoretyczna liczba dzieci urodzonych przez jedną kobietę w wieku rozrodczym przy utrzymaniu bieżących cząstkowych współczynników urodzeń
- Przyrost naturalny — różnica między liczbą urodzeń żywych i liczbą zgonów w danym okresie
- Mediana wieku — wartość dzielącą populację na dwie równoliczne części pod względem wieku
- Saldo migracji wewnętrznych — różnica między napływem a odpływem ludności wyrażona na 1000 mieszkańców
- Zmiana ludności — procentowa zmiana liczby mieszkańców w okresie 2004–2024
Techniki analityczne
- Analiza szeregów czasowych — trendy urodzeń i zgonów w latach 1990–2024 w celu ukazania momentu demograficznego przełomu
- Analiza porównawcza regionalna — zestawienie 20 powiatów (10 peryferyjnych + 5 metropolitalnych + 5 podmiejskich) dla zilustrowania polaryzacji
- Analiza zmian strukturalnych — porównanie piramid wieku z lat 1990 i 2024
- Analiza korelacyjna — wizualne powiązanie salda migracji z medianą wieku na poziomie województw
- Analiza powiatowa TFR — zestawienie dzietności w metropoliach i powiatach peryferyjnych
Ograniczenia metodologiczne
- Współczynnik dzietności na poziomie powiatowym obliczony na małych liczbach urodzeń ma wyższy błąd losowy — zastosowano średnie trzyletnie (2022–2024)
- Analiza nie uwzględnia migracji międzynarodowych, w tym napływu uchodźców z Ukrainy po 2022 roku, który częściowo rekompensuje ujemne saldo migracji wewnętrznych w niektórych regionach
- Granice administracyjne niektórych powiatów zmieniały się w analizowanym okresie — dane skorygowane do aktualnego podziału
- Porównania piramid wieku dotyczą całej Polski, nie pozwalają zobaczyć wewnątrzkrajowych różnic regionalnych
4. Narzędzia wizualizacyjne
| Narzędzie | Zastosowanie |
|---|---|
| R (tidyverse, ggplot2) | Przetwarzanie danych i tworzenie wszystkich wizualizacji |
| Quarto | Integracja kodu, tekstu i wizualizacji w formacie publikacyjnym HTML |
| showtext | Typografia (czcionka Jost z Google Fonts) |
| ggtext | Formatowanie tekstu w wykresach (kolorowe podpisy inline) |
| scales | Formatowanie etykiet osi (procenty, jednostki tysiąca) |
| eurostat (R package) | Dostęp programistyczny do bazy Eurostat |
Decyzje projektowe dotyczące wizualizacji
- Paleta kolorów: niebieski (#2E86AB) dla wartości referencyjnych i pozytywnych (zyskujące regiony, dane z przeszłości); czerwony (#E94F37) dla wartości negatywnych i alarmujących (tracące regiony, dane bieżące); zielony (#4CAF50) dla kategorii pośredniej (obwarzanki metropolitalne)
- Typ wykresów: wykresy typu dumbbell dla pokazania zmian między dwiema datami (mediana wieku 2004 vs 2024); piramida wieku jako klasyczny wykres słupkowy lustrzany; wykres rozrzutu dla relacji migracja–starzenie; wykres słupkowy poziomy dla porównań powiatowych (dla czytelności nazw)
- Przejrzystość: minimalistyczny design, ograniczenie linii siatki, bezpośrednie etykiety liczbowe zamiast legend, gdzie to możliwe
- Progi referencyjne: oznaczono wartość 2,1 (próg zastępowalności pokoleń) na wykresie TFR, aby dać czytelnikowi punkt odniesienia
5. Podział zadań w grupie
| Osoba | Odpowiedzialność |
|---|---|
| Aleksandra Wójcik | Koordynacja projektu, research źródeł, wywiady z ekspertami, redakcja tekstu narracyjnego |
| Tomasz Krawczyk | Pobranie i wstępne przetworzenie danych z GUS BDL i Eurostatu, kontrola jakości danych, dokumentacja CSV |
| Katarzyna Lewandowska | Analiza danych w R, tworzenie wizualizacji, kodowanie w Quarto, renderowanie finalnego dokumentu |
| Michał Dąbrowski | Kontekst tematyczny (polityka regionalna, demografia), kontakty z Instytutem Pokolenia, korekta redakcyjna |
Wspólnie: Dyskusja nad narracją i hipotezami, wybór kluczowych powiatów i województw do prezentacji, decyzje kolorystyczne i typograficzne, przygotowanie prezentacji końcowej.
6. Refleksja krytyczna
Mocne strony projektu
- Wykorzystanie wyłącznie oficjalnych źródeł statystycznych oraz jednego raportu eksperckiego instytucji niekomercyjnej
- Wielowymiarowa analiza łącząca perspektywę krajową, regionalną i powiatową
- Spójna narracja łącząca dane z kontekstem społecznym — otwarcie i zamknięcie reportażowe („case study” nauczycielki z Dubicz Cerkiewnych) wprowadzają ludzką skalę do statystycznych trendów
- Klarowne oddzielenie danych od ich interpretacji — metodologia opisana w osobnej sekcji, założenia kalkulacji jawnie podane
Ograniczenia i wyzwania
- Największym wyzwaniem była integracja danych z różnych poziomów agregacji (kraj, województwo, powiat) — różne źródła używają różnych roczników bazowych, co wymagało ręcznej harmonizacji
- Brak dostępu do danych jednostkowych (mikrodanych NSP 2021) — opieramy się na agregatach publikowanych przez GUS
- Pominięcie migracji międzynarodowych — zwłaszcza po 2022 roku — stanowi znaczące ograniczenie, którego nie udało nam się usunąć ze względu na brak wiarygodnych danych na poziomie powiatowym
- Wybór 20 powiatów prezentowanych na wykresie porównawczym jest arbitralny — zostały dobrane jako skrajne przypadki trzech kategorii, nie są statystycznie reprezentatywne
Kwestie etyczne
- Nie manipulowaliśmy skalami osi w celu wyolbrzymienia różnic — wszystkie wykresy zaczynają się od zera lub od wartości merytorycznie uzasadnionej (wykres mediany wieku od 32 lat, bo wartości niższe nie występują)
- Unikaliśmy generalizacji na podstawie pojedynczych wskaźników — szczególnie w przypadku niskiego TFR na poziomie powiatowym, gdzie podkreśliliśmy wysoki błąd losowy
- Cytaty mieszkańców wyludniających się regionów wykorzystaliśmy za ich wyraźną zgodą i po pokazaniu im finalnej wersji tekstu
- Staraliśmy się unikać tonu sensacyjnego czy apokaliptycznego — tytuł „Wymieranie polskiej prowincji” jest świadomie mocny, ale treść reportażu pokazuje procesy stopniowe, a w zakończeniu wprowadzamy perspektywę polityki publicznej zamiast zamykać tekst katastroficzną konkluzją
- Respektujemy podmiotowość mieszkańców peryferyjnych powiatów — oddaliśmy głos nauczycielce jako narratorce otwierającej i zamykającej tekst, nie traktując jej wyłącznie jako ilustracji statystyk