Dokumentacja projektu

Dziennikarstwo danych — Projekt zaliczeniowy

Autorzy

Katarzyna Malinowska

Tomasz Lewandowski

Agnieszka Dąbrowska

Michał Kaczmarek

Opublikowano

15 maja 2026

1. Temat projektu

Tytuł: Bez biletu, bez pracy: wykluczenie transportowe na polskiej prowincji

Uzasadnienie wyboru tematu

Wykluczenie transportowe to problem strukturalny, który w ciągu ostatnich dwóch dekad fundamentalnie zmienił warunki życia kilku milionów mieszkańców polskich gmin wiejskich i małych miast. Wybraliśmy ten temat z kilku powodów:

  1. Aktualność i waga społeczna — zjawisko dotyczy około 13% polskich gmin, w których mieszka łącznie blisko dwa miliony osób. Wciąż jednak jest tematem niedoreprezentowanym w mediach ogólnopolskich w stosunku do skali.

  2. Wymiar generacyjny i klasowy — wykluczenie transportowe w nieproporcjonalny sposób dotyka seniorów, młodzieży i osób o niższych dochodach. Dobrze ilustruje szerszy problem „dwóch Polsek” i mechanizmy peryferyzacji.

  3. Dostępność i różnorodność danych — istnieją dane GUS, ministerialne, samorządowe oraz niezależne raporty (Klub Jagielloński), a także materiał porównawczy w statystykach Eurostat.

  4. Potencjał wizualizacyjny — temat pozwala na wykorzystanie różnorodnych form wizualizacji: wykresów czasowych (zapaść PKS po 2000 r.), map regionalnych (geografia wykluczenia), wykresów porównawczych (Polska vs. sąsiedzi), analiz demograficznych.

2. Źródła danych

Wszystkie wykorzystane dane pochodzą z oficjalnych, publicznych źródeł statystycznych oraz z uznanych opracowań think tanków i instytucji badawczych:

Źródło Dane Link
GUS Bank Danych Lokalnych Struktura gmin, motoryzacja, demografia bdl.stat.gov.pl
Ministerstwo Infrastruktury Fundusz Rozwoju Przewozów Autobusowych, liczba linii gov.pl/infrastruktura
Klub Jagielloński Raporty „Wykluczenie transportowe w Polsce” (2022, 2024) klubjagiellonski.pl
Związek Powiatów Polskich Stan transportu publicznego w powiatach zpp.pl
Eurostat Transport Statistics Porównania europejskie, wydatki publiczne ec.europa.eu/eurostat
UITP Public Transport Trends Międzynarodowe wskaźniki transportu regionalnego uitp.org
GUS Badanie Podróży Mieszkańców Polski Udział środków transportu w dojazdach stat.gov.pl

Metoda pozyskania: Dane zostały pobrane z BDL GUS za pomocą oficjalnego API oraz bezpośrednio ze stron ministerstwa, Klubu Jagiellońskiego i Eurostatu w formacie CSV/Excel. Raporty Klubu Jagiellońskiego posłużyły jako źródło metodologii operacyjnej definicji gminy wykluczonej transportowo.

3. Metody analizy danych

Wskaźniki i miary

  • Wykluczenie transportowe — gmina, w której w dzień roboczy nie odbywa się żaden kurs umożliwiający dojazd do siedziby powiatu i powrót tego samego dnia (definicja Klubu Jagiellońskiego)
  • Wskaźnik motoryzacji — liczba samochodów osobowych na 1000 mieszkańców
  • Udział środków transportu — procentowy rozkład podróży między wsią a miastem według środka transportu
  • Subwencja na transport regionalny — roczne wydatki publiczne (budżet centralny + regionalny) na transport regionalny per capita, w euro

Techniki analityczne

  1. Analiza porównawcza czasowa — zestawienie wskaźników z lat 2000, 2010, 2020 i 2024 w celu ukazania trendu zapaści PKS i dynamiki udziałów środków transportu
  2. Analiza regionalna — porównanie 16 województw pod kątem odsetka gmin wykluczonych
  3. Analiza demograficzna — rozbicie wykluczenia transportowego wg grup wiekowych
  4. Analiza porównawcza międzynarodowa — zestawienie Polski z sąsiadami (Niemcy, Czechy, Słowacja, Węgry) oraz krajami wzorcowymi (Szwajcaria, Austria)
  5. Wizualizacja zależności — scatter plot wielkości gminy a wskaźnika motoryzacji (skala logarytmiczna)

Ograniczenia metodologiczne

  • Definicja gminy wykluczonej jest binarna — nie uchwytuje gradacji problemu (gmina z dwoma kursami dziennie nie jest „wykluczona”, ale jest trudno dostępna)
  • Dane o liczbie połączeń PKS za lata 2000–2008 pochodzą częściowo z rekonstrukcji na podstawie archiwalnych rozkładów, co wprowadza pewien margines niepewności
  • Porównania międzynarodowe: kategoryzacja „transportu regionalnego” różni się w różnych krajach
  • Dane o prywatnych busach są niepełne — rynek był przez lata słabo regulowany

4. Narzędzia wizualizacyjne

Narzędzie Zastosowanie
R (tidyverse, ggplot2) Przetwarzanie danych i tworzenie wszystkich wizualizacji
Quarto Integracja kodu, tekstu i wizualizacji w formacie publikacyjnym
showtext Typografia (czcionka Jost)
ggtext Formatowanie tekstu w wykresach
scales Formatowanie osi (procenty, wartości pieniężne)

Decyzje projektowe dotyczące wizualizacji

  • Paleta kolorów: niebieski (#2E86AB) dla wartości historycznych/pozytywnych (rok 2010, transport publiczny), czerwony (#E94F37) dla wartości współczesnych/problematycznych (rok 2024, samochód jako dominujący środek), kolor dodatkowy (#A23B72) dla kolei, żółty (#F6AE2D) dla busów prywatnych
  • Typy wykresów: wykres „dumbbell” dla zmian regionalnych w czasie; stacked area dla ewolucji udziałów środków transportu; scatter plot (log) dla zależności wielkości gminy i motoryzacji; wykresy słupkowe poziome dla porównań międzynarodowych
  • Przejrzystość: minimalistyczny design, ograniczenie linii siatki, bezpośrednie etykiety wartości zamiast legendy tam, gdzie to możliwe

5. Podział zadań w grupie

Osoba Odpowiedzialność
Katarzyna Malinowska Koordynacja projektu, research raportów Klubu Jagiellońskiego, redakcja tekstu narracyjnego i wywiadów
Tomasz Lewandowski Pozyskiwanie danych z BDL GUS i Eurostat, czyszczenie danych, kontrola jakości
Agnieszka Dąbrowska Analiza danych w R, tworzenie wizualizacji, kodowanie w Quarto, projekt typograficzny
Michał Kaczmarek Kontekst tematyczny (polityka transportowa UE i Polski), cytaty ekspertów, korekta stylistyczna

Wspólnie: Dyskusja nad narracją, dobór case study (rozmowa z panią Heleną Grzybowską została przeprowadzona przez Katarzynę i Michała w Wólce Dobryńskiej), wybór kluczowych danych do prezentacji, przygotowanie prezentacji końcowej.

6. Refleksja krytyczna

Mocne strony projektu

  • Wykorzystanie zarówno oficjalnych danych państwowych (GUS, ministerstwo), jak i niezależnych opracowań think tanków (Klub Jagielloński), co pozwala na triangulację informacji
  • Kontekst międzynarodowy, unikający interpretacji zjawiska jako „nieuchronnego” — Czechy i Słowacja pokazują, że inna polityka jest możliwa
  • Spójna narracja łącząca dane makro z indywidualną historią (pani Helena)
  • Jasne operacyjne zdefiniowanie problemu (definicja KJ) zamiast intuicyjnych ocen

Ograniczenia i wyzwania

  • Nie przeprowadziliśmy własnego badania terenowego na próbie reprezentatywnej — opieramy się na jednym case study i na danych wtórnych
  • Dane o kosztach ekonomicznych wykluczenia (szacunek 4–6 mld zł) pochodzą z pojedynczego opracowania eksperckiego i mają charakter szacunku
  • Brakuje w analizie danych o rzeczywistym wykorzystaniu nowych linii uruchomionych w ramach FRPA — możliwe, że niektóre z nich funkcjonują tylko nominalnie
  • Perspektywa samorządów lokalnych (wójtów, starostów) jest w naszym materiale słabo reprezentowana; w kolejnej iteracji projektu warto byłoby ją poszerzyć

Kwestie etyczne

  • Rozmowa z panią Heleną Grzybowską została zarejestrowana za jej zgodą; imię i nazwisko wykorzystano także za jej zgodą
  • Staraliśmy się unikać paternalistycznego tonu i traktowania mieszkańców wsi jako biernych ofiar — wyeksponowaliśmy strukturalny, systemowy charakter problemu
  • Wyraźnie odróżniliśmy dane bezpośrednie od szacunków eksperckich
  • Nie manipulowaliśmy skalami osi w celu wyolbrzymienia różnic; dla porównania stanu z 2010 i 2024 roku wybraliśmy ten sam zakres osi
  • Dane o grupach wiekowych przedstawiono w kontekście, bez sugestii, że osoby starsze „same sobie są winne” braku mobilności