Dokumentacja projektu
Dziennikarstwo danych — Projekt zaliczeniowy
1. Temat projektu
Tytuł: Bez biletu, bez pracy: wykluczenie transportowe na polskiej prowincji
Uzasadnienie wyboru tematu
Wykluczenie transportowe to problem strukturalny, który w ciągu ostatnich dwóch dekad fundamentalnie zmienił warunki życia kilku milionów mieszkańców polskich gmin wiejskich i małych miast. Wybraliśmy ten temat z kilku powodów:
Aktualność i waga społeczna — zjawisko dotyczy około 13% polskich gmin, w których mieszka łącznie blisko dwa miliony osób. Wciąż jednak jest tematem niedoreprezentowanym w mediach ogólnopolskich w stosunku do skali.
Wymiar generacyjny i klasowy — wykluczenie transportowe w nieproporcjonalny sposób dotyka seniorów, młodzieży i osób o niższych dochodach. Dobrze ilustruje szerszy problem „dwóch Polsek” i mechanizmy peryferyzacji.
Dostępność i różnorodność danych — istnieją dane GUS, ministerialne, samorządowe oraz niezależne raporty (Klub Jagielloński), a także materiał porównawczy w statystykach Eurostat.
Potencjał wizualizacyjny — temat pozwala na wykorzystanie różnorodnych form wizualizacji: wykresów czasowych (zapaść PKS po 2000 r.), map regionalnych (geografia wykluczenia), wykresów porównawczych (Polska vs. sąsiedzi), analiz demograficznych.
2. Źródła danych
Wszystkie wykorzystane dane pochodzą z oficjalnych, publicznych źródeł statystycznych oraz z uznanych opracowań think tanków i instytucji badawczych:
| Źródło | Dane | Link |
|---|---|---|
| GUS Bank Danych Lokalnych | Struktura gmin, motoryzacja, demografia | bdl.stat.gov.pl |
| Ministerstwo Infrastruktury | Fundusz Rozwoju Przewozów Autobusowych, liczba linii | gov.pl/infrastruktura |
| Klub Jagielloński | Raporty „Wykluczenie transportowe w Polsce” (2022, 2024) | klubjagiellonski.pl |
| Związek Powiatów Polskich | Stan transportu publicznego w powiatach | zpp.pl |
| Eurostat Transport Statistics | Porównania europejskie, wydatki publiczne | ec.europa.eu/eurostat |
| UITP Public Transport Trends | Międzynarodowe wskaźniki transportu regionalnego | uitp.org |
| GUS Badanie Podróży Mieszkańców Polski | Udział środków transportu w dojazdach | stat.gov.pl |
Metoda pozyskania: Dane zostały pobrane z BDL GUS za pomocą oficjalnego API oraz bezpośrednio ze stron ministerstwa, Klubu Jagiellońskiego i Eurostatu w formacie CSV/Excel. Raporty Klubu Jagiellońskiego posłużyły jako źródło metodologii operacyjnej definicji gminy wykluczonej transportowo.
3. Metody analizy danych
Wskaźniki i miary
- Wykluczenie transportowe — gmina, w której w dzień roboczy nie odbywa się żaden kurs umożliwiający dojazd do siedziby powiatu i powrót tego samego dnia (definicja Klubu Jagiellońskiego)
- Wskaźnik motoryzacji — liczba samochodów osobowych na 1000 mieszkańców
- Udział środków transportu — procentowy rozkład podróży między wsią a miastem według środka transportu
- Subwencja na transport regionalny — roczne wydatki publiczne (budżet centralny + regionalny) na transport regionalny per capita, w euro
Techniki analityczne
- Analiza porównawcza czasowa — zestawienie wskaźników z lat 2000, 2010, 2020 i 2024 w celu ukazania trendu zapaści PKS i dynamiki udziałów środków transportu
- Analiza regionalna — porównanie 16 województw pod kątem odsetka gmin wykluczonych
- Analiza demograficzna — rozbicie wykluczenia transportowego wg grup wiekowych
- Analiza porównawcza międzynarodowa — zestawienie Polski z sąsiadami (Niemcy, Czechy, Słowacja, Węgry) oraz krajami wzorcowymi (Szwajcaria, Austria)
- Wizualizacja zależności — scatter plot wielkości gminy a wskaźnika motoryzacji (skala logarytmiczna)
Ograniczenia metodologiczne
- Definicja gminy wykluczonej jest binarna — nie uchwytuje gradacji problemu (gmina z dwoma kursami dziennie nie jest „wykluczona”, ale jest trudno dostępna)
- Dane o liczbie połączeń PKS za lata 2000–2008 pochodzą częściowo z rekonstrukcji na podstawie archiwalnych rozkładów, co wprowadza pewien margines niepewności
- Porównania międzynarodowe: kategoryzacja „transportu regionalnego” różni się w różnych krajach
- Dane o prywatnych busach są niepełne — rynek był przez lata słabo regulowany
4. Narzędzia wizualizacyjne
| Narzędzie | Zastosowanie |
|---|---|
| R (tidyverse, ggplot2) | Przetwarzanie danych i tworzenie wszystkich wizualizacji |
| Quarto | Integracja kodu, tekstu i wizualizacji w formacie publikacyjnym |
| showtext | Typografia (czcionka Jost) |
| ggtext | Formatowanie tekstu w wykresach |
| scales | Formatowanie osi (procenty, wartości pieniężne) |
Decyzje projektowe dotyczące wizualizacji
- Paleta kolorów: niebieski (#2E86AB) dla wartości historycznych/pozytywnych (rok 2010, transport publiczny), czerwony (#E94F37) dla wartości współczesnych/problematycznych (rok 2024, samochód jako dominujący środek), kolor dodatkowy (#A23B72) dla kolei, żółty (#F6AE2D) dla busów prywatnych
- Typy wykresów: wykres „dumbbell” dla zmian regionalnych w czasie; stacked area dla ewolucji udziałów środków transportu; scatter plot (log) dla zależności wielkości gminy i motoryzacji; wykresy słupkowe poziome dla porównań międzynarodowych
- Przejrzystość: minimalistyczny design, ograniczenie linii siatki, bezpośrednie etykiety wartości zamiast legendy tam, gdzie to możliwe
5. Podział zadań w grupie
| Osoba | Odpowiedzialność |
|---|---|
| Katarzyna Malinowska | Koordynacja projektu, research raportów Klubu Jagiellońskiego, redakcja tekstu narracyjnego i wywiadów |
| Tomasz Lewandowski | Pozyskiwanie danych z BDL GUS i Eurostat, czyszczenie danych, kontrola jakości |
| Agnieszka Dąbrowska | Analiza danych w R, tworzenie wizualizacji, kodowanie w Quarto, projekt typograficzny |
| Michał Kaczmarek | Kontekst tematyczny (polityka transportowa UE i Polski), cytaty ekspertów, korekta stylistyczna |
Wspólnie: Dyskusja nad narracją, dobór case study (rozmowa z panią Heleną Grzybowską została przeprowadzona przez Katarzynę i Michała w Wólce Dobryńskiej), wybór kluczowych danych do prezentacji, przygotowanie prezentacji końcowej.
6. Refleksja krytyczna
Mocne strony projektu
- Wykorzystanie zarówno oficjalnych danych państwowych (GUS, ministerstwo), jak i niezależnych opracowań think tanków (Klub Jagielloński), co pozwala na triangulację informacji
- Kontekst międzynarodowy, unikający interpretacji zjawiska jako „nieuchronnego” — Czechy i Słowacja pokazują, że inna polityka jest możliwa
- Spójna narracja łącząca dane makro z indywidualną historią (pani Helena)
- Jasne operacyjne zdefiniowanie problemu (definicja KJ) zamiast intuicyjnych ocen
Ograniczenia i wyzwania
- Nie przeprowadziliśmy własnego badania terenowego na próbie reprezentatywnej — opieramy się na jednym case study i na danych wtórnych
- Dane o kosztach ekonomicznych wykluczenia (szacunek 4–6 mld zł) pochodzą z pojedynczego opracowania eksperckiego i mają charakter szacunku
- Brakuje w analizie danych o rzeczywistym wykorzystaniu nowych linii uruchomionych w ramach FRPA — możliwe, że niektóre z nich funkcjonują tylko nominalnie
- Perspektywa samorządów lokalnych (wójtów, starostów) jest w naszym materiale słabo reprezentowana; w kolejnej iteracji projektu warto byłoby ją poszerzyć
Kwestie etyczne
- Rozmowa z panią Heleną Grzybowską została zarejestrowana za jej zgodą; imię i nazwisko wykorzystano także za jej zgodą
- Staraliśmy się unikać paternalistycznego tonu i traktowania mieszkańców wsi jako biernych ofiar — wyeksponowaliśmy strukturalny, systemowy charakter problemu
- Wyraźnie odróżniliśmy dane bezpośrednie od szacunków eksperckich
- Nie manipulowaliśmy skalami osi w celu wyolbrzymienia różnic; dla porównania stanu z 2010 i 2024 roku wybraliśmy ten sam zakres osi
- Dane o grupach wiekowych przedstawiono w kontekście, bez sugestii, że osoby starsze „same sobie są winne” braku mobilności