Dokumentacja projektu

Dziennikarstwo danych — Projekt zaliczeniowy

Autorzy

Aleksandra Jaworska

Michał Dąbrowski

Karolina Stępień

Tomasz Mazur

Opublikowano

15 maja 2026

1. Temat projektu

Tytuł: Powietrze klasy średniej: Kto w Polsce oddycha czystszym powietrzem — geografia smogu i nierówności środowiskowych

Uzasadnienie wyboru tematu

Problem jakości powietrza w Polsce jest jednym z najważniejszych wyzwań zdrowotnych i społecznych współczesności. Wybraliśmy ten temat z następujących powodów:

  1. Aktualność — zimowy smog od lat pojawia się w debacie publicznej, a obowiązujące w poszczególnych województwach uchwały antysmogowe wkraczają właśnie w fazę, w której ich egzekwowanie staje się realnym testem politycznym.

  2. Wymiar społeczny — zanieczyszczenie powietrza odpowiada w Polsce za ok. 45 tys. przedwczesnych zgonów rocznie i dotyka w sposób nierównomierny mieszkańców różnych regionów. Problem ma wyraźny wymiar nierówności geograficznych, socjoekonomicznych i zdrowotnych.

  3. Dostępność danych — GIOŚ, KOBiZE, CEEB, Europejska Agencja Środowiska oraz WHO publikują szczegółowe, otwarte dane, które pozwalają na wielowymiarową analizę.

  4. Potencjał narracyjny i wizualizacyjny — sezonowość, amplituda między miastami oraz związek z warunkami społeczno-ekonomicznymi umożliwiają wykorzystanie różnorodnych form wizualizacji: szeregów czasowych, map cieplnych, wykresów rozrzutu i analiz porównawczych w czasie.

2. Źródła danych

Wszystkie wykorzystane dane pochodzą z oficjalnych, publicznych źródeł statystycznych:

Źródło Dane Link
GIOŚ (Główny Inspektorat Ochrony Środowiska) Stężenia PM2.5, PM10, B(a)P — dane roczne 2015–2024, pomiary miesięczne 2024 powietrze.gios.gov.pl
KOBiZE Bilans emisji pyłów według sektorów kobize.pl
CEEB (Centralna Ewidencja Emisyjności Budynków) Typy i liczba źródeł ciepła w budynkach mieszkalnych ceeb.gov.pl
EEA (Europejska Agencja Środowiska) Raport „Air Quality in Europe 2024”, normy prawne UE eea.europa.eu
Polski Alarm Smogowy Kontekst ekspercki, raporty wojewódzkie, dane uzupełniające polskialarmsmogowy.pl
WHO Global Air Quality Guidelines 2021 (normy rekomendowane) who.int
GUS Budżety Gospodarstw Domowych 2024 (mediany dochodów) stat.gov.pl

Metoda pozyskania: Dane pomiarowe pobraliśmy w formacie CSV bezpośrednio z portalu GIOŚ (osobno dla każdej stacji, a następnie zagregowaliśmy do średnich miesięcznych i rocznych na poziomie miasta). Dane KOBiZE i GUS pozyskaliśmy jako zbiorcze zestawy tabelaryczne. Dane o normach WHO i UE mają charakter deklaratywny i pochodzą z oficjalnych dokumentów.

3. Metody analizy danych

Wskaźniki i miary

  • Średnie roczne stężenie PM2.5 — podstawowy wskaźnik wykorzystywany zarówno przez UE, jak i WHO
  • Średnie miesięczne stężenie PM2.5 — wskaźnik pozwalający analizować sezonowość
  • Udział źródeł emisji — procentowy udział niskiej emisji komunalnej, transportu, przemysłu i innych źródeł w bilansie krajowym
  • Wskaźnik zmiany — procentowa różnica między wartościami w latach 2015 i 2024

Techniki analityczne

  1. Analiza sezonowa — zestawienie średnich miesięcznych dla wybranych miast w celu ukazania dramatycznej amplitudy zimowo-letniej
  2. Analiza regionalna — ranking 20–25 miast według średniej rocznej PM2.5 z podziałem na regiony geograficzne
  3. Analiza porównawcza w czasie — wykres dumbbell porównujący wartości z 2015 i 2024 roku
  4. Analiza korelacyjna — zestawienie stężeń PM2.5 z medianami dochodów w celu identyfikacji zależności socjoekonomicznych
  5. Analiza strukturalna — stacked area chart pokazujący ewolucję udziału poszczególnych źródeł emisji
  6. Analiza zgodności z normami — porównanie wartości z trzema progami regulacyjnymi (UE 2024, UE 2030, WHO)

Ograniczenia metodologiczne

  • Stacje pomiarowe GIOŚ nie zawsze są rozmieszczone równomiernie; w niektórych miastach pracuje tylko jedna stacja
  • Średnie miejskie zacierają różnice wewnątrzmiejskie (dzielnice z zabudową jednorodzinną vs blokowiska)
  • Korelacja dochód–PM2.5 nie dowodzi związku przyczynowego; mogą istnieć wspólne czynniki strukturalne (historia gospodarcza, geografia)
  • Dane KOBiZE o strukturze emisji są szacunkowe; bazują na modelach, nie na bezpośrednich pomiarach

4. Narzędzia wizualizacyjne

Narzędzie Zastosowanie
R (tidyverse, ggplot2) Przetwarzanie danych i tworzenie wszystkich wizualizacji
Quarto Integracja kodu, tekstu i wizualizacji w formacie publikacyjnym HTML
showtext Typografia (czcionka Jost z Google Fonts)
ggtext Formatowanie tekstu w wykresach (bogaty tekst, kolorowe etykiety)
scales Formatowanie liczb, procentów i walut na osiach wykresów

Decyzje projektowe dotyczące wizualizacji

  • Paleta kolorów: gradient od niebieskiego (#2E86AB — powietrze czyste, wartości niskie) przez żółty i pomarańczowy do ciemnoczerwonego (#8B0000 — powietrze silnie zanieczyszczone, wartości wysokie). Paleta nawiązuje do powszechnie stosowanych skal jakości powietrza w aplikacjach (takich jak Airly czy Kanarek).
  • Typ wykresów: szeregi czasowe liniowe dla sezonowości, poziome wykresy słupkowe z kolorowaniem regionalnym dla rankingów, mapa cieplna dla jednoczesnej prezentacji miesiąca i miasta, dumbbell dla porównania dwóch momentów czasowych, stacked area dla ewolucji struktury, wykres rozrzutu z linią regresji dla zależności dochód–PM2.5.
  • Przejrzystość: minimalistyczny design, ograniczenie linii siatki, bezpośrednie etykiety wartości nad słupkami, linie referencyjne dla kluczowych norm regulacyjnych.
  • Dostępność: we wszystkich wykresach użyto palet, które zachowują czytelność także w skali szarości (gradient jasności pokrywa się z gradientem koloru).

5. Podział zadań w grupie

Osoba Odpowiedzialność
Aleksandra Jaworska Koordynacja projektu, redakcja tekstu narracyjnego, rozmowy z ekspertami (cytaty eksperckie)
Michał Dąbrowski Pozyskanie danych z portalu GIOŚ i KOBiZE, czyszczenie, agregacja do formatu analitycznego
Karolina Stępień Analiza danych w R, projektowanie wizualizacji, programowanie w Quarto
Tomasz Mazur Kontekst tematyczny (polityka antysmogowa, programy rządowe), korekta, analiza ograniczeń metodologicznych

Wspólnie: Wybór tematu i kluczowego pytania badawczego, dyskusja nad strukturą narracyjną, decyzje o priorytetowym zestawie wskaźników, przygotowanie prezentacji końcowej.

6. Refleksja krytyczna

Mocne strony projektu

  • Wykorzystanie wyłącznie oficjalnych, publicznie dostępnych źródeł statystycznych (GIOŚ, KOBiZE, GUS, EEA, WHO)
  • Wielowymiarowa analiza: sezonowa, regionalna, socjoekonomiczna, historyczna, strukturalna
  • Konsekwentna paleta kolorów i styl wizualny, zapewniające spójność całego materiału
  • Narracja wychodząca od konkretnej, ludzkiej historii (lekarka pediatra z Rybnika) i wracająca do niej w finale, co buduje emocjonalne zakotwiczenie dla liczb
  • Wyraźne wskazanie ograniczeń metodologicznych w osobnej sekcji

Ograniczenia i wyzwania

  • Dostęp do danych pomiarowych GIOŚ na poziomie poszczególnych stacji wymagał ich ręcznej agregacji — proces czasochłonny i potencjalnie wprowadzający błędy
  • Brak ujednoliconych danych o liczbie kopciuchów na poziomie miejskim (CEEB rejestruje typy źródeł ciepła, ale dane o wieku i klasie kotłów są niepełne)
  • Wartości dla mniejszych miejscowości (Nowy Targ, Sucha Beskidzka) pochodzą z pojedynczych stacji, co ogranicza reprezentatywność
  • Nie udało się uwzględnić danych o ekspozycji wewnątrzdomowej (indoor air quality) — zmiennej niezwykle ważnej dla rzeczywistego wpływu zdrowotnego
  • Analiza dotyczy roku 2024 jako roku bazowego — dane końcowe za ten rok są wciąż wstępne i mogą ulec niewielkim korektom w oficjalnych raportach GIOŚ publikowanych w 2026 roku

Kwestie etyczne

  • W tekście unikaliśmy stygmatyzacji mieszkańców regionów zanieczyszczonych — prezentując smog jako efekt splotu czynników strukturalnych (geografia, historia, ekonomia), a nie indywidualnych wyborów
  • Cytaty ekspertów zostały autoryzowane; osoby wypowiadające się w artykule zgodziły się na publikację swoich słów w kontekście tej analizy
  • Skale osi wykresów nie zostały manipulowane w celu wyolbrzymienia różnic — wszystkie osie zaczynają się od zera (poza wykresem rozrzutu dochód–PM2.5, gdzie zerowa oś dochodu byłaby nieinformatywna)
  • Dane o dochodach prezentowane są jako mediany miejskie, co chroni prywatność indywidualnych gospodarstw domowych
  • W sekcji metodologicznej jasno wskazaliśmy, że korelacja nie dowodzi przyczynowości — szczególnie w kontekście politycznie wrażliwej relacji między biedą a jakością powietrza