Dokumentacja projektu
Dziennikarstwo danych — Projekt zaliczeniowy
1. Temat projektu
Tytuł: Powietrze klasy średniej: Kto w Polsce oddycha czystszym powietrzem — geografia smogu i nierówności środowiskowych
Uzasadnienie wyboru tematu
Problem jakości powietrza w Polsce jest jednym z najważniejszych wyzwań zdrowotnych i społecznych współczesności. Wybraliśmy ten temat z następujących powodów:
Aktualność — zimowy smog od lat pojawia się w debacie publicznej, a obowiązujące w poszczególnych województwach uchwały antysmogowe wkraczają właśnie w fazę, w której ich egzekwowanie staje się realnym testem politycznym.
Wymiar społeczny — zanieczyszczenie powietrza odpowiada w Polsce za ok. 45 tys. przedwczesnych zgonów rocznie i dotyka w sposób nierównomierny mieszkańców różnych regionów. Problem ma wyraźny wymiar nierówności geograficznych, socjoekonomicznych i zdrowotnych.
Dostępność danych — GIOŚ, KOBiZE, CEEB, Europejska Agencja Środowiska oraz WHO publikują szczegółowe, otwarte dane, które pozwalają na wielowymiarową analizę.
Potencjał narracyjny i wizualizacyjny — sezonowość, amplituda między miastami oraz związek z warunkami społeczno-ekonomicznymi umożliwiają wykorzystanie różnorodnych form wizualizacji: szeregów czasowych, map cieplnych, wykresów rozrzutu i analiz porównawczych w czasie.
2. Źródła danych
Wszystkie wykorzystane dane pochodzą z oficjalnych, publicznych źródeł statystycznych:
| Źródło | Dane | Link |
|---|---|---|
| GIOŚ (Główny Inspektorat Ochrony Środowiska) | Stężenia PM2.5, PM10, B(a)P — dane roczne 2015–2024, pomiary miesięczne 2024 | powietrze.gios.gov.pl |
| KOBiZE | Bilans emisji pyłów według sektorów | kobize.pl |
| CEEB (Centralna Ewidencja Emisyjności Budynków) | Typy i liczba źródeł ciepła w budynkach mieszkalnych | ceeb.gov.pl |
| EEA (Europejska Agencja Środowiska) | Raport „Air Quality in Europe 2024”, normy prawne UE | eea.europa.eu |
| Polski Alarm Smogowy | Kontekst ekspercki, raporty wojewódzkie, dane uzupełniające | polskialarmsmogowy.pl |
| WHO | Global Air Quality Guidelines 2021 (normy rekomendowane) | who.int |
| GUS | Budżety Gospodarstw Domowych 2024 (mediany dochodów) | stat.gov.pl |
Metoda pozyskania: Dane pomiarowe pobraliśmy w formacie CSV bezpośrednio z portalu GIOŚ (osobno dla każdej stacji, a następnie zagregowaliśmy do średnich miesięcznych i rocznych na poziomie miasta). Dane KOBiZE i GUS pozyskaliśmy jako zbiorcze zestawy tabelaryczne. Dane o normach WHO i UE mają charakter deklaratywny i pochodzą z oficjalnych dokumentów.
3. Metody analizy danych
Wskaźniki i miary
- Średnie roczne stężenie PM2.5 — podstawowy wskaźnik wykorzystywany zarówno przez UE, jak i WHO
- Średnie miesięczne stężenie PM2.5 — wskaźnik pozwalający analizować sezonowość
- Udział źródeł emisji — procentowy udział niskiej emisji komunalnej, transportu, przemysłu i innych źródeł w bilansie krajowym
- Wskaźnik zmiany — procentowa różnica między wartościami w latach 2015 i 2024
Techniki analityczne
- Analiza sezonowa — zestawienie średnich miesięcznych dla wybranych miast w celu ukazania dramatycznej amplitudy zimowo-letniej
- Analiza regionalna — ranking 20–25 miast według średniej rocznej PM2.5 z podziałem na regiony geograficzne
- Analiza porównawcza w czasie — wykres dumbbell porównujący wartości z 2015 i 2024 roku
- Analiza korelacyjna — zestawienie stężeń PM2.5 z medianami dochodów w celu identyfikacji zależności socjoekonomicznych
- Analiza strukturalna — stacked area chart pokazujący ewolucję udziału poszczególnych źródeł emisji
- Analiza zgodności z normami — porównanie wartości z trzema progami regulacyjnymi (UE 2024, UE 2030, WHO)
Ograniczenia metodologiczne
- Stacje pomiarowe GIOŚ nie zawsze są rozmieszczone równomiernie; w niektórych miastach pracuje tylko jedna stacja
- Średnie miejskie zacierają różnice wewnątrzmiejskie (dzielnice z zabudową jednorodzinną vs blokowiska)
- Korelacja dochód–PM2.5 nie dowodzi związku przyczynowego; mogą istnieć wspólne czynniki strukturalne (historia gospodarcza, geografia)
- Dane KOBiZE o strukturze emisji są szacunkowe; bazują na modelach, nie na bezpośrednich pomiarach
4. Narzędzia wizualizacyjne
| Narzędzie | Zastosowanie |
|---|---|
| R (tidyverse, ggplot2) | Przetwarzanie danych i tworzenie wszystkich wizualizacji |
| Quarto | Integracja kodu, tekstu i wizualizacji w formacie publikacyjnym HTML |
| showtext | Typografia (czcionka Jost z Google Fonts) |
| ggtext | Formatowanie tekstu w wykresach (bogaty tekst, kolorowe etykiety) |
| scales | Formatowanie liczb, procentów i walut na osiach wykresów |
Decyzje projektowe dotyczące wizualizacji
- Paleta kolorów: gradient od niebieskiego (#2E86AB — powietrze czyste, wartości niskie) przez żółty i pomarańczowy do ciemnoczerwonego (#8B0000 — powietrze silnie zanieczyszczone, wartości wysokie). Paleta nawiązuje do powszechnie stosowanych skal jakości powietrza w aplikacjach (takich jak Airly czy Kanarek).
- Typ wykresów: szeregi czasowe liniowe dla sezonowości, poziome wykresy słupkowe z kolorowaniem regionalnym dla rankingów, mapa cieplna dla jednoczesnej prezentacji miesiąca i miasta, dumbbell dla porównania dwóch momentów czasowych, stacked area dla ewolucji struktury, wykres rozrzutu z linią regresji dla zależności dochód–PM2.5.
- Przejrzystość: minimalistyczny design, ograniczenie linii siatki, bezpośrednie etykiety wartości nad słupkami, linie referencyjne dla kluczowych norm regulacyjnych.
- Dostępność: we wszystkich wykresach użyto palet, które zachowują czytelność także w skali szarości (gradient jasności pokrywa się z gradientem koloru).
5. Podział zadań w grupie
| Osoba | Odpowiedzialność |
|---|---|
| Aleksandra Jaworska | Koordynacja projektu, redakcja tekstu narracyjnego, rozmowy z ekspertami (cytaty eksperckie) |
| Michał Dąbrowski | Pozyskanie danych z portalu GIOŚ i KOBiZE, czyszczenie, agregacja do formatu analitycznego |
| Karolina Stępień | Analiza danych w R, projektowanie wizualizacji, programowanie w Quarto |
| Tomasz Mazur | Kontekst tematyczny (polityka antysmogowa, programy rządowe), korekta, analiza ograniczeń metodologicznych |
Wspólnie: Wybór tematu i kluczowego pytania badawczego, dyskusja nad strukturą narracyjną, decyzje o priorytetowym zestawie wskaźników, przygotowanie prezentacji końcowej.
6. Refleksja krytyczna
Mocne strony projektu
- Wykorzystanie wyłącznie oficjalnych, publicznie dostępnych źródeł statystycznych (GIOŚ, KOBiZE, GUS, EEA, WHO)
- Wielowymiarowa analiza: sezonowa, regionalna, socjoekonomiczna, historyczna, strukturalna
- Konsekwentna paleta kolorów i styl wizualny, zapewniające spójność całego materiału
- Narracja wychodząca od konkretnej, ludzkiej historii (lekarka pediatra z Rybnika) i wracająca do niej w finale, co buduje emocjonalne zakotwiczenie dla liczb
- Wyraźne wskazanie ograniczeń metodologicznych w osobnej sekcji
Ograniczenia i wyzwania
- Dostęp do danych pomiarowych GIOŚ na poziomie poszczególnych stacji wymagał ich ręcznej agregacji — proces czasochłonny i potencjalnie wprowadzający błędy
- Brak ujednoliconych danych o liczbie kopciuchów na poziomie miejskim (CEEB rejestruje typy źródeł ciepła, ale dane o wieku i klasie kotłów są niepełne)
- Wartości dla mniejszych miejscowości (Nowy Targ, Sucha Beskidzka) pochodzą z pojedynczych stacji, co ogranicza reprezentatywność
- Nie udało się uwzględnić danych o ekspozycji wewnątrzdomowej (indoor air quality) — zmiennej niezwykle ważnej dla rzeczywistego wpływu zdrowotnego
- Analiza dotyczy roku 2024 jako roku bazowego — dane końcowe za ten rok są wciąż wstępne i mogą ulec niewielkim korektom w oficjalnych raportach GIOŚ publikowanych w 2026 roku
Kwestie etyczne
- W tekście unikaliśmy stygmatyzacji mieszkańców regionów zanieczyszczonych — prezentując smog jako efekt splotu czynników strukturalnych (geografia, historia, ekonomia), a nie indywidualnych wyborów
- Cytaty ekspertów zostały autoryzowane; osoby wypowiadające się w artykule zgodziły się na publikację swoich słów w kontekście tej analizy
- Skale osi wykresów nie zostały manipulowane w celu wyolbrzymienia różnic — wszystkie osie zaczynają się od zera (poza wykresem rozrzutu dochód–PM2.5, gdzie zerowa oś dochodu byłaby nieinformatywna)
- Dane o dochodach prezentowane są jako mediany miejskie, co chroni prywatność indywidualnych gospodarstw domowych
- W sekcji metodologicznej jasno wskazaliśmy, że korelacja nie dowodzi przyczynowości — szczególnie w kontekście politycznie wrażliwej relacji między biedą a jakością powietrza