Podstawy dziennikarstwa danych

Wprowadzenie do dziennikarstwa danych

Ben Stanley

Wydział Nauk Społecznych, Uniwersytet SWPS

28 marca 2026

Sprawy administracyjne

Informacje podstawowe

  • Kierunek: Dziennikarstwo i komunikacja społeczna (studia niestacjonarne, I stopień)
  • Semestr: letni 2025/2026
  • Prowadzący: dr hab. Benjamin Stanley, prof. Uniwersytetu SWPS
  • Kontakt: bstanley@swps.edu.pl
  • Materiały: Google Classroom

Treści programowe

  • 28.03 Wprowadzenie do dziennikarstwa danych
    • Czym jest a czym nie jest dziennikarstwo danych (warsztaty: dyskusja, case study, podział na grupy)
    • Po co nam kolejny gatunek dziennikarstwa? (dyskusja)
    • Praca w grupach: propozycja tematu materiału w ramach projektu zaliczeniowego

Treści programowe

  • 18.04 Źródła i pozyskiwanie danych
    • Skąd brać dane w data journalism? (praca w grupach: źródła danych dla materiału w ramach projektu zal.)
    • Wiarygodne i wartościowe źródła danych
    • Zasady etycznego pozyskiwania danych

Treści programowe

  • 25.04 Narzędzia i analiza danych
    • Narzędzia do pozyskiwania i analizy danych (praca w grupach: dobór narzędzi do projektu zaliczeniowego)
    • Pułapki dziennikarstwa danych (dyskusja, praca w grupach: opis ryzyk związanych z materiałem)

Treści programowe

  • 09.05 Wizualizacja danych
    • Wizualizacja danych: zasady i narzędzia
    • Praca w grupach: projekt wizualizacji danych w ramach projektu zaliczeniowego

Treści programowe

  • 16.05 Budowanie narracji i perspektywa krytyczna
    • Budowanie narracji w oparciu o dane (data storytelling)
    • Krytyka dziennikarstwa danych i rozważania o przyszłości gatunku (dyskusja)
    • Konsultacja projektów zaliczeniowych

Treści programowe

  • 06.06 Prezentacje studenckie
    • Osoby studiujące będą proszone o podział na 5-osobowe grupy.
    • Aby uzyskać zaliczenie, każda z grup musi przygotować projekt zaliczeniowy, będący podstawą zaliczenia.
    • Projektem jest treść dziennikarska z gatunku data journalism opracowana z wykorzystaniem i na podstawie konkretnie wskazanych danych oraz narzędzi do analizy i wizualizacji.

Zaliczenie

  • Osoby studiujące będą proszone o podział na 5-osobowe grupy
  • Aby uzyskać zaliczenie, każda z grup musi przygotować projekt zaliczeniowy
  • Projektem jest treść dziennikarska z gatunku data journalism opracowana z wykorzystaniem i na podstawie konkretnie wskazanych danych oraz narzędzi do analizy i wizualizacji
  • Grupy prezentują projekty na ostatnich zajęciach (06.06)
  • Szczegółowa instrukcja i rubrika oceny: handout (Podstawy dziennikarstwa danych projekt zaliczeniowy)

Plan dzisiejszego spotkania

  • Część 1 (~40 min): Czym jest a czym nie jest dziennikarstwo danych
    • Definicja i cechy dziennikarstwa danych
    • Czym dziennikarstwo danych nie jest
    • Case studies: przykłady dziennikarstwa danych
  • Część 2 (~30 min): Po co nam kolejny gatunek dziennikarstwa?
    • Ewolucja mediów i nowe potrzeby
    • Wyzwania współczesnych mediów
    • Dziennikarstwo danych jako rozwiązanie
  • Przerwa (15 min)
  • Część 3 (~35 min): Ćwiczenia grupowe
    • Ćwiczenie 1: analiza scenariuszy
    • Ćwiczenie 2: wybór tematu projektu końcowego

Część 1: Czym jest a czym nie jest dziennikarstwo danych

Definicja dziennikarstwa danych

Dziennikarstwo danych to metoda pracy, w której dane są głównym źródłem, narzędziem i dowodem reporterskim.

  • Połączenie warsztatu dziennikarskiego z analizą i wizualizacją danych
  • Weryfikacja i odkrywanie historii poprzez analizę zbiorów danych
  • Prezentacja wyników w przystępnej, często interaktywnej formie
  • Ujawnianie wzorców i trendów niewidocznych gołym okiem

Cechy dziennikarstwa danych

  • Przejrzystość — udostępnianie źródeł i metod
  • Reprodukowalność — możliwość samodzielnego sprawdzenia analiz
  • Rzetelność — dane jako podstawa narracji, nie jej ozdoba
  • Interaktywność — angażujące wizualizacje zamiast statycznych wykresów
  • Precyzja — dokładność w interpretacji i uczciwość wobec ograniczeń danych

Dziennikarstwo danych: mit a rzeczywistość

-

  • Cytowanie statystyk w artykule
  • Wklejenie wykresu z raportu GUS-u
  • Sensacyjny nagłówek oparty na jednej liczbie
  • Wybieranie tylko wygodnych danych (cherry-picking)
  • Korelacja jako dowód przyczynowości

+

  • Samodzielna analiza danych jako podstawa tekstu
  • Krytyczny dobór i weryfikacja źródeł
  • Narracja zakorzeniona w pełnym kontekście danych
  • Rzetelna prezentacja także niewygodnych wyników
  • Ostrożność w interpretacji związków statystycznych

Case study 1: Nadużycia w sieci kalifornijskich szpitali

  • Reporterzy California Watch prześledzili dane medyczne dotyczące pacjentów w wieku 65+ w kalifornijskich szpitalach
  • Celem dziennikarskiego śledztwa w oparciu o dane było ujawnienie nadużyć jednej z większych sieci szpitali, polegających na podwyższaniu klasyfikacji choroby (upcoding), aby otrzymać wyższą refundację za pacjenta

Nadużycia w sieci kalifornijskich szpitali

  • Dane jasno pokazały pewne anomalie w niektórych placówkach, takie jak np. bardzo wysoki odsetek pacjentów z niedożywieniem
  • Szczególnie uderzające było raportowanie przez szpitale sieci jednostki chorobowej o nazwie Kwashiorkor, czyli zespół niedoboru białka, choroby odnotowywanej głównie u dzieci w dotkniętych głodem w krajach rozwijających się
  • Współczynnik przypadków odnotowania tej choroby w szpitalach był o 70 razy większy niż w pozostałych placówkach

Nadużycia w sieci kalifornijskich szpitali

Nadużycia w sieci kalifornijskich szpitali

  • Do pracy wykorzystano bazy kalifornijskiego Departamentu Zdrowia, które zawierają szczegółowe informacje na temat wszystkich osób leczonych w stanowych szpitalach
  • Bazy nie zawierają informacji o imieniu i nazwisku, podają jednak wiek pacjenta, nazwę szpitala, sposób zapłaty oraz schorzenia w oparciu o międzynarodową klasyfikację ICD-9
  • Reporterzy wzięli pod lupę 6 lat, czyli musieli zmierzyć się z bazą danych liczącą 24 mln rekordów

Case study 2: Dotacje na transport publiczny w Argentynie

  • Dziennikarze jednego z największych argentyńskich dzienników La Nacion postanowili prześledzić wykorzystanie dotacji na publiczny transport
  • Temat wywołał zainteresowanie mediów ze względu na ogromne sumy przekazywane rokrocznie na publiczny transport autobusowy, co nie znajdowało odzwierciedlenia w jakości usług

Dotacje na transport publiczny

  • Efektem prac zespołu złożonego z dziennikarzy, programisty, statystyka i projektanta wizualizacji było stworzenie wyszukiwarki linii i firm transportowych
  • Narzędzie umożliwia sprawdzenie, jakie fundusze są przekazywane na konkretne przedsiębiorstwo oraz w jaki sposób są wykorzystywane
  • Ze względu na formę dostępnych danych, stworzono skrypt programistyczny (scraper), który pozwalał na automatyczne pobieranie plików ze strony www i konwersję PDF-ów na pliki Excel i pliki bazodanowe

Dotacje na transport publiczny

Case study 3: Zamieszki w Wielkiej Brytanii

  • Latem 2011 roku Wielka Brytania została dotknięta falą zamieszek
  • Politycy sugerowali, że zamieszki te kategorycznie nie były powiązane z ubóstwem, zaś osoby, które dokonywały grabieży, były zwyczajnymi przestępcami
  • Premier sugerował tymczasowe wyłączenie mediów społecznościowych

Zamieszki w Wielkiej Brytanii

  • The Guardian, we współpracy z London School of Economics, przeprowadził przełomowy projekt “Reading the Riots”
  • Poprzez połączenie danych o związanych z wykluczeniem społecznym z miejscem zamieszek, dziennikarze obalili główną narrację polityczną, mówiącą, że zamieszki nie mają żadnego związku z ubóstwem
  • Wizualizacja hashtagów na Twitterze pokazała, że platforma była używana głównie do reagowania na zamieszki (np. #riotcleanup), a nie do organizowania grabieży

Zamieszki w Wielkiej Brytanii

Case study 4: Obraz działań wojennych (WikiLeaks)

  • Dziennikarze otrzymali dane na temat działań wojennych w Afganistanie od organizacji WikiLeaks
  • Dane pokazały, że południe Afganistanu było obszarem najciężej dotkniętym działaniami wojennymi
  • Stworzono interaktywną mapę z wszystkimi incydentami, w których zginęła przynajmniej jedna osoba
  • W Iraku wśród 60 000 zdarzeń ze śmiertelnymi ofiarami uderzająco wysoki był odsetek cywilów

Obraz działań wojennych

Kluczowe kompetencje

Analityczne

  • Praca z bazami danych
  • Podstawy statystyki opisowej i wnioskowania
  • Krytyczna ocena metodologii
  • Wykrywanie błędów i manipulacji danymi

Techniczne

  • R, Python lub SQL do analizy
  • Narzędzia wizualizacji (Datawrapper, Flourish, ggplot2)
  • Pobieranie danych przez API i scraping
  • Praca z różnymi formatami (CSV, JSON, XML)

Dziennikarskie

  • Rozpoznawanie historii ukrytej w danych
  • Weryfikacja źródeł i danych
  • Pisanie dla niespecjalistów
  • Wywiad ekspercki jako uzupełnienie analizy

Proces pracy z danymi

  1. Pozyskiwanie — źródła otwarte, dostęp do informacji publicznej, API, scraping
  2. Czyszczenie — usuwanie błędów i duplikatów, standaryzacja formatów
  3. Analiza — statystyki opisowe, porównania, identyfikacja wzorców i anomalii
  4. Weryfikacja — konfrontacja wyników z ekspertami, testowanie alternatywnych interpretacji
  5. Publikacja — wizualizacje, udostępnienie danych i kodu źródłowego, przejrzysta dokumentacja metodologii

Redakcje i projekty warte śledzenia

Polska

  • OKO.press — praworządność, nierówności społeczne
  • Gazeta Wyborcza — mapy i analizy wyborcze
  • Konkret24 / Demagog — fact-checking oparty na danych
  • money.pl / Business Insider — analizy ekonomiczne

Świat

  • ProPublica — śledcze z otwartymi danymi i kodem
  • The New York Times (The Upshot) — wizualizacje polityczne i społeczne
  • The Guardian (Datablog) — pionier gatunku
  • OCCRP — korupcja i przestępczość transgraniczna

Część 2: Po co nam kolejny gatunek dziennikarstwa?

Ewolucja mediów

Epoka Cechy Konsekwencje
Prasa drukowana Wysoki koszt, długi cykl Dziennikarze jako „gatekeepers”
Telewizja Transmisja na żywo, masowy zasięg Wysoki poziom zaufania społecznego
Internet Niski koszt wejścia, globalny zasięg Demokratyzacja, ale i chaos informacyjny
Media społecznościowe Miliardy twórców treści Algorytmy jako nowi „gatekeepers”

Danych jest więcej niż kiedykolwiek

  • Sektor publiczny otwiera dane — dane.gov.pl, data.europa.eu, GUS BDL: setki tysięcy zbiorów dostępnych bezpłatnie
  • Firmy i instytucje publikują raporty — banki centralne, WHO, Eurostat, organizacje pozarządowe
  • Ślady cyfrowe — media społecznościowe, rejestry transakcji, dane geolokalizacyjne
  • Problem nie brzmi już „skąd wziąć dane?” lecz „jak je zrozumieć?“

Współczesne wyzwania mediów

  • Infodemia — nadmiar treści utrudnia odróżnienie sygnału od szumu
  • Dezinformacja — fałszywe statystyki i zmanipulowane wykresy są łatwe do wyprodukowania i trudne do obalenia
  • Polaryzacja — bańki algorytmiczne wzmacniają narracje grupowe kosztem faktów
  • Erozja zaufania — coraz mniej czytelników ufa mediom głównego nurtu
  • Złożoność — klimat, gospodarka, zdrowie publiczne wymagają rozumienia systemów, nie anegdot

Manipulacja danymi — przykłady

  • Politycy: „Bezrobocie spadło o 50%” — ale od jakiego poziomu, w jakiej grupie wiekowej, przy jakiej definicji?
  • Korporacje: Volkswagen (Dieselgate) — dane o emisjach fałszowane przez lata wobec regulatorów
  • Instytucje: statystyki kryminalne bez kontekstu demograficznego lub przestrzennego
  • Media: powielanie korelacji jako przyczyny — „jedzenie czekolady a nagrody Nobla”

Dane można zmanipulować. Można też ich użyć, żeby manipulację ujawnić.

Dziennikarstwo danych jako odpowiedź

Co wnosi

  • Argumenty zakorzenione w danych, nie w opiniach
  • Przejrzystość: źródła i kod dostępne publicznie
  • Weryfikowalność: analiza możliwa do powtórzenia
  • Głębia: nie tylko „co”, ale „jak często” i „dla kogo”
  • Przystępność: interaktywne wykresy zamiast tabel

Kiedy jest potrzebne

  • Skala przekracza możliwości anegdotycznych relacji
  • Trzeba uchwycić wzorce w czasie lub przestrzeni
  • Porównanie systematycznych różnic między grupami
  • Ujawnienie dysproporcji wymagających kwantyfikacji
  • Weryfikacja twierdzeń politycznych lub korporacyjnych

Ocena krytyczna gatunku

Argumenty za

  • Nagrody Pulitzera za projekty data-driven (ProPublica, NYT)
  • Odpowiada na potrzeby cyfrowego odbiorcy
  • Wykorzystuje rosnącą dostępność danych publicznych
  • Podnosi standardy weryfikacji w całej redakcji
  • Wzmacnia debatę publiczną opartą na faktach

Argumenty przeciw

  • Wyklucza dziennikarzy bez kompetencji technicznych
  • Wysokie koszty narzędzi i szkoleń
  • Ryzyko „młotka szukającego gwoździ” — technologia napędza tematy
  • Liczby nie zastąpią ludzkiego wymiaru historii
  • „Kłamstwa, przeklęte kłamstwa i statystyki” — możliwość manipulacji pozostaje

☕ Przerwa

Część 3: Ćwiczenia grupowe

Podział na grupy

  • Proszę podzielić się na 6 grup
  • Każda grupa będzie pracować nad projektem zaliczeniowym przez cały semestr
  • Role w grupie mogą obejmować:
    • Osoba odpowiedzialna za pozyskiwanie i czyszczenie danych
    • Osoba odpowiedzialna za analizę
    • Osoba odpowiedzialna za wizualizację
    • Osoba odpowiedzialna za narrację i redakcję
    • Osoba koordynująca pracę grupy

Ćwiczenie 1: analiza scenariuszy

  • Każda grupa otrzymuje scenariusz opisujący temat, który dziennikarz mógłby chcieć zbadać
  • Zadanie 1: Jakie aspekty historii wymagają tradycyjnego dziennikarstwa, a jakie wymagają dziennikarstwa danych?
  • Zadanie 2: Sformułujcie hipotezy badawcze, które wymagają podejścia opartego na danych
  • Zadanie 3: Naszkicujcie plan projektu dziennikarstwa danych

Grupa 1: Pustoszejące szkoły

Tradycyjne vs. danych

  • Tradycyjne: wywiady z dyrektorami, rodzicami, reportaże z zamykanych szkół
  • Danych: skala ogólnokrajowa, wzorce przestrzenne i czasowe, korelacje z demografią
  • Anegdoty mogą być nietypowe — potrzebny kontekst liczbowy

Hipotezy i dane

  • Spadek szkół w miastach, wzrost na przedmieściach
  • Korelacja ze zmianami liczby dzieci w wieku szkolnym
  • Suburbanizacja jako czynnik napędowy
  • Dane: SIO (szkoły, uczniowie), GUS BDL (demografia, migracje)

Grupa 1: Pustoszejące szkoły — plan projektu

  • Pytanie: Jak zmienia się sieć szkół podstawowych i w jakim stopniu zmiany odzwierciedlają suburbanizację i spadek dzietności?
  • Metody: szeregi czasowe, korelacje, grupowanie gmin
  • Wizualizacja: mapa choropletowa zmian, wykresy liniowe miasto vs. przedmieścia, scatter plot migracje vs. szkoły
  • Wyzwania: filie i punkty szkolne nieujęte w danych, łączenie szkół vs. zamykanie, zmiany granic administracyjnych

Grupa 2: Kolej nierównych prędkości

Tradycyjne vs. danych

  • Tradycyjne: reportaż z podróży opóźnionym pociągiem, wywiady z pasażerami i pracownikami PKP
  • Danych: systematyczna analiza punktualności i dostępności na wszystkich liniach
  • Opinie z forów to próba niereprezentatywna

Hipotezy i dane

  • Punktualność poprawiła się na zmodernizowanych liniach, ale pogorszyła na pozostałych
  • Inwestycje skoncentrowane na głównych trasach
  • Nierówna dostępność kolejowa wschód–zachód
  • Dane: UTK (punktualność, pasażerowie), PKP PLK (inwestycje), rozkłady jazdy

Grupa 2: Kolej nierównych prędkości — plan projektu

  • Pytanie: Czy inwestycje kolejowe poprawiają jakość równomiernie, czy pogłębiają różnice regionalne?
  • Metody: difference-in-differences (przed/po modernizacji), analiza przestrzenna dostępności, korelacja nakładów z jakością
  • Wizualizacja: mapa sieci kolorowana wg punktualności, wykresy before/after, mapa „białych plam” kolejowych
  • Wyzwania: odwołane pociągi nieujęte w statystykach punktualności (survivorship bias), remonty tymczasowo pogarszają warunki

Grupa 3: Zielone obietnice miast

Tradycyjne vs. danych

  • Tradycyjne: wywiady z prezydentem i opozycją, rozmowy z ekspertami klimatycznymi
  • Danych: niezależna weryfikacja twierdzeń obu stron, porównanie danych z różnych źródeł
  • Spór jest techniczny — dotyczy metodologii pomiaru emisji

Hipotezy i dane

  • Cele osiągnięte dzięki zmianie metodologii, nie faktycznej redukcji
  • Spadek CO2 nie przełożył się na poprawę jakości powietrza (PM2.5)
  • Polskie miasta wypadają gorzej niż europejskie przy jednolitej metodologii
  • Dane: GIOŚ, KOBiZE, Covenant of Mayors, Eurostat, CEEB

Grupa 3: Zielone obietnice miast — plan projektu

  • Pytanie: Czy deklarowane redukcje emisji odpowiadają rzeczywistej poprawie jakości środowiska?
  • Metody: krzyżowa walidacja danych z różnych źródeł, korelacja emisji z pomiarami jakości powietrza, benchmarking europejski
  • Wizualizacja: wykres deklaracje vs. pomiary, mapa stężeń zanieczyszczeń, ranking miast polskich i europejskich
  • Wyzwania: różne metodologie miast, nierównomierne pokrycie stacjami GIOŚ, emisje CO2 ≠ jakość powietrza

Grupa 4: Recepty na pustym biurku

Tradycyjne vs. danych

  • Tradycyjne: reportaż z kolejki, wywiady z pacjentami i lekarzami
  • Danych: ogólnokrajowa mapa dostępności, identyfikacja czynników wyjaśniających różnice
  • Ogólna liczba lekarzy może rosnąć, a regionalne niedobory pogłębiać się jednocześnie

Hipotezy i dane

  • Czas oczekiwania silnie zróżnicowany regionalnie
  • Nowi specjaliści koncentrują się w dużych ośrodkach
  • Najdłuższe kolejki tam, gdzie lekarze najstarsi
  • Dane: NFZ (kolejki), NIL (rejestr lekarzy, wiek), GUS (demografia)

Grupa 4: Recepty na pustym biurku — plan projektu

  • Pytanie: Jak wygląda przestrzenne zróżnicowanie dostępności opieki specjalistycznej i jakie czynniki je wyjaśniają?
  • Metody: wskaźnik lekarzy na 10 tys. mieszkańców, korelacja z czasem oczekiwania, prognoza niedoborów (piramida wiekowa), grupowanie powiatów
  • Wizualizacja: mapa choropletowa kolejek, mapa gęstości lekarzy, piramida wiekowa wg specjalności, ranking specjalności
  • Wyzwania: dane NFZ nie obejmują wizyt prywatnych, pacjenci w kilku kolejkach, lekarze pracujący w wielu miejscach

Grupa 5: Niewidzialni pracownicy

Tradycyjne vs. danych

  • Tradycyjne: historie kurierów na zleceniu, reportaż z budowy, wywiady z inspektorami pracy
  • Danych: oszacowanie skali zjawiska, zestawienie danych z wielu źródeł
  • Stopa bezrobocia nie mówi nic o jakości zatrudnienia

Hipotezy i dane

  • Rośnie udział umów cywilnoprawnych kosztem umów o pracę
  • Oficjalna stopa bezrobocia nie uwzględnia osób zniechęconych i przymusowo niepełnoetatowych
  • Szara strefa większa w regionach o niższym PKB
  • Dane: GUS/BAEL, ZUS (składki), PIP (kontrole), Eurostat

Grupa 5: Niewidzialni pracownicy — plan projektu

  • Pytanie: Jaka jest rzeczywista skala niestandardowego i nieformalnego zatrudnienia i w jakim stopniu oficjalne statystyki ją ukrywają?
  • Metody: analiza struktury form zatrudnienia w czasie, alternatywne wskaźniki rynku pracy (U-6), analiza regionalna, benchmarking europejski
  • Wizualizacja: stacked area struktury zatrudnienia, porównanie stopy bezrobocia z szerszymi miarami, mapa regionalna, porównanie z UE
  • Wyzwania: szara strefa trudna do zmierzenia, deklaracje respondentów, zmieniające się kategorie, dane ZUS tylko dla zarejestrowanych

Grupa 6: Cyfrowa przepaść pokoleniowa

Tradycyjne vs. danych

  • Tradycyjne: reportaż z seniorami, wywiady z pracownikami urzędów, relacja z kursów komputerowych
  • Danych: skala wykluczenia, profil demograficzny wykluczonych, porównanie z UE
  • Wzrost e-usług nie oznacza, że wszyscy z nich korzystają

Hipotezy i dane

  • Osoby 65+ korzystają z e-usług kilkukrotnie rzadziej niż 25–44
  • Wykluczenie ma wymiar wiekowy, geograficzny i ekonomiczny
  • Polska gorzej niż średnia UE w umiejętnościach cyfrowych seniorów
  • Dane: GUS (badanie ICT), Min. Cyfryzacji, Eurostat/DESI, UKE

Grupa 6: Cyfrowa przepaść pokoleniowa — plan projektu

  • Pytanie: Kto korzysta, a kto nie korzysta z cyfrowych usług publicznych, jakie czynniki decydują o wykluczeniu i jak Polska wypada na tle UE?
  • Metody: tabele krzyżowe (wiek × wykształcenie × miejsce), wskaźniki wykluczenia, porównanie DESI, korelacja infrastruktura vs. korzystanie
  • Wizualizacja: wykres słupkowy wg grup wiekowych, mapa dostępności internetu, wykres radarowy Polska vs. UE, heatmapa wiek × wykształcenie
  • Wyzwania: dane Min. Cyfryzacji mogą nie być dostępne w podziale demograficznym, „korzystanie z internetu” ≠ obsługa formularzy urzędowych

Ćwiczenie 2: wybór tematu projektu końcowego

  • Każda grupa przygotowuje propozycję tematu projektu
    • Temat projektu — jaki problem chcecie zbadać?
    • Pytanie badawcze — konkretna hipoteza lub pytanie
    • Znaczenie społeczne — kogo to dotyczy i dlaczego ważne?
    • Dlaczego dane? — czego nie da się osiągnąć tradycyjnym dziennikarstwem?
    • Źródła danych — skąd dane i czy są dostępne?
  • Szczegółowe instrukcje: handout (Podstawy dziennikarstwa danych 1 exercise 2)

Najczęstsze błędy projektów

  • Zbyt szeroki temat — brak fokusa
    • Zły przykład: „Problemy polskiej gospodarki”
    • Dobry przykład: „Bezrobocie wśród absolwentów w woj. mazowieckim 2020–2025”
  • Niedostępne dane — sprawdźcie dostępność danych PRZED wyborem tematu
  • Słaba wizualizacja — za dużo informacji na jednym wykresie
  • Brak kontekstu — dane bez interpretacji
  • Powierzchowna analiza — same średnie bez analizy rozkładu

Wskazówki dla sukcesu

  • Wybierz temat, który Cię interesuje — pasja przekłada się na jakość
  • Sprawdź dostępność danych wcześnie — plan B, jeśli dane niedostępne
  • Zaplanuj czas na trudności techniczne — czyszczenie danych zajmuje 50–80% czasu
  • Skonsultuj interpretacje z ekspertami — dodają wiarygodność
  • Testuj zrozumiałość na osobach z zewnątrz — jeśli oni zrozumieją, każdy zrozumie

Kluczowe wnioski

  • Dziennikarstwo danych odpowiada na realne potrzeby współczesnego społeczeństwa
  • Nie każdy temat wymaga dziennikarstwa danych — klucz to rozpoznanie, kiedy dane są niezbędne
  • Sukces projektu zależy od: dostępności danych, jasnego pytania badawczego i motywacji dziennikarskiej
  • Tradycyjne dziennikarstwo i dziennikarstwo danych się uzupełniają, nie wykluczają