Podstawy dziennikarstwa danych

Budowanie narracji — od danych do historii

Ben Stanley

Wydział Nauk Społecznych, Uniwersytet SWPS

16 maja 2026

Treści programowe

  • 16.05 Budowanie narracji i perspektywa krytyczna
    • Jak zamienić dane w historię
    • Struktura narracji dziennikarstwa danych
    • Ćwiczenie grupowe: zbudowanie narracji z cudzych danych

Plan dzisiejszego spotkania

  • Część 1 (~45 min): narracja dziennikarstwa danych
    • Dane to nie historia — co dodać?
    • Struktura narracji, newsowa liczba, trzy typy
    • Jak łączyć dane z tradycyjnym dziennikarstwem
    • Perspektywa krytyczna — granice gatunku
  • Przerwa (15 min)
  • Część 2 (~60 min): ćwiczenie narracyjne w grupach
    • 30 min pracy w grupach na cudzych danych
    • 30 min prezentacji (6 grup × 5 min)

Część 1: budowanie narracji

Dane to nie historia

  • Liczby same w sobie nie opowiadają historii
  • Historia wymaga bohatera, konfliktu i rozwiązania (lub jego braku)
  • Dane dostarczają dowodów — narracja nadaje im sens
  • „Wzrost PKB o 3,2%“ — fakt bez znaczenia
  • „Przeciętna polska rodzina zarabia o 30% mniej niż sąsiedzi z Niemiec” — historia

Struktura narracji danych

  • Kontekst — co się dzieje i dlaczego warto wiedzieć?
  • Konflikt — co jest zaskakujące, niesprawiedliwe lub nieoczekiwane?
  • Dane jako dowód — liczby potwierdzające lub kwestionujące intuicję
  • Perspektywa ludzka — kogo to dotyczy?
  • Implikacje — co z tego wynika?

„Newsowa liczba”

  • Każda dobra historia danych ma jedną kluczową liczbę
  • Liczba, która zatrzymuje czytelnika w trakcie przewijania
  • Powinna być:
    • Zrozumiała bez wykładu statystyki
    • Zaskakująca lub sprzeczna z intuicją
    • Możliwa do zweryfikowania
  • Przykłady: „12,5× roczne zarobki”„60% pieniędzy w rękach 10 klubów”„równość za 66 lat”

Kiedy newsowa liczba kłamie

Mocna liczba bez kontekstu może wprowadzać w błąd bardziej niż brak liczby:

  • Liczba bez porównania„55 tys. zgonów” nic nie znaczy bez „rocznie, w populacji 38 mln”
  • Średnia, która ukrywa medianꄜredni dochód 8200 zł” przy medianie 5800 zł = historia o nierównościach, a nie o zamożności
  • Wartość bezwzględna vs. odsetek„wzrost o 1000%“ z bazy 3 osób do 33 osób = poprawne matematycznie, nieuczciwe narracyjnie
  • Wybiórczość momentu„najwięcej od 2008 r.” działa zarówno gdy mamy szczyt, jak i gdy ostatnie 16 lat było wyjątkowo niskie

Test uczciwości newsowej liczby:

  1. Czy jest podany mianownik (na ile, z ilu, w jakim okresie)?
  2. Czy jest porównanie (w czasie i w przestrzeni)?
  3. Czy zmiana jest wybranym wycinkiem, czy szerszym trendem?

Trzy typy narracji danych

  • Narracja odkrycia„Dane ujawniają coś, czego nikt nie wiedział”
    • Wymaga oryginalnych danych lub świeżej analizy
  • Narracja weryfikacji„Sprawdzamy powszechne przekonanie”
    • Często obala mity lub potwierdza to, co intuicja podpowiada
  • Narracja trendu„Coś się zmienia i mamy to czarno na białym”
    • Wymaga danych szeregów czasowych

Przykład 1 — narracja odkrycia

Newsowa liczba: „Co szóste mieszkanie w powiecie łobeskim stoi puste” — liczba, której nie ma w żadnym oficjalnym raporcie, bo nikt nie zestawił tych powiatów obok siebie.

Przykład 2 — narracja weryfikacji

Newsowa liczba: „Prezesi spółek Skarbu Państwa zarabiają dwa razy więcej, niż sądzi przeciętny Polak” — weryfikacja powszechnego przekonania, że „i tak wiemy, ile zarabiają”.

Przykład 3 — narracja trendu

Newsowa liczba: „15 rocznych pensji za 50 metrów w Warszawie” — trend, który wymaga szeregu czasowego, żeby pokazać, że to nie jest „zawsze tak było”.

Narracja zaczyna się od pytania

  • Dobre pytanie badawcze to połowa historii
  • Pytanie powinno być:
    • Konkretne — nie „jak żyją Polacy”, ale „ile rocznych zarobków potrzeba na mieszkanie w Warszawie?“
    • Odpowiedź powinna być nieoczywista
    • Powinna dotyczyć czegoś, co czytelnika obchodzi
Zły start Dobry start
„Mamy dane, szukamy historii.” „Mamy pytanie, szukamy danych.”

Tytuł i lead

  • Tytuł komunikuje wniosek, nie temat
    • „Wskaźnik aktywności zawodowej 1990–2023”
    • „Wskaźnik aktywności zawodowej wzrósł dla kobiet, spadł dla mężczyzn”
  • Lead (pierwsze 2–3 zdania) — pokazuje „newsową liczbę” w kontekście ludzkim
    • Nie cały wywód naukowy
    • Konkretna osoba, konkretne miejsce, konkretny moment

Anatomia leadu

Fragment leadu z artykułu o brytyjskim rynku mieszkaniowym:

„W 1991 roku Emma Richardson, dwudziestosześcioletnia nauczycielka z Reading, kupiła swoje pierwsze mieszkanie. Dwupokojowy apartament kosztował nieco ponad trzykrotność jej rocznych zarobków. Trzydzieści pięć lat później jej córka, również nauczycielka, zarabia proporcjonalnie więcej. Podobne lokum kosztuje dziś prawie dziesięciokrotność jej rocznej pensji.”

  • Bohater (Emma), miejsce (Reading), czas (1991 → dziś), liczba (3× → 10×)
  • Dane w kontekście — czytelnik widzi skalę od razu
  • Uniwersalne doświadczenie (praca, mieszkanie, dziecko) z lokalnym zakotwiczeniem

Ten sam temat, inny lead

Wariant ekspercki (zły dla artykułu, dobry dla raportu):

„Według raportu Office for Budget Responsibility z 2024 r. wskaźnik ceny do dochodu (house price-to-earnings ratio) w Wielkiej Brytanii wzrósł z 3,07 w 1991 do 9,71 w 2024 r., co oznacza skumulowany wzrost o 216,3% w cenach nominalnych.”

  • Te same dane, ta sama skala (3× → ~10×)
  • Brak bohatera, brak miejsca, brak czasu w skali ludzkiej
  • Czytelnik kończy zdanie i nie ma powodu czytać dalej
  • „Wskaźnik ceny do dochodu” wymaga przypisu — „12,5× rocznych zarobków” nie

Nie potrzebujesz innych danych — potrzebujesz innego wejścia w te same dane.

Skąd wziąć bohatera

Dane są anonimowe — bohater musi pochodzić spoza arkusza. Trzy ścieżki:

  • Przez organizacje — związki zawodowe, NGO, parafie, koła gospodyń, grupy wsparcia
    • Szukasz typowego przypadku, nie skrajnego — bohater ma reprezentować segment, nie szokować
  • Przez mikrodane — DBW GUS, EU-SILC, dane spisowe pozwalają wyłonić segment (np. „samotne matki w mieście średniej wielkości”) i potem znaleźć osobę pasującą do profilu
  • Przez callout do czytelników — model Guardiana czy The Pudding: ogłoszenie „Szukamy osób, które…“
    • Uwaga: silne odchylenie selekcji — zgłaszają się ci, którzy mają coś do powiedzenia

Zasada: bohater ilustruje dane, dane nie ilustrują bohatera. Najpierw analiza, potem dobór bohatera — nie odwrotnie.

Bohater jest osobą, nie ilustracją

  • Świadoma zgoda to nie podpis pod formularzem
    • Bohater musi rozumieć: gdzie artykuł się ukaże, kto go przeczyta, co zostanie zacytowane
    • Czytelnik znajdzie go w Google po imieniu i mieście jeszcze przez dekadę
  • Anonimizacja — czasem konieczna (ofiary przemocy, osoby zadłużone, osoby w kryzysie zdrowia psychicznego)
    • Zmieniaj imię i wiek, nie zmyślaj zawodu czy regionu — inaczej psujesz dowód
  • Prawo do wycofania zgody — przed publikacją zawsze, po publikacji zwykle nie (ale popraw, jeśli błąd)

Case study to nie dowód

  • Emma ilustruje skalę problemu, nie istnienie problemu
    • Istnienie problemu pokazują dane (3× → ~10×)
    • Bez danych Emma jest anegdotą
  • Pułapka skrajnego przypadku — najmocniejsza historia często jest nietypowa
    • Bohater w mediach trafi do redakcji, bo „ma coś do powiedzenia” — zwykle dlatego, że jest na ogonie rozkładu
  • Strategia: dwóch bohaterów — jeden typowy, jeden skrajny — pokazuje rozpiętość, a nie tylko czubek

Dane + tradycyjne dziennikarstwo

Dziennikarstwo danych nie zastępuje tradycyjnego reportażu — uzupełnia je. Najlepsze projekty łączą:

  • Wywiad z ekspertem — daje ramę interpretacyjną danych
  • Case study — jedna konkretna osoba, której dotyczy problem
  • Reportaż terenowy — atmosfera, szczegóły, głos osób pomijanych w statystykach
  • Historyczny kontekst„To nie stało się teraz po raz pierwszy”
  • Głos krytyczny — ktoś, kto kwestionuje waszą narrację

Zasada: jeżeli da się materiał zrozumieć patrząc tylko na wykresy, brakuje w nim dziennikarstwa. Jeżeli da się go zrozumieć patrząc tylko na prozę, brakuje w nim danych.

Format a narracja

  • Ten sam temat, różne formaty, różna narracja
  • Artykuł — głębia, kontekst, cytat eksperta, metodologia
  • Seria infografik — kompresja, uderzający obraz, szansa na zasięg w sieci
  • Reportaż wideo — głos i twarz bohaterów, czas trwania 3–6 min
  • Interaktywna wizualizacja — czytelnik sam eksploruje dane
  • Wybór formatu to decyzja dziennikarska, nie techniczna

Rytm narracyjny

Długi artykuł ma rytm — naprzemiennie:

  • Liczba (newsowa, w leadzie)
  • Historia (bohater, scena)
  • Wykres (dowód wizualny)
  • Głos eksperta (interpretacja)
  • Powrót do bohatera (klamra emocjonalna)
  • Implikacje (co z tego wynika dla czytelnika?)

Czytelnik męczy się samymi liczbami. Męczy się też samymi opowieściami bez dowodów. Naprzemienność trzyma uwagę.

Makrostruktura — trzy wzorce

Atomy z poprzedniego slajdu trzeba ułożyć w całość. Trzy sprawdzone struktury:

  • Odwrócona piramida — najmocniejsza liczba i wniosek na samej górze
    • Klasyka newsa; czytelnik, który przerwie po akapicie, wie najważniejsze
    • Sprawdza się przy narracji odkrycia
  • Porządek nestoriański — druga najmocniejsza scena na początku, najmocniejsza na końcu
    • Środek to dowody i kontekst; finał to klamra emocjonalna
    • Klasyka długich reportaży (Pismo, Tygodnik Powszechny, The New Yorker)
  • Klamra — ostatni akapit wraca do bohatera z leadu
    • Domyka emocjonalnie; działa z każdą z dwóch struktur powyżej

Wybór zależy od formatu: newsowy artykuł = piramida; reportaż długi = nestor; każdy artykuł z bohaterem = klamra (jako dodatek, nie zamiast).

Perspektywa krytyczna

Iluzja obiektywności

  • „Dane mówią same za siebie” — popularny mit
  • Każdy zbiór danych jest wynikiem ludzkich decyzji:
    • Co mierzyć?
    • Jak kategoryzować?
    • Co pominąć?
  • Wybór wizualizacji i narracji kształtuje przekaz
  • Te same dane, różne opowieści

Iluzja obiektywności — przykłady

  • Bezrobocie — różne definicje dają różne liczby
    • Kto jest „bezrobotny”? Zniechęceni? Częściowo zatrudnieni?
  • Przestępczość — dane policyjne ≠ rzeczywista przestępczość
    • Zależy od tego, co jest zgłaszane i rejestrowane
  • PKB — nie mierzy pracy domowej, wolontariatu, szarej strefy
  • „Bezrobocie 2,8%“ i „bezrobocie 12,4%“ mogą opisywać tę samą sytuację

Bezrobocie — pięć definicji, pięć liczb

Sedno: wybór definicji to wybór narracji. „Rekordowo niskie bezrobocie” i „co ósmy chciałby pracować więcej” są równocześnie prawdziwe.

Przestępczość — co ginie między zdarzeniem a statystyką

Sedno: „dane policyjne” to obraz tego, co zostało zgłoszone i zarejestrowane, nie tego, co się wydarzyło. Spadek przestępczości może oznaczać spadek zgłaszalności — np. wśród ofiar przemocy domowej.

Gospodarka, której nie ma w statystykach

Sedno: kategoria „gospodarka” zawęża się do tego, co wymienialne na rynku. Praca, na której opiera się reprodukcja społeczna — głównie kobiet — po prostu nie istnieje w statystykach wzrostu.

Kiedy dana nie jest pomiarem

Coraz częściej liczba w arkuszu nie pochodzi z liczenia, tylko z modelu:

  • Prognozy demograficzne GUS — ludność powiatu w 2050 r. to oszacowanie, nie pomiar
  • Ubóstwo energetyczne — estymacja małych obszarów (small area estimation): model przerzuca dane z poziomu kraju na poziom gminy
  • Scoring i mapy ryzyka„ryzyko recydywy 23%“ to predykcja algorytmu trenowanego na historycznych danych (z ich uprzedzeniami)
  • Imputacja braków„dochód = 4200 zł” w mikrodanych może być wartością wpisaną z modelu, bo respondent odmówił odpowiedzi

Co dziennikarz powinien sprawdzić, zanim użyje takiej liczby:

  • Jakie są założenia modelu (np. czy trendy się utrzymają)?
  • Jaka jest niepewność (przedział ufności, alternatywne scenariusze)?
  • Kto i na jakich danych model trenował?

Kto tworzy dane, kto jest w nich niewidzialny?

  • Władza nad definicjami — kto decyduje o kategoriach?
  • Instytucjonalne uprzedzenia utrwalone w zbiorach danych
  • Grupy pomijane w statystykach:
    • Osoby niebinarne w formularzach M/K
    • „Ukryci bezdomni” (u rodziny, w samochodach)
    • Ofiary przemocy domowej traktowanej jako „sprawa prywatna”

Zasada narracyjna: brak danych to też historia. „Dane o tym zjawisku nie są zbierane, bo…“ — to dobry początek artykułu.

Trzy typowe problemy etyczne

  • Przyczynowość vs korelacja — nie pisz „X spowodowało Y”, jeśli masz tylko współwystępowanie
  • Uogólnianie z próby — średnia dla „Polaków” może ukrywać dramatyczne różnice między grupami
  • Wizualizowanie stereotypów — prawdziwe dane o nierównościach mogą wzmocnić uprzedzenia, jeśli prezentowane bez kontekstu

Lista kontrolna przed publikacją

  • □ Pytanie badawcze jest konkretne i zrozumiałe dla czytelnika
  • □ Mam newsową liczbę, która zatrzymuje
  • □ Wszystkie źródła są podane i weryfikowalne
  • □ Lead ma bohatera, miejsce, czas i liczbę
  • □ Struktura ma rytm (liczba → historia → wykres → głos → liczba)
  • □ Nie sugeruję przyczynowości tam, gdzie jest tylko korelacja
  • □ Opisałem/am ograniczenia metodologiczne
  • □ Pokazałem/am, czego dane nie mówią

☕ Przerwa (15 min)

Po przerwie: ćwiczenie narracyjne — każda grupa dostaje zestaw danych (tylko wykresy, bez tekstu) i buduje plan artykułu.

Część 2: ćwiczenie narracyjne

Sześć grup, sześć różnych zestawów danych. Zbuduj plan artykułu tylko na podstawie wykresów.

Zadanie

Każda grupa dostaje jeden handout z wykresami pochodzącymi z rzeczywistego projektu dziennikarstwa danych (nie są to wasze projekty). Nie znacie ani tytułu, ani oryginalnej narracji. Macie tylko wykresy.

Waszym zadaniem nie jest napisanie artykułu, tylko jego planu — dokumentu, na podstawie którego dziennikarz mógłby usiąść i tekst dopiero zacząć pisać. Plan jest mniejszy niż artykuł, ale kompletny w sensie decyzyjnym: każda decyzja narracyjna jest podjęta i uzasadniona.

Co znajdzie się w planie

  1. Pytanie badawcze + uzasadnienie (konkretność, nieoczywistość, znaczenie dla czytelnika)
  2. Newsowa liczba + test (zrozumiała? zaskakująca? weryfikowalna? z mianownikiem?) + odrzucone alternatywy
  3. Typ narracji (odkrycia / weryfikacji / trendu) + dlaczego nie dwa pozostałe
  4. Bohater i lead — skąd wzięty, pełny szkic leadu (80–100 słów), anatomia leadu
  5. Tradycyjne dziennikarstwo — 5 konkretnych elementów (ekspert, case study, reportaż, głos krytyczny, kontekst)
  6. Tytuł + test + odrzucone alternatywy
  7. Format — artykuł / infografika / wideo / interaktywne; z uzasadnieniem

Co prezentujecie (5 min na grupę)

  1. Pytanie badawcze + newsowa liczba + dlaczego ta liczba (1 min)
  2. Typ narracji + uzasadnienie wyboru (1 min)
  3. Bohater i lead — skąd bohater + przeczytajcie lead na głos (1 min)
  4. Tradycyjne dziennikarstwo + format — konkretne elementy, konkretny wybór (1,5 min)
  5. Tytuł artykułu + test (komunikuje wniosek, nie opisuje danych) (0,5 min)

Kluczowe wnioski

Kluczowe wnioski

  • Dane to nie historia — historia wymaga bohatera, konfliktu, rozwiązania
  • Każda dobra historia danych ma jedną newsową liczbę
  • Lead z konkretną osobą, miejscem, czasem i liczbą wciąga mocniej niż każda tabela
  • Format to decyzja dziennikarska — artykuł, infografiki, wideo, interaktywne
  • Dane nie są obiektywne — ktoś zdecydował, co mierzyć, jak kategoryzować i co pominąć
  • Najlepsze projekty łączą dane z tradycyjnym dziennikarstwem — ani jedno, ani drugie samo nie wystarczy

Przed prezentacją projektu (06.06)

  • Wróćcie do planu projektu z seminarium 2 + wizualizacji z seminarium 4
  • Ustalcie jedną newsową liczbę i jeden główny typ narracji
  • Napiszcie lead (3–4 zdania) — przeczytajcie go na głos; czy wciąga?
  • Sprawdźcie rytm — naprzemiennie liczba → historia → wykres → głos
  • Dopiszcie metodologię — co wiecie, czego nie wiecie, gdzie są ograniczenia