Podstawy dziennikarstwa danych

Wprowadzenie do dziennikarstwa danych

Ben Stanley

Wydział Nauk Społecznych, Uniwersytet SWPS

28 marca 2026

Sprawy administracyjne

Informacje podstawowe

Kierunek: Dziennikarstwo i komunikacja społeczna (studia niestacjonarne, I stopień)
Semestr: letni 2025/2026
Prowadzący: dr hab. Benjamin Stanley, prof. Uniwersytetu SWPS
Kontakt: bstanley@swps.edu.pl
Materiały: Google Classroom

Treści programowe

28.03 Wprowadzenie do dziennikarstwa danych
- Czym jest a czym nie jest dziennikarstwo danych (warsztaty: dyskusja, case study, podział na grupy)
- Po co nam kolejny gatunek dziennikarstwa? (dyskusja)
- Praca w grupach: propozycja tematu materiału w ramach projektu zaliczeniowego

Treści programowe

18.04 Źródła i pozyskiwanie danych
- Skąd brać dane w data journalism? (praca w grupach: źródła danych dla materiału w ramach projektu zal.)
- Wiarygodne i wartościowe źródła danych
- Zasady etycznego pozyskiwania danych

Treści programowe

25.04 Narzędzia i analiza danych
- Narzędzia do pozyskiwania i analizy danych (praca w grupach: dobór narzędzi do projektu zaliczeniowego)
- Pułapki dziennikarstwa danych (dyskusja, praca w grupach: opis ryzyk związanych z materiałem)

Treści programowe

09.05 Wizualizacja danych
- Wizualizacja danych: zasady i narzędzia
- Praca w grupach: projekt wizualizacji danych w ramach projektu zaliczeniowego

Treści programowe

16.05 Budowanie narracji i perspektywa krytyczna
- Budowanie narracji w oparciu o dane (data storytelling)
- Krytyka dziennikarstwa danych i rozważania o przyszłości gatunku (dyskusja)
- Konsultacja projektów zaliczeniowych

Treści programowe

06.06 Prezentacje studenckie
- Osoby studiujące będą proszone o podział na 5-osobowe grupy.
- Aby uzyskać zaliczenie, każda z grup musi przygotować projekt zaliczeniowy, będący podstawą zaliczenia.
- Projektem jest treść dziennikarska z gatunku data journalism opracowana z wykorzystaniem i na podstawie konkretnie wskazanych danych oraz narzędzi do analizy i wizualizacji.

Zaliczenie

Osoby studiujące będą proszone o podział na 5-osobowe grupy
Aby uzyskać zaliczenie, każda z grup musi przygotować projekt zaliczeniowy
Projektem jest treść dziennikarska z gatunku data journalism opracowana z wykorzystaniem i na podstawie konkretnie wskazanych danych oraz narzędzi do analizy i wizualizacji
Grupy prezentują projekty na ostatnich zajęciach (06.06)
Szczegółowa instrukcja i rubrika oceny: handout (Podstawy dziennikarstwa danych projekt zaliczeniowy)

Plan dzisiejszego spotkania

Część 1 (~40 min): Czym jest a czym nie jest dziennikarstwo danych
- Definicja i cechy dziennikarstwa danych
- Czym dziennikarstwo danych nie jest
- Case studies: przykłady dziennikarstwa danych
Część 2 (~30 min): Po co nam kolejny gatunek dziennikarstwa?
- Ewolucja mediów i nowe potrzeby
- Wyzwania współczesnych mediów
- Dziennikarstwo danych jako rozwiązanie
☕ Przerwa (15 min)
Część 3 (~35 min): Ćwiczenia grupowe
- Ćwiczenie 1: analiza scenariuszy
- Ćwiczenie 2: wybór tematu projektu końcowego

Część 1: Czym jest a czym nie jest dziennikarstwo danych

Definicja dziennikarstwa danych

Dziennikarstwo danych to metoda pracy, w której dane są głównym źródłem, narzędziem i dowodem reporterskim.

Połączenie warsztatu dziennikarskiego z analizą i wizualizacją danych
Weryfikacja i odkrywanie historii poprzez analizę zbiorów danych
Prezentacja wyników w przystępnej, często interaktywnej formie
Ujawnianie wzorców i trendów niewidocznych gołym okiem

Cechy dziennikarstwa danych

Przejrzystość — udostępnianie źródeł i metod
Reprodukowalność — możliwość samodzielnego sprawdzenia analiz
Rzetelność — dane jako podstawa narracji, nie jej ozdoba
Interaktywność — angażujące wizualizacje zamiast statycznych wykresów
Precyzja — dokładność w interpretacji i uczciwość wobec ograniczeń danych

Dziennikarstwo danych: mit a rzeczywistość

Cytowanie statystyk w artykule
Wklejenie wykresu z raportu GUS-u
Sensacyjny nagłówek oparty na jednej liczbie
Wybieranie tylko wygodnych danych (cherry-picking)
Korelacja jako dowód przyczynowości

Samodzielna analiza danych jako podstawa tekstu
Krytyczny dobór i weryfikacja źródeł
Narracja zakorzeniona w pełnym kontekście danych
Rzetelna prezentacja także niewygodnych wyników
Ostrożność w interpretacji związków statystycznych

Case study 1: Nadużycia w sieci kalifornijskich szpitali

Reporterzy California Watch prześledzili dane medyczne dotyczące pacjentów w wieku 65+ w kalifornijskich szpitalach
Celem dziennikarskiego śledztwa w oparciu o dane było ujawnienie nadużyć jednej z większych sieci szpitali, polegających na podwyższaniu klasyfikacji choroby (upcoding), aby otrzymać wyższą refundację za pacjenta

Nadużycia w sieci kalifornijskich szpitali

Dane jasno pokazały pewne anomalie w niektórych placówkach, takie jak np. bardzo wysoki odsetek pacjentów z niedożywieniem
Szczególnie uderzające było raportowanie przez szpitale sieci jednostki chorobowej o nazwie Kwashiorkor, czyli zespół niedoboru białka, choroby odnotowywanej głównie u dzieci w dotkniętych głodem w krajach rozwijających się
Współczynnik przypadków odnotowania tej choroby w szpitalach był o 70 razy większy niż w pozostałych placówkach

Nadużycia w sieci kalifornijskich szpitali

Nadużycia w sieci kalifornijskich szpitali

Do pracy wykorzystano bazy kalifornijskiego Departamentu Zdrowia, które zawierają szczegółowe informacje na temat wszystkich osób leczonych w stanowych szpitalach
Bazy nie zawierają informacji o imieniu i nazwisku, podają jednak wiek pacjenta, nazwę szpitala, sposób zapłaty oraz schorzenia w oparciu o międzynarodową klasyfikację ICD-9
Reporterzy wzięli pod lupę 6 lat, czyli musieli zmierzyć się z bazą danych liczącą 24 mln rekordów

Case study 2: Dotacje na transport publiczny w Argentynie

Dziennikarze jednego z największych argentyńskich dzienników La Nacion postanowili prześledzić wykorzystanie dotacji na publiczny transport
Temat wywołał zainteresowanie mediów ze względu na ogromne sumy przekazywane rokrocznie na publiczny transport autobusowy, co nie znajdowało odzwierciedlenia w jakości usług

Dotacje na transport publiczny

Efektem prac zespołu złożonego z dziennikarzy, programisty, statystyka i projektanta wizualizacji było stworzenie wyszukiwarki linii i firm transportowych
Narzędzie umożliwia sprawdzenie, jakie fundusze są przekazywane na konkretne przedsiębiorstwo oraz w jaki sposób są wykorzystywane
Ze względu na formę dostępnych danych, stworzono skrypt programistyczny (scraper), który pozwalał na automatyczne pobieranie plików ze strony www i konwersję PDF-ów na pliki Excel i pliki bazodanowe

Dotacje na transport publiczny

Case study 3: Zamieszki w Wielkiej Brytanii

Latem 2011 roku Wielka Brytania została dotknięta falą zamieszek
Politycy sugerowali, że zamieszki te kategorycznie nie były powiązane z ubóstwem, zaś osoby, które dokonywały grabieży, były zwyczajnymi przestępcami
Premier sugerował tymczasowe wyłączenie mediów społecznościowych

Zamieszki w Wielkiej Brytanii

The Guardian, we współpracy z London School of Economics, przeprowadził przełomowy projekt “Reading the Riots”
Poprzez połączenie danych o związanych z wykluczeniem społecznym z miejscem zamieszek, dziennikarze obalili główną narrację polityczną, mówiącą, że zamieszki nie mają żadnego związku z ubóstwem
Wizualizacja hashtagów na Twitterze pokazała, że platforma była używana głównie do reagowania na zamieszki (np. #riotcleanup), a nie do organizowania grabieży

Zamieszki w Wielkiej Brytanii

Case study 4: Obraz działań wojennych (WikiLeaks)

Dziennikarze otrzymali dane na temat działań wojennych w Afganistanie od organizacji WikiLeaks
Dane pokazały, że południe Afganistanu było obszarem najciężej dotkniętym działaniami wojennymi
Stworzono interaktywną mapę z wszystkimi incydentami, w których zginęła przynajmniej jedna osoba
W Iraku wśród 60 000 zdarzeń ze śmiertelnymi ofiarami uderzająco wysoki był odsetek cywilów

Obraz działań wojennych

Kluczowe kompetencje

Analityczne

Praca z bazami danych
Podstawy statystyki opisowej i wnioskowania
Krytyczna ocena metodologii
Wykrywanie błędów i manipulacji danymi

Techniczne

R, Python lub SQL do analizy
Narzędzia wizualizacji (Datawrapper, Flourish, ggplot2)
Pobieranie danych przez API i scraping
Praca z różnymi formatami (CSV, JSON, XML)

Dziennikarskie

Rozpoznawanie historii ukrytej w danych
Weryfikacja źródeł i danych
Pisanie dla niespecjalistów
Wywiad ekspercki jako uzupełnienie analizy

Proces pracy z danymi

Pozyskiwanie — źródła otwarte, dostęp do informacji publicznej, API, scraping
Czyszczenie — usuwanie błędów i duplikatów, standaryzacja formatów
Analiza — statystyki opisowe, porównania, identyfikacja wzorców i anomalii
Weryfikacja — konfrontacja wyników z ekspertami, testowanie alternatywnych interpretacji
Publikacja — wizualizacje, udostępnienie danych i kodu źródłowego, przejrzysta dokumentacja metodologii

Redakcje i projekty warte śledzenia

Polska

OKO.press — praworządność, nierówności społeczne
Gazeta Wyborcza — mapy i analizy wyborcze
Konkret24 / Demagog — fact-checking oparty na danych
money.pl / Business Insider — analizy ekonomiczne

Świat

ProPublica — śledcze z otwartymi danymi i kodem
The New York Times (The Upshot) — wizualizacje polityczne i społeczne
The Guardian (Datablog) — pionier gatunku
OCCRP — korupcja i przestępczość transgraniczna

Część 2: Po co nam kolejny gatunek dziennikarstwa?

Ewolucja mediów

Epoka	Cechy	Konsekwencje
Prasa drukowana	Wysoki koszt, długi cykl	Dziennikarze jako „gatekeepers”
Telewizja	Transmisja na żywo, masowy zasięg	Wysoki poziom zaufania społecznego
Internet	Niski koszt wejścia, globalny zasięg	Demokratyzacja, ale i chaos informacyjny
Media społecznościowe	Miliardy twórców treści	Algorytmy jako nowi „gatekeepers”

Danych jest więcej niż kiedykolwiek

Sektor publiczny otwiera dane — dane.gov.pl, data.europa.eu, GUS BDL: setki tysięcy zbiorów dostępnych bezpłatnie
Firmy i instytucje publikują raporty — banki centralne, WHO, Eurostat, organizacje pozarządowe
Ślady cyfrowe — media społecznościowe, rejestry transakcji, dane geolokalizacyjne
Problem nie brzmi już „skąd wziąć dane?” lecz „jak je zrozumieć?“

Współczesne wyzwania mediów

Infodemia — nadmiar treści utrudnia odróżnienie sygnału od szumu
Dezinformacja — fałszywe statystyki i zmanipulowane wykresy są łatwe do wyprodukowania i trudne do obalenia
Polaryzacja — bańki algorytmiczne wzmacniają narracje grupowe kosztem faktów
Erozja zaufania — coraz mniej czytelników ufa mediom głównego nurtu
Złożoność — klimat, gospodarka, zdrowie publiczne wymagają rozumienia systemów, nie anegdot

Manipulacja danymi — przykłady

Politycy: „Bezrobocie spadło o 50%” — ale od jakiego poziomu, w jakiej grupie wiekowej, przy jakiej definicji?
Korporacje: Volkswagen (Dieselgate) — dane o emisjach fałszowane przez lata wobec regulatorów
Instytucje: statystyki kryminalne bez kontekstu demograficznego lub przestrzennego
Media: powielanie korelacji jako przyczyny — „jedzenie czekolady a nagrody Nobla”

Dane można zmanipulować. Można też ich użyć, żeby manipulację ujawnić.

Dziennikarstwo danych jako odpowiedź

Co wnosi

Argumenty zakorzenione w danych, nie w opiniach
Przejrzystość: źródła i kod dostępne publicznie
Weryfikowalność: analiza możliwa do powtórzenia
Głębia: nie tylko „co”, ale „jak często” i „dla kogo”
Przystępność: interaktywne wykresy zamiast tabel

Kiedy jest potrzebne

Skala przekracza możliwości anegdotycznych relacji
Trzeba uchwycić wzorce w czasie lub przestrzeni
Porównanie systematycznych różnic między grupami
Ujawnienie dysproporcji wymagających kwantyfikacji
Weryfikacja twierdzeń politycznych lub korporacyjnych

Ocena krytyczna gatunku

Argumenty za

Nagrody Pulitzera za projekty data-driven (ProPublica, NYT)
Odpowiada na potrzeby cyfrowego odbiorcy
Wykorzystuje rosnącą dostępność danych publicznych
Podnosi standardy weryfikacji w całej redakcji
Wzmacnia debatę publiczną opartą na faktach

Argumenty przeciw

Wyklucza dziennikarzy bez kompetencji technicznych
Wysokie koszty narzędzi i szkoleń
Ryzyko „młotka szukającego gwoździ” — technologia napędza tematy
Liczby nie zastąpią ludzkiego wymiaru historii
„Kłamstwa, przeklęte kłamstwa i statystyki” — możliwość manipulacji pozostaje

☕ Przerwa

Część 3: Ćwiczenia grupowe

Podział na grupy

Proszę podzielić się na 6 grup
Każda grupa będzie pracować nad projektem zaliczeniowym przez cały semestr
Role w grupie mogą obejmować:
- Osoba odpowiedzialna za pozyskiwanie i czyszczenie danych
- Osoba odpowiedzialna za analizę
- Osoba odpowiedzialna za wizualizację
- Osoba odpowiedzialna za narrację i redakcję
- Osoba koordynująca pracę grupy

Ćwiczenie 1: analiza scenariuszy

Każda grupa otrzymuje scenariusz opisujący temat, który dziennikarz mógłby chcieć zbadać
Zadanie 1: Jakie aspekty historii wymagają tradycyjnego dziennikarstwa, a jakie wymagają dziennikarstwa danych?
Zadanie 2: Sformułujcie hipotezy badawcze, które wymagają podejścia opartego na danych
Zadanie 3: Naszkicujcie plan projektu dziennikarstwa danych

Grupa 1: Pustoszejące szkoły

Tradycyjne vs. danych

Tradycyjne: wywiady z dyrektorami, rodzicami, reportaże z zamykanych szkół
Danych: skala ogólnokrajowa, wzorce przestrzenne i czasowe, korelacje z demografią
Anegdoty mogą być nietypowe — potrzebny kontekst liczbowy

Hipotezy i dane

Spadek szkół w miastach, wzrost na przedmieściach
Korelacja ze zmianami liczby dzieci w wieku szkolnym
Suburbanizacja jako czynnik napędowy
Dane: SIO (szkoły, uczniowie), GUS BDL (demografia, migracje)

Grupa 1: Pustoszejące szkoły — plan projektu

Pytanie: Jak zmienia się sieć szkół podstawowych i w jakim stopniu zmiany odzwierciedlają suburbanizację i spadek dzietności?
Metody: szeregi czasowe, korelacje, grupowanie gmin
Wizualizacja: mapa choropletowa zmian, wykresy liniowe miasto vs. przedmieścia, scatter plot migracje vs. szkoły
Wyzwania: filie i punkty szkolne nieujęte w danych, łączenie szkół vs. zamykanie, zmiany granic administracyjnych

Grupa 2: Kolej nierównych prędkości

Tradycyjne vs. danych

Tradycyjne: reportaż z podróży opóźnionym pociągiem, wywiady z pasażerami i pracownikami PKP
Danych: systematyczna analiza punktualności i dostępności na wszystkich liniach
Opinie z forów to próba niereprezentatywna

Hipotezy i dane

Punktualność poprawiła się na zmodernizowanych liniach, ale pogorszyła na pozostałych
Inwestycje skoncentrowane na głównych trasach
Nierówna dostępność kolejowa wschód–zachód
Dane: UTK (punktualność, pasażerowie), PKP PLK (inwestycje), rozkłady jazdy

Grupa 2: Kolej nierównych prędkości — plan projektu

Pytanie: Czy inwestycje kolejowe poprawiają jakość równomiernie, czy pogłębiają różnice regionalne?
Metody: difference-in-differences (przed/po modernizacji), analiza przestrzenna dostępności, korelacja nakładów z jakością
Wizualizacja: mapa sieci kolorowana wg punktualności, wykresy before/after, mapa „białych plam” kolejowych
Wyzwania: odwołane pociągi nieujęte w statystykach punktualności (survivorship bias), remonty tymczasowo pogarszają warunki

Grupa 3: Zielone obietnice miast

Tradycyjne vs. danych

Tradycyjne: wywiady z prezydentem i opozycją, rozmowy z ekspertami klimatycznymi
Danych: niezależna weryfikacja twierdzeń obu stron, porównanie danych z różnych źródeł
Spór jest techniczny — dotyczy metodologii pomiaru emisji

Hipotezy i dane

Cele osiągnięte dzięki zmianie metodologii, nie faktycznej redukcji
Spadek CO₂ nie przełożył się na poprawę jakości powietrza (PM2.5)
Polskie miasta wypadają gorzej niż europejskie przy jednolitej metodologii
Dane: GIOŚ, KOBiZE, Covenant of Mayors, Eurostat, CEEB

Grupa 3: Zielone obietnice miast — plan projektu

Pytanie: Czy deklarowane redukcje emisji odpowiadają rzeczywistej poprawie jakości środowiska?
Metody: krzyżowa walidacja danych z różnych źródeł, korelacja emisji z pomiarami jakości powietrza, benchmarking europejski
Wizualizacja: wykres deklaracje vs. pomiary, mapa stężeń zanieczyszczeń, ranking miast polskich i europejskich
Wyzwania: różne metodologie miast, nierównomierne pokrycie stacjami GIOŚ, emisje CO₂ ≠ jakość powietrza

Grupa 4: Recepty na pustym biurku

Tradycyjne vs. danych

Tradycyjne: reportaż z kolejki, wywiady z pacjentami i lekarzami
Danych: ogólnokrajowa mapa dostępności, identyfikacja czynników wyjaśniających różnice
Ogólna liczba lekarzy może rosnąć, a regionalne niedobory pogłębiać się jednocześnie

Hipotezy i dane

Czas oczekiwania silnie zróżnicowany regionalnie
Nowi specjaliści koncentrują się w dużych ośrodkach
Najdłuższe kolejki tam, gdzie lekarze najstarsi
Dane: NFZ (kolejki), NIL (rejestr lekarzy, wiek), GUS (demografia)

Grupa 4: Recepty na pustym biurku — plan projektu

Pytanie: Jak wygląda przestrzenne zróżnicowanie dostępności opieki specjalistycznej i jakie czynniki je wyjaśniają?
Metody: wskaźnik lekarzy na 10 tys. mieszkańców, korelacja z czasem oczekiwania, prognoza niedoborów (piramida wiekowa), grupowanie powiatów
Wizualizacja: mapa choropletowa kolejek, mapa gęstości lekarzy, piramida wiekowa wg specjalności, ranking specjalności
Wyzwania: dane NFZ nie obejmują wizyt prywatnych, pacjenci w kilku kolejkach, lekarze pracujący w wielu miejscach

Grupa 5: Niewidzialni pracownicy

Tradycyjne vs. danych

Tradycyjne: historie kurierów na zleceniu, reportaż z budowy, wywiady z inspektorami pracy
Danych: oszacowanie skali zjawiska, zestawienie danych z wielu źródeł
Stopa bezrobocia nie mówi nic o jakości zatrudnienia

Hipotezy i dane

Rośnie udział umów cywilnoprawnych kosztem umów o pracę
Oficjalna stopa bezrobocia nie uwzględnia osób zniechęconych i przymusowo niepełnoetatowych
Szara strefa większa w regionach o niższym PKB
Dane: GUS/BAEL, ZUS (składki), PIP (kontrole), Eurostat

Grupa 5: Niewidzialni pracownicy — plan projektu

Pytanie: Jaka jest rzeczywista skala niestandardowego i nieformalnego zatrudnienia i w jakim stopniu oficjalne statystyki ją ukrywają?
Metody: analiza struktury form zatrudnienia w czasie, alternatywne wskaźniki rynku pracy (U-6), analiza regionalna, benchmarking europejski
Wizualizacja: stacked area struktury zatrudnienia, porównanie stopy bezrobocia z szerszymi miarami, mapa regionalna, porównanie z UE
Wyzwania: szara strefa trudna do zmierzenia, deklaracje respondentów, zmieniające się kategorie, dane ZUS tylko dla zarejestrowanych

Grupa 6: Cyfrowa przepaść pokoleniowa

Tradycyjne vs. danych

Tradycyjne: reportaż z seniorami, wywiady z pracownikami urzędów, relacja z kursów komputerowych
Danych: skala wykluczenia, profil demograficzny wykluczonych, porównanie z UE
Wzrost e-usług nie oznacza, że wszyscy z nich korzystają

Hipotezy i dane

Osoby 65+ korzystają z e-usług kilkukrotnie rzadziej niż 25–44
Wykluczenie ma wymiar wiekowy, geograficzny i ekonomiczny
Polska gorzej niż średnia UE w umiejętnościach cyfrowych seniorów
Dane: GUS (badanie ICT), Min. Cyfryzacji, Eurostat/DESI, UKE

Grupa 6: Cyfrowa przepaść pokoleniowa — plan projektu

Pytanie: Kto korzysta, a kto nie korzysta z cyfrowych usług publicznych, jakie czynniki decydują o wykluczeniu i jak Polska wypada na tle UE?
Metody: tabele krzyżowe (wiek × wykształcenie × miejsce), wskaźniki wykluczenia, porównanie DESI, korelacja infrastruktura vs. korzystanie
Wizualizacja: wykres słupkowy wg grup wiekowych, mapa dostępności internetu, wykres radarowy Polska vs. UE, heatmapa wiek × wykształcenie
Wyzwania: dane Min. Cyfryzacji mogą nie być dostępne w podziale demograficznym, „korzystanie z internetu” ≠ obsługa formularzy urzędowych

Ćwiczenie 2: wybór tematu projektu końcowego

Każda grupa przygotowuje propozycję tematu projektu
- Temat projektu — jaki problem chcecie zbadać?
- Pytanie badawcze — konkretna hipoteza lub pytanie
- Znaczenie społeczne — kogo to dotyczy i dlaczego ważne?
- Dlaczego dane? — czego nie da się osiągnąć tradycyjnym dziennikarstwem?
- Źródła danych — skąd dane i czy są dostępne?
Szczegółowe instrukcje: handout (Podstawy dziennikarstwa danych 1 exercise 2)

Najczęstsze błędy projektów

Zbyt szeroki temat — brak fokusa
- Zły przykład: „Problemy polskiej gospodarki”
- Dobry przykład: „Bezrobocie wśród absolwentów w woj. mazowieckim 2020–2025”
Niedostępne dane — sprawdźcie dostępność danych PRZED wyborem tematu
Słaba wizualizacja — za dużo informacji na jednym wykresie
Brak kontekstu — dane bez interpretacji
Powierzchowna analiza — same średnie bez analizy rozkładu

Wskazówki dla sukcesu

Wybierz temat, który Cię interesuje — pasja przekłada się na jakość
Sprawdź dostępność danych wcześnie — plan B, jeśli dane niedostępne
Zaplanuj czas na trudności techniczne — czyszczenie danych zajmuje 50–80% czasu
Skonsultuj interpretacje z ekspertami — dodają wiarygodność
Testuj zrozumiałość na osobach z zewnątrz — jeśli oni zrozumieją, każdy zrozumie

Kluczowe wnioski

Dziennikarstwo danych odpowiada na realne potrzeby współczesnego społeczeństwa
Nie każdy temat wymaga dziennikarstwa danych — klucz to rozpoznanie, kiedy dane są niezbędne
Sukces projektu zależy od: dostępności danych, jasnego pytania badawczego i motywacji dziennikarskiej
Tradycyjne dziennikarstwo i dziennikarstwo danych się uzupełniają, nie wykluczają