Datawrapper — poradnik do ćwiczenia
Podstawy dziennikarstwa danych
Do czego służy ten handout: towarzyszy ćwiczeniu „analiza i wizualizacja danych o przestępczości” (seminarium 3). Pokazuje, jak działa Datawrapper i na co zwracać uwagę, ale nie rozwiązuje za was decyzji redakcyjnych — to jest wasza praca. Jeśli chcecie dosłownych kliknięć, skorzystajcie z Datawrapper Academy; tutaj skupiamy się na tym, co jest istotne w kontekście kursu.
Przed rozpoczęciem
- Załóżcie bezpłatne konto na datawrapper.de (Sign up w prawym górnym rogu). Pełen dostęp bez opłat.
- Pobierzcie plik
przestepstwa-powiaty-2025.csvz Resources kursu. - Najpierw policzcie rzeczy w jamovi (patrz handout jamovi) — Datawrapper ma wizualizować odpowiedź, a nie dane same w sobie.
Cztery kroki Datawrapper — zasada ogólna
Każdy wykres w Datawrapper powstaje w tym samym workflow, niezależnie od typu:
- Upload data — wklejcie (Ctrl+V) lub wgrajcie CSV
- Check & describe — potwierdźcie typy kolumn (liczby jako number, tekst jako text, daty jako date)
- Visualize — wybór typu wykresu i cały dobór wizualny (oś, kolor, sortowanie, tytuł, adnotacje)
- Publish & embed — publikacja, link jest natychmiast aktywny
Gdzie spędzicie większość czasu: w kroku 3, w sekcjach Refine (ustawienia wizualne) i Annotate (tytuł, opis, źródło). Kroki 1, 2 i 4 zajmują łącznie ~5 minut.
Po publikacji wykres można dalej edytować. Ten sam link aktualizuje się automatycznie — nie trzeba niczego republikować. Dlatego Publish nie jest ostatecznym zobowiązaniem; możecie opublikować, zobaczyć, jak wygląda „na produkcji”, i dalej poprawiać.
Dobór typu wykresu do pytania
Wasza analiza w jamovi powinna była doprowadzić was do konkretnej historii. Typ wykresu wynika z tej historii — nie z tego, co wygląda efektownie.
| Jaka historia? | Typ wykresu | Dlaczego |
|---|---|---|
| Ranking — „które powiaty są liderami?“ | Bar chart (horizontal) | Długie nazwy po lewej, wartości po prawej, łatwe do czytania |
| Geografia — „gdzie są hotspoty?“ | Choropleth map | Tylko jeśli lokalizacja sama w sobie jest istotą historii |
| Zależność — „czy X idzie w parze z Y?“ | Scatter plot | Dwie zmienne ciągłe; kategorialną dodajcie jako kolor |
| Zmiana w czasie | Line chart | (Nie dotyczy tego ćwiczenia — dane są przekrojowe, nie panelowe) |
| Porównanie dwóch kategorii per grupa | Split bars lub Stacked bars | Np. przyjazd vs wyjazd; rzadko: struktura procentowa |
Reguła: jeśli nie potraficie w jednym zdaniu powiedzieć, jaki wniosek pokazuje ten wykres, typ jest prawdopodobnie zły.
Na co zwracać uwagę przy każdej decyzji
Bar chart — ranking
- Sortowanie: domyślnie malejąco. Top 15 (lub 20), nie wszystkie 380 powiatów — 380 słupków jest całkowicie nieczytelnych.
- Oś X: zaczyna się od zera. Datawrapper to domyślnie ustawia; jeśli zmieniliście, wracajcie. Słupki ze ściętą osią kłamią.
- Kolor: jednolity dla większości, wyróżniony (inny kolor) dla 1–3 pozycji, które komunikują wniosek. Np. jeśli top 3 to hotspoty per capita, dajcie im inny kolor.
- Etykiety wartości bezpośrednio na słupkach — łatwiej czytać niż oś.
Choropleth map
- Matching: Datawrapper automatycznie próbuje łączyć dane po nazwie powiatu — ale w naszym pliku 10 par powiatów ma te same nazwy (brzeski, grodziski, świdnicki…). Łączenie po nazwie dałoby błędne wyniki. Użyjcie kolumny teryt (4-cyfrowy kod TERYT) jako klucza: w kroku Check & describe upewnijcie się, że kolumna teryt jest wybrana jako Match values to map. Mapa Datawrapper wspiera TERYT natywnie — wszystkie 380 powiatów dopasuje się bez błędów.
- Skala kolorów: sekwencyjna (jasny → ciemny), nie dwubiegunowa (czerwony-niebieski), bo nie mamy wartości „ujemnych” i „dodatnich” — wszystkie są liczbami przestępstw.
- Podział na klasy: dla rozkładów silnie prawoskośnych (jak przestępstwa_ogółem) liniowa skala = jedna Warszawa dominuje, reszta jednolita. Użyjcie kwantyli albo skali logarytmicznej. Skośność wskaźnika na 100k jest bliska normalności → liniowa skala jest OK.
- Paleta daltonizm-friendly: Datawrapper ma gotowe zestawy. Unikajcie samodzielnego dobierania kolorów.
Scatter plot
- Osie: X i Y to dwie zmienne ciągłe. W tym ćwiczeniu naturalny wybór: ludność × przestępstwa_ogółem.
- Kolor: trzecia zmienna kategorialna (typ_powiatu) — wtedy wykres opowiada historię „to skala populacji tłumaczy nagłówki”.
- Skala log: jeśli zakres obejmuje 3 rzędy wielkości (jak populacja: 25 tys.–1,9 mln), skala liniowa spłaszcza wszystko poza jednym-dwoma outlierami. Jeśli włączacie log, dopiszcie to w tytule lub notce.
- Linia trendu: opcjonalna, ale jeśli historia jest „wszystko się skaluje proporcjonalnie”, to silna ilustracja.
Tytuł komunikuje wniosek, nie dane
Źle (opisowe, bezużyteczne):
- „Liczba przestępstw w powiatach w 2025 roku”
- „Ranking powiatów pod względem przestępczości”
Dobrze (komunikują wniosek z analizy):
- „Najwięcej zgłoszeń w Warszawie — ale stopa przestępczości najwyższa w bieszczadzkim”
- „W top 10 powiatów per capita nie ma ani jednego miasta”
- „Liczba przestępstw idzie w parze z populacją — to skala, nie bezpieczeństwo, tłumaczy nagłówki”
Test: czy po przeczytaniu samego tytułu (bez wykresu) czytelnik już coś wie? Jeśli nie — tytuł nic nie komunikuje.
Pole Source — obowiązkowo
W Annotate → Notes & Source wpiszcie:
„Dane dydaktyczne — kurs Podstawy dziennikarstwa danych, Uniwersytet SWPS”
Nie podawajcie dane.gov.pl ani Komendy Głównej Policji. Dane są fikcyjne, mylące przypisanie byłoby czerwoną flagą etyczną. Brak źródła = wykres przestaje być dziennikarstwem.
Sprawdzenie przed kliknięciem Publish
Każdy wykres powinien przejść pięć testów. To te same pięć pułapek z wykładu:
- Korelacja vs przyczynowość — czy tytuł nie sugeruje, że coś powoduje coś innego bez podstaw w danych?
- Cherry-picking — czy pokazujecie pełny zakres (top 15 jawnie, wszystkie powiaty na mapie), nie dobór pod tezę?
- Oszukujący wykres — oś od zera? Paleta daltonizm-friendly? Skala log oznaczona?
- Agregacja — czy wybór ogółem vs na 100k jest widoczny w tytule? Czytelnik musi wiedzieć, co ogląda.
- Oficjalne ≠ prawdziwe — czy jest nota „dane dydaktyczne”?
Dwa lub więcej haków na czerwono = wracajcie do Datawrapper. Nie publikujcie wykresu, który sami byście skrytykowali.
Częste problemy i jak je rozwiązać
| Problem | Rozwiązanie |
|---|---|
| Polskie znaki wyświetlają się jako „Å” lub inne dziwaczne | Otwórzcie CSV w edytorze tekstu, zapiszcie jako UTF-8, wgrajcie ponownie |
| Datawrapper rozpoznał liczbę jako tekst | W Check & describe dwuklik na nagłówku → zmień typ na Number |
| Mapa nie rozpoznaje części powiatów | Sprawdźcie, czy Datawrapper łączy po kolumnie teryt (nie powiat). Łączenie po nazwie zawsze psuje się na duplikatach. |
| 380 słupków, chaos | Ograniczcie do top 15–20 (Filter → Show only N) |
| Wykres nieczytelny na telefonie | Kliknijcie ikonę telefonu w prawym górnym rogu podglądu; skróćcie tytuł lub etykiety |
| Kolory za jaskrawe / nieczytelne | Refine → Colors — wybierzcie gotową paletę, nie samodzielnie |
Podgląd mobilny — obowiązkowo
Ponad 60 % polskich czytelników portali jest na telefonie. Wykres, który pięknie wygląda na 27-calowym monitorze, ale nieczytelny na iPhonie, jest w praktyce niewidoczny.
Ikona telefonu w prawym górnym rogu Datawrapper pokazuje wersję mobilną. Sprawdźcie:
- Czy tytuł się mieści (lub zawija się elegancko)?
- Czy etykiety osi nie nakładają się na siebie?
- Czy najważniejsza informacja jest na górze?
Jeśli coś jest złe — najczęstsze poprawki: skrócenie tytułu, zmniejszenie liczby etykiet, inny typ wykresu.
Oddanie pracy
Po opublikowaniu:
- Skopiujcie link z zakładki Publish & embed (format:
https://datawrapper.dwcdn.net/xxxxx/N/) - Wyślijcie na Classroom: link + jedno zdanie uzasadnienia wyboru formatu + jedno zdanie tego, co zrobilibyście inaczej mając więcej czasu
Przydatne zasoby
- Datawrapper Academy — pełna dokumentacja i tutoriale krok po kroku
- Blog Datawrappera — cotygodniowe Weekly Charts, świetna inspiracja
- River — galeria wykresów innych użytkowników; możecie klonować i przerabiać
- Wsparcie:
support@datawrapper.de— odpowiadają szybko i życzliwie