Dokumentacja projektu
Dziennikarstwo danych — Projekt zaliczeniowy
1. Temat projektu
Tytuł: „Pieniądze wygrywają mecze: jak nierówności finansowe dzielą europejski futbol”
Format: Artykuł dziennikarski z wizualizacjami (HTML)
Uzasadnienie wyboru tematu
Dysproporcje finansowe w europejskim futbolu to jedno z najważniejszych wyzwań dla przyszłości tego sportu. Wybraliśmy ten temat z kilku powodów:
Aktualność — debata o Superlidze (2021), nowe przepisy Financial Fair Play i rosnące niezadowolenie kibiców sprawiają, że temat pozostaje w centrum publicznej uwagi.
Wymiar społeczny — futbol to nie tylko sport, ale fenomen kulturowy dotykający setki milionów Europejczyków, a rosnące nierówności mają konsekwencje wykraczające poza boisko.
Dostępność danych — UEFA, Deloitte i Forbes publikują szczegółowe dane finansowe i sportowe, co umożliwia pogłębioną, wieloaspektową analizę.
Potencjał wizualizacyjny — temat pozwala na wykorzystanie różnorodnych typów wizualizacji: wykresów porównawczych, wykresów struktury, analiz korelacji i trendów czasowych.
Wymiar polski — pozycja Ekstraklasy i polskich klubów w europejskiej hierarchii finansowej stanowi naturalny punkt odniesienia dla polskiego czytelnika.
2. Źródła danych
Wszystkie wykorzystane dane pochodzą z oficjalnych, publicznych źródeł:
| Źródło | Dane | Link |
|---|---|---|
| Deloitte Football Money League | Przychody klubów i lig (2010-2024) | deloitte.com/uk/football-money-league |
| UEFA Financial Reports | Oficjalne dane finansowe klubów i lig | uefa.com/insideuefa/news |
| UEFA Club Coefficients | Ranking sportowy klubów (5-letni) | uefa.com/nationalassociations/uefarankings |
| Forbes Soccer Valuations | Wartość klubów, dane o właścicielach | forbes.com/soccer-valuations |
| Transfermarkt | Wartość rynkowa zawodników, transfery | transfermarkt.com |
Metoda pozyskania: Dane zostały pobrane z oficjalnych raportów (PDF, Excel), następnie ręcznie wprowadzone do plików CSV i zweryfikowane krzyżowo między niezależnymi źródłami.
3. Metody analizy danych
Wskaźniki i miary
- Przychody całkowite — suma wszystkich przychodów klubu/ligi (€ mln)
- Struktura przychodów — podział na: prawa TV, sponsoring, bilety, dotacje właścicieli
- Budżet na pensje — roczne wydatki na wynagrodzenia zawodników (€ mln)
- UEFA Coefficient Points — punkty w rankingu UEFA za pięć lat (miara sukcesów sportowych)
- Koncentracja bogactwa — procent przychodów kontrolowanych przez top 10/20 klubów
- Współczynnik Giniego — miara nierówności dochodowych (0 = pełna równość, 1 = maksymalna nierówność)
Techniki analityczne
- Analiza korelacji — zależność między budżetem na pensje a wynikami sportowymi (r = 0,87; R² = 0,76)
- Analiza trendów — wzrost koncentracji bogactwa w latach 2010-2024
- Analiza porównawcza — ligi, kluby, typy własności
- Analiza struktury — skład przychodów według źródeł
- Analiza scenariuszowa — dyskusja możliwych kierunków reformy
Ograniczenia metodologiczne
- Różnice księgowe — kluby z różnych krajów stosują różne standardy rachunkowe, co utrudnia bezpośrednie porównania
- Dane niepełne — nie wszystkie kluby publikują pełne dane finansowe; szczególnie dotyczy to mniejszych lig
- Agregacja — analiza na poziomie klubów/lig może maskować różnice wewnętrzne
- Przyczynowość — korelacja między budżetem a wynikami nie oznacza automatycznie przyczynowości, choć w tym wypadku związek jest silnie teoretycznie ugruntowany
4. Narzędzia wizualizacyjne
| Narzędzie | Zastosowanie |
|---|---|
| R (tidyverse, ggplot2) | Przetwarzanie danych i tworzenie wszystkich wizualizacji |
| Quarto | Integracja kodu, tekstu i wizualizacji w formacie publikacyjnym (HTML) |
| showtext | Typografia (czcionka Jost) |
| ggtext | Formatowanie tekstu w wykresach |
| scales | Formatowanie osi i wartości liczbowych |
Decyzje projektowe dotyczące wizualizacji
- Paleta kolorów: niebieski (#2E86AB) dla wartości neutralnych/porównawczych, czerwony (#E94F37) dla wartości wyróżnionych/problematycznych, fioletowy (#A23B72) i pomarańczowy (#F4A261) jako kolory pomocnicze w wykresach wielosegmentowych.
- Typ wykresów: wykresy słupkowe poziome dla łatwości porównania nazw lig i klubów; wykresy skumulowane dla struktury przychodów; wykres rozrzutu dla korelacji budżet-wyniki; wykres warstwowy dla trendu koncentracji w czasie.
- Przejrzystość: minimalistyczny design w duchu Edwarda Tufte’a, ograniczenie linii siatki do minimum, bezpośrednie etykiety wartości na wykresach, rezygnacja z efektów dekoracyjnych.
5. Podział zadań w grupie
| Osoba | Odpowiedzialność |
|---|---|
| Jakub Kowalski | Koordynacja projektu, research źródeł, redakcja tekstu narracyjnego |
| Anna Lewandowska | Pozyskanie i weryfikacja danych, analiza statystyczna w R |
| Michał Nowak | Wizualizacje w ggplot2, kodowanie w Quarto, testowanie renderowania |
| Karolina Wiśniewska | Kontekst sportowy, research sylwetek ekspertów, cytaty, korekta |
Wspólnie: Dyskusja nad narracją artykułu, wybór kluczowych danych do prezentacji, przygotowanie prezentacji końcowej.
6. Refleksja krytyczna
Mocne strony projektu
- Wykorzystanie wyłącznie oficjalnych źródeł statystycznych (Deloitte, UEFA, Forbes), co zapewnia wiarygodność analizy
- Wielowymiarowa analiza łącząca perspektywę finansową, sportową i instytucjonalną
- Spójna narracja otwarta historią wrocławskiego kibica i jego syna, która wprowadza czytelnika w problem poprzez konkretną ludzką perspektywę
- Kontekst polski — artykuł nie pozostawia Ekstraklasy na marginesie globalnego obrazu, lecz używa jej jako punktu odniesienia
- Propozycje rozwiązań — tekst nie kończy się na diagnozie, lecz omawia realne kierunki reform
Ograniczenia i wyzwania
- Uproszczenia — artykuł operuje na poziomie zagregowanym; nie uwzględnia różnic między różnymi sekcjami w ramach tego samego klubu (np. piłka kobieca, akademia)
- Europocentryzm — analiza ograniczona do Europy, choć problem koncentracji bogactwa w sporcie jest zjawiskiem globalnym
- Brak głosu zawodników i działaczy — oparliśmy się głównie na danych i głosach ekspertów akademickich; brakuje perspektywy osób wewnątrz instytucji sportowych
- Statyczność wizualizacji — wykresy ggplot2 są statyczne; interaktywne wersje (np. w Observable lub plotly) lepiej służyłyby eksploracji danych
Kwestie etyczne
- Neutralność prezentacji — mimo że artykuł ma wyraźny przekaz (nierówności rosną i jest to problem), zachowujemy neutralność formalną: prezentujemy dane, cytujemy ekspertów po obu stronach, nie manipulujemy skalami wykresów
- Cherry-picking danych — świadomie wybraliśmy dane pokazujące trend nierówności; czytelnik powinien wiedzieć, że istnieje również narracja o ogólnym wzroście jakości europejskiego futbolu, której w tym tekście nie rozwijamy
- Uproszczenia narracyjne — postaci Piotra i Kacpra Majewskich są fikcyjne, skonstruowane jako narracyjna rama; czytelnik o tym nie wie w trakcie lektury, co stawia pytanie o granice „kolorowej otwartości” w tekście opartym na danych
- Transparentność — każda wizualizacja ma pełne źródło, sekcja metodologiczna opisuje założenia i ograniczenia
Co byśmy zrobili inaczej
- Wywiady terenowe — prawdziwe głosy kibiców z Wrocławia, Lizbony czy Aten zamiast skonstruowanych postaci narracyjnych
- Analiza mikrodanych — dostęp do bazy transferów (np. CIES Football Observatory) pozwoliłby na głębszą analizę przepływów zawodników
- Porównanie z innymi sportami — NBA, NFL i MLB stosują mechanizmy cap’u płacowego i draftów; szczegółowe porównanie pokazałoby, co europejski futbol mógłby przejąć
- Wizualizacja geograficzna — mapa Europy pokazująca koncentrację bogactwa finansowego w klubach byłaby silnym uzupełnieniem wykresów słupkowych