Dokumentacja projektu

Dziennikarstwo danych — Projekt zaliczeniowy

Autorzy

Zofia Kowalczyk

Piotr Nowak

Anna Lewandowska

Jan Wiśniewski

Opublikowano

15 maja 2026

1. Temat projektu

Tytuł: Niewidzialne na planie: dysproporcje płciowe w przemyśle filmowym

Format: Artykuł dziennikarski z wizualizacjami (HTML)

Uzasadnienie wyboru tematu

Nierówności płciowe w przemyśle filmowym to temat o istotnym znaczeniu społecznym, kulturowym i ekonomicznym. Wybraliśmy go z kilku powodów:

  1. Aktualność — debata o równości płci w Hollywood i w polskim kinie trwa od czasu ruchu #MeToo i nie ustaje: kolejne raporty branżowe (USC Annenberg, Women in Film) pokazują wolne tempo zmian.

  2. Wpływ kulturowy — film jako medium kształtuje społeczne normy i wyobrażenia. To, kto pojawia się na ekranie i w jakich rolach, ma mierzalny wpływ na wybory zawodowe i aspiracje kolejnych pokoleń.

  3. Dostępność danych — USC Annenberg Inclusion Initiative, SAG-AFTRA, Directors Guild of America i Writers Guild of America publikują regularnie szczegółowe dane branżowe, co umożliwia pogłębioną analizę ilościową.

  4. Wielowymiarowość — temat obejmuje wiele wymiarów: wynagrodzenia, główne role, funkcje produkcyjne, stereotypy, trajektorie kariery, nagrody.

  5. Porównanie polskie — dane Polskiego Instytutu Sztuki Filmowej pozwalają odnieść globalny obraz do polskiej branży filmowej.

2. Źródła danych

Źródło Dane Link
USC Annenberg Inclusion Initiative Reprezentacja w głównych rolach, role produkcyjne annenberg.usc.edu/research
Forbes Celebrity 100 Szacunki wynagrodzeń najlepiej zarabiających aktorów forbes.com
SAG-AFTRA Wynagrodzenia aktorów według wieku sagaftra.org
Directors Guild of America Dane o reżyserach w głównych produkcjach dga.org
Writers Guild of America Dane o scenarzystach w głównych produkcjach wga.org
Geena Davis Institute Kategoryzacja typów ról seejane.org
Polski Instytut Sztuki Filmowej Dane o polskich produkcjach pisf.pl

Metoda pozyskania: Dane zostały pobrane z publicznych raportów branżowych oraz baz danych dostępnych online, a następnie przetworzone w R.

3. Metody analizy danych

Wskaźniki i miary

  • Luka płacowa — różnica procentowa między średnimi zarobkami aktorów i aktorek w grupie dziesięciu najlepiej zarabiających
  • Profil zarobkowy według wieku — średnie wynagrodzenie za film w kolejnych grupach wiekowych
  • Udział w głównych rolach — odsetek głównych ról przyznawanych kobietom w 100 najbardziej dochodowych filmach rocznie
  • Udział w rolach produkcyjnych — odsetek kobiet wśród reżyserów, scenarzystów, producentów, operatorów, kompozytorów i montażystów
  • Indeks stereotypów — różnica w reprezentacji według typu roli (punkty procentowe)

Techniki analityczne

  1. Analiza porównawcza czasowa — zestawienie wskaźników z lat 2013 i 2023 w celu ukazania tempa zmian
  2. Analiza porównawcza płci — różnice między aktorami i aktorkami w zarobkach, rolach, wieku
  3. Kategoryzacja ról — klasyfikacja ról według typu, z wyliczeniem wskaźnika nadreprezentacji
  4. Porównanie międzynarodowe — odniesienie wskaźników amerykańskich do polskich gdzie to możliwe
  5. Projekcje ekstrapolacyjne — prosta projekcja liniowa tempa zmian w celu oszacowania horyzontu parytetu

Ograniczenia metodologiczne

  • Dane dotyczą w większości produkcji wysokobudżetowych (głównie Hollywood) — kino niezależne, dokumentalne i telewizyjne mogą wykazywać inne wzorce.
  • Dane o zarobkach mają charakter szacunkowy, oparty na źródłach nieoficjalnych (kontrakty aktorskie są z reguły objęte klauzulami poufności).
  • Kategoryzacja typów ról zawiera nieuchronnie element interpretacji badacza.
  • Analiza nie uwzględnia wymiaru intersekcjonalnego (rasa, pochodzenie etniczne, orientacja seksualna) — dostępne badania wskazują, że dysproporcje są znacznie większe dla kobiet z mniejszości.
  • Dane dla Polski mają charakter szacunkowy ze względu na niewielką liczbę produkcji rocznie.

4. Narzędzia wizualizacyjne

Narzędzie Zastosowanie
R (tidyverse, ggplot2) Przetwarzanie danych i tworzenie wszystkich wizualizacji
Quarto Integracja kodu, tekstu i wizualizacji w formacie publikacyjnym HTML
showtext Typografia (czcionka Jost z Google Fonts)
ggtext Formatowanie tekstu w wykresach
scales Formatowanie osi (procenty, wartości walutowe)

Decyzje projektowe dotyczące wizualizacji

  • Paleta kolorów: niebieski (#2E86AB) dla danych dotyczących mężczyzn, purpurowy (#A23B72) dla danych dotyczących kobiet; czerwony (#E94F37) jako akcent dla linii parytetu.
  • Typ wykresów: wykresy słupkowe poziome dla łatwości porównywania wielu kategorii; wykresy liniowe dla trendów czasowych; wykresy kolumnowe grupowane dla porównań między latami.
  • Przejrzystość: minimalistyczny design, ograniczenie linii siatki, bezpośrednie etykiety wartości, unikanie dekoracyjnych elementów.
  • Typografia: czcionka Jost (Google Fonts) dla spójności między tytułami, osiami i etykietami.

5. Podział zadań w grupie

Osoba Odpowiedzialność
Zofia Kowalczyk Koordynacja projektu, research akademicki, kontakt ze źródłami, redakcja tekstu narracyjnego
Piotr Nowak Pozyskanie i weryfikacja danych, analiza statystyczna, kontrola jakości danych
Anna Lewandowska Analiza danych w R, tworzenie wizualizacji, kodowanie w Quarto
Jan Wiśniewski Kontekst kulturowy, cytaty ekspertów, wątek polski, korekta

Wspólnie: Dyskusja nad narracją, wybór kluczowych danych do prezentacji, dopracowanie argumentacji artykułu.

6. Refleksja krytyczna

Mocne strony projektu

  • Wielowymiarowa analiza obejmująca zarobki, reprezentację, role produkcyjne, stereotypy i nagrody
  • Oparcie wyłącznie na oficjalnych i dobrze udokumentowanych źródłach branżowych
  • Spójna narracja łącząca dane z kontekstem społecznym i kulturowym
  • Odniesienie globalnego obrazu do polskiej branży filmowej
  • Otwarcie artykułu historią konkretnej osoby (Marta Zawadzka) dla nadania problemowi ludzkiej skali

Ograniczenia i wyzwania

  • Brak dostępu do mikrodanych (np. indywidualnych kontraktów aktorskich) — opieramy się na agregatach i szacunkach
  • Dominacja perspektywy hollywoodzkiej — dane dla Europy, a szczególnie dla Polski, są znacznie mniej systematycznie zbierane
  • Brak uwzględnienia intersekcjonalności (rasa, orientacja seksualna)
  • Dane dotyczą głównie produkcji wysokobudżetowych — kino niezależne i dokumentalne pozostają poza zakresem

Kwestie etyczne

  • Unikaliśmy generalizacji na podstawie pojedynczych wskaźników — każdy argument oparty jest na więcej niż jednym źródle danych
  • Wyraźnie wskazaliśmy ograniczenia metodologiczne w sekcji zamykającej artykuł
  • Nie manipulowaliśmy skalami osi w celu wyolbrzymienia różnic
  • Cytaty ekspertów wybraliśmy tak, aby reprezentowały zróżnicowane perspektywy (badaczki akademickie, osoby z branży)

7. Potencjalny wpływ

Grupa docelowa:

  • Czytelnicy mediów publicystycznych zainteresowani tematyką kultury i nierówności
  • Środowisko akademickie (studia nad płcią, socjologia kultury, medioznawstwo)
  • Profesjonaliści branży filmowej
  • Decydenci polityki kulturalnej (PISF, ministerstwo kultury)

Zastosowania:

  • Publikacja w portalu publicystycznym lub kulturalnym
  • Materiał uzupełniający w kursach z zakresu dziennikarstwa danych, studiów nad mediami, gender studies
  • Punkt wyjścia do debat publicznych o polityce kulturalnej
  • Ilustracja metodologii dziennikarstwa danych dla studentów