Datenauskünfte

Lanz Mining beschäftigt sich damit Daten zu den geladenen Personen der Talkshows (Talkende) aufzuzeichnen und in Visualisierungen bereitzustellen. Vorläufig ist der Zeitraum von Februar 2024 bis Februar 2025 verfügbar. Jede Sendung besteht aus mehreren Informationshäufchen und orientiert sich an den Talkenden. Je nach Format sind unterschiedliche Informationen verfügbar. Die Crawler können nur die Daten finden, die auch veröffentlicht sind. Es gibt also leider keine Informationen darüber welche Personen für eine Sendung angefragt wurden. Diese Daten haben nur die Redaktionen von ZDF und ARD selbst. Dieses Projekt ist privat entstanden und die Resourcen sind begrenzt, also wurde auch darauf verzichtet die Sendungen selbst herunterzuladen und zu analysieren. Da würde es vermutlich auch rechtliche Probleme geben. Lanz Mining gespeichert also keine Videodaten der Sendungen.

Open Source

Lanz Mining ist vollständig open source und auf Github verfügbar. Für technisch Interessierte gibt es dort auch eine Anleitung, um selbst Daten zu sammeln und eigene analysen zu starten.

Übersicht

Die folgende Tabelle zeigt welche Informationen auf den Webseiten der Talkshowformate verfügbar ist, welche nicht und welche für Lanz Mining genutzt werden.

Markus LanzMaischbergerMaybrit IllnerCaren MiosgaHart aber fair
Beschreibung der Sendung+++++
Länge der Sendung+++++
Datum der Sendung+++++
Faktencheck-(+)+++
Name der Talkenden+++++
Rolle der Talkenden+(-)+++
Ankündigung Talkender+(-)-+-

Bei Maischberger fehlen die meisten Daten, weil es hier nicht ohne zusätzliches speichern von Bildern und OCR möglich ist diese Daten zu befreien. Dafür fehlt allerdings gerade noch die Kapazität um diese zusätzlichen Features zu bauen.
Faktenchecks werden im übrigen noch nicht ausgewertet, das ist ein zukünftiges Projekt, das wird sich dann aber auch nur mit dem Überprüfen von Fakten beschäftigen.

Anmerkungen

Aus den oben genannten Informationen werden weitere herausgelesen, sodass am Ende folgendes genutzt werden kann.

VariableDescriptionData type
episode_nameName der Sendungstring
dateDatum der Veröffentlichungdate
descriptionBeschreibung der Sendungstring
factcheckExistiert ein zugehöriger Faktencheckboolean
lengthLänge der Sendungnumber
nameName der Talkendenstring
roleRolle der Talkenden, wie vom Format veröffentlichtstring
messageAnkündigung einer Talkendenstring
talkshowName der Talkshowstring
partyParteimitgliedschaftstring
groupGruppen zugehörigkeitstring
mediaMedienhaus wenn Talkende teil der Gruppe "Journalismus"string