Datenauskünfte
Lanz Mining beschäftigt sich damit Daten zu den geladenen Personen der Talkshows (Talkende) aufzuzeichnen und in Visualisierungen bereitzustellen. Vorläufig ist der Zeitraum von Februar 2024 bis Februar 2025 verfügbar. Jede Sendung besteht aus mehreren Informationshäufchen und orientiert sich an den Talkenden. Je nach Format sind unterschiedliche Informationen verfügbar. Die Crawler können nur die Daten finden, die auch veröffentlicht sind. Es gibt also leider keine Informationen darüber welche Personen für eine Sendung angefragt wurden. Diese Daten haben nur die Redaktionen von ZDF und ARD selbst. Dieses Projekt ist privat entstanden und die Resourcen sind begrenzt, also wurde auch darauf verzichtet die Sendungen selbst herunterzuladen und zu analysieren. Da würde es vermutlich auch rechtliche Probleme geben. Lanz Mining gespeichert also keine Videodaten der Sendungen.
Open Source
Lanz Mining ist vollständig open source und auf Github verfügbar. Für technisch Interessierte gibt es dort auch eine Anleitung, um selbst Daten zu sammeln und eigene analysen zu starten.
Übersicht
Die folgende Tabelle zeigt welche Informationen auf den Webseiten der Talkshowformate verfügbar ist, welche nicht und welche für Lanz Mining genutzt werden.
Markus Lanz | Maischberger | Maybrit Illner | Caren Miosga | Hart aber fair | |
---|---|---|---|---|---|
Beschreibung der Sendung | + | + | + | + | + |
Länge der Sendung | + | + | + | + | + |
Datum der Sendung | + | + | + | + | + |
Faktencheck | - | (+) | + | + | + |
Name der Talkenden | + | + | + | + | + |
Rolle der Talkenden | + | (-) | + | + | + |
Ankündigung Talkender | + | (-) | - | + | - |
Bei Maischberger fehlen die meisten Daten, weil es hier nicht ohne
zusätzliches speichern von Bildern und OCR möglich ist diese Daten zu
befreien. Dafür fehlt allerdings gerade noch die Kapazität um diese
zusätzlichen Features zu bauen.
Faktenchecks werden im übrigen noch nicht ausgewertet, das ist ein zukünftiges
Projekt, das wird sich dann aber auch nur mit dem Überprüfen von Fakten beschäftigen.
Anmerkungen
Aus den oben genannten Informationen werden weitere herausgelesen, sodass am Ende folgendes genutzt werden kann.
Variable | Description | Data type |
---|---|---|
episode_name | Name der Sendung | string |
date | Datum der Veröffentlichung | date |
description | Beschreibung der Sendung | string |
factcheck | Existiert ein zugehöriger Faktencheck | boolean |
length | Länge der Sendung | number |
name | Name der Talkenden | string |
role | Rolle der Talkenden, wie vom Format veröffentlicht | string |
message | Ankündigung einer Talkenden | string |
talkshow | Name der Talkshow | string |
party | Parteimitgliedschaft | string |
group | Gruppen zugehörigkeit | string |
media | Medienhaus wenn Talkende teil der Gruppe "Journalismus" | string |