---
tags: Daten
---
# EPINetz Politicians List: Inventur
Es soll eine vollständige Inventur der aktuellen EPINetz Politicians List (EPINetz Seedlist) durchgeführt werden. Dabei sollen:
a) die bisherigen Einträge auf Vollständigkeit und Korrektheit geprüft werden
b) fehlende Einträge ergänzt werden
c) ein Update auf Wikidata durchgeführt werden
Im Endergebnis soll ein Datensatz erstellt werden, welcher **alle** relevanten Politiker:innen abbildet - auch jene, die keinen Twitter-Account besitzen (für spätere Evaluationen). Daraus kann eine aktualisierte EPINetz-Liste gebildet werden.
## 1. Datenabgleich via Abgeordnetenwatch
- Abgeordnetendaten für alle in der EPINetz-Liste enthaltenen Legislaturperioden der Parlamente ziehen. D.h. beginnend mit den folgenden und **allen späteren** Legislaturperioden:
| Parlament | Beginn LP |
| -------- | -------- |
| Landtag Sachsen-Anhalt | 12.04.2016 |
| Landtag Mecklenburg-Vorpommern | 04.10.2016 |
| Abgeordnetenhaus von Berlin | 27.10.2016 |
| Landtag des Saarlandes | 25.04.2017 |
| Landtag Nordrhein-Westfalen | 01.06.2017 |
| Schleswig-Holsteinischer Landtag | 06.06.2017 |
| Bundestag | 24.10.2017 |
| Niedersächsischer Landtag | 14.11.2017 |
| Bayerischer Landtag | 05.11.2018 |
| Hessischer Landtag | 18.01.2019 |
| Bremische Bürgerschaft | 08.06.2019|
| EU-Parlament | 02.07.2019 |
| Landtag Brandenburg | 25.09.2019 |
| Sächsischer Landtag | 01.10.2019 |
| Thüringer Landtag | 26.11.2019 |
| Hamburgische Bürgerschaft | 18.03.2020 |
| Landtag von Baden-Württemberg | 01.05.2021 |
| Landtag Rheinland-Pfalz | 18.05.2021 |
(nur bei der ersten Inventur - spätere Inventuren können sich auf die je aktuelle (und ggf. letzte) LP beschränken)
- Abgleich der vorhandenen Daten, insb. **Geschlecht** (Beachtung von "divers" statt m/w, wie möglicherweise auf Wikidata abgelegt), **Geburtsjahr**, **Partei** und **Wikidata ID** mit den in Abgeordnetenwatch hinterlegten. Bei fehlenden Daten in Abgeordnetenwatch eigene Einträge behalten. Bei Konflikten händisch prüfen (insb. Wikidata ID und Partei). Bei Parteiwechsel neue Einträge anlegen ("from" und "until"-Daten entsprechend anpassen)
(siehe auch: https://www.abgeordnetenwatch.de/api/entitaeten/politician)
- Vereinheitlichung der official_name-Variable: wird von Abgeordnetenwatch übernommen, bisherige Einträge überschrieben
- Abgleich der Amtsperioden: während der Legislaturperioden ausgestiegene Abgeordnete entsprechend vermerken ("until"-Variable mit Ausstiegsdatum); Neuzugänge (Nachrücker) aufnehmen
**Wichtig:** bei ausgestiegenen Parlamentarier:innen prüfen, ob diese eine neue Position (z.B. Minister:in) eingenommen haben und entsprechend neuen Eintrag anlegen (d.i. "until" der Parlaments-Position ist "from"-Datum der z.B. Ministerposition)
- Alle nicht in der EPINetz-Liste vorhandenen Politiker:innen ablegen
### Ergebnis: 1.) erweiterter EPINetz-Datensatz mit aktualisierten Einträgen für **alle** Politiker:innen; 2.) Liste mit fehlenden Politiker:innen
relevante Variablen für 1.): alle Variablen im EPINetz-Datensatz - Bennenung der Variablen muss einheitlich mit aktuellen Konventionen erfolgen!
relevante Variablen für 2.): official_name, abgeordnetenwatch_id, wikidata_id
**Offene Frage:** Hat Abgeordnetenwatch auch Daten zu z.B. Minister:innen, oder nur für Abgeordnete?
## 2. Überprüfung und Ergänzung weiterer fehlender Einträge
- nicht auf Abgeordnetenwatch vertretene Politiker:innen mittels anderer Quellen prüfen
- **Betrifft:** Staatsekretär:innen, ggf. Minister:innen, Parteisprecher:innen
- Prüfen, ob sich in den Zusammensetzungen der Regierungen / Minister:innen / Staatsekretär:innen etwas geändert hat. Abgänge entsprechend vermerken (analog zu Abgeordneten, s.o.) und Neuzugänge und fehlende Einträge aufnehmen
- Alle nicht in der EPINetz-Liste vorhandenen Politiker:innen ablegen
### Ergebnis: 1.) erweiterter EPINetz-Datensatz mit aktualisierten Einträgen für **alle** Politiker:innen; 2.) Liste mit fehlenden Politiker:innen
relevante Variablen für 1.): alle Variablen im EPINetz-Datensatz - Bennenung der Variablen muss einheitlich mit aktuellen Konventionen erfolgen!
relevante Variablen für 2.): official_name, abgeordnetenwatch_id, wikidata_id
## 3. Ergänzung fehlender Politiker:innen
- Listen an nicht in EPINetz geführten Politiker:innen zusammenführen und mittels Twitter API suchen
- Einträge prüfen, passende Einträge auswählen. Vorgehen wie bei bisherigen Evaluationen, siehe: https://github.com/EPINetz/twitter-account-collection
- bei fehlendem Account: entsprechend vermerken (account_status: "no account")
- Zusätzlich zu fehlenden Politiker:innen zwei fehlende Ministerialaccounts ergänzen: Bundesbauministerium (@BMWSB_Bund) und Bundesministerium für Wirtschaft und Klimaschutz (@BMWK)
### Ergebnis: Datensatz mit Twitter-IDs
relevante Variablen im Datensatz: abgeordnetenwatch_id, user_id, account_status
## 4. Zusammenführen der Listen (Tim)
- Listen mit neuen Einträgen und aktualisierte EPINetz-Datensätze werden zusammengeführt
- alle Twitter-IDs werden per API geprüft und neue Variable Account Status hinzugefügt (no account / deactivated / private / active)
### Ergebnis: Datensatz aller deutschen Politiker:innen mit EPINetz-Variablen
## 5. Wikidata Update
- Fehlende wikidata_ids für **alle** Politiker:innen (auch ohne Twitteraccounts) recherchieren (falls nicht auf abgeordnetenwatch hinterlegt) und im Datensatz aktualisieren
- Aktualisierung der Einträge auf Wikidata per API: nur Variablen abgeordnetenwatch_id und user_id; ggf. auch Geburtsjahr und Partei wenn fehlend
### Ergebnis: 1.) EPINetz-Datensatz um fehlende wikidata_ids erweitert, Wikidata Einträge aktualisiert
## 6. Upload bei GESIS (Tim)
- Aktualisierung des vorhandenen Datensatzes / neuer Eintrag