data science to go

Bundestags Mining – Teil 4

Ausblick

Das hier ist nur ein Hobbyprojekt, weil mich als politisch interessierte Softwareentwicklerin einfach die statistische Auswertung einer hervorragenden Datenquelle gereizt hat. Die Erstellung des Dashboardes hat mir technisch und inhaltlich extrem viel Spaß gemacht. Dennoch hat mir die Zeit für folgende Punkte gefehlt, die ich evtl noch in Zukunft weiter verfolgen werde:

  • Eine weitergehende Bereinigung der Daten: vom verstorbenen Abgeordneten bis zum zum Sonderfall des Parteiwechsels eines Abgeordneten habe ich viele Sonderfälle bei der Auswertung noch ignoriert. Auch viele als „UNBEKANNT“ markierte Datenfelder könnte man z.B. über systematische Wikipedia-Recherchen noch manuell füllen.
  • Ebenso könnte man das Berufsmapping noch erweitern und verfeinern, um ein noch klareres Bild der Verteilungen zu bekommen. Dennoch bin ich der Meinung, dass die vorläufige Auswertung schon die Wesentlichen Verhältnisse und Entwicklungen gut darstellen können.
  • Viele Teilaspekte konnte ich noch nicht im Detail untersuchen – z.B. wie ist das mit der Berufsverteilung in jeder einzelnen Partei? Oder: gibt es Parteien, für die die Tendenz Alterverteilung grundlegend abweicht? Überhaupt kann man ja jedes Paar von Attributen gegeneinander auswerten. Z.B. „wie viele Kinder haben männliche Abgeordnete im Schnitt und lässt sich vielleicht feststellen, dass es verhältnismäßig weniger Frauen mit vielen Kindern in den Bundestag schaffen?“ Oder „(um wie viel) sind Eltern im Schnitt älter, wenn sie in den Bundestag kommen?“ Hierfür bietet das Dashboard aber einen guten Anfangspunkt, um in Zukunft solche Detailfragen differenzierter zu betrachten.
  • Die nächste spannende Datenquelle, die man hinzuziehen könnte wären natürlich die Angaben über Nebeneinkünfte bei abgeordnetenwatch. Hier wäre wieder jede Kombination aus Attributen spannend; dass CDUler im Schnit mehr Nebeneikünfte erhalten, als Abgeordnete der Linken ist ja schon bekannt, aber wie hängen z.B. Alter und Nebeneinkünfte und vor allem auch: Bleibedauer im Bundestag mit den Nebeneinkünften zusammen? Wie sind Beruf und die Höhe der Einkünfte miteinander korreliert?
  • Auch in der bereits genutzten Datenquelle der Abgeordneten Stammdaten liegen noch von mir ungenutze Attribute wie beispielsweise GEBURTSORT, GEBURTSLAND, VITA_KURZ und VEROEFFENTLICHUNGSPFLICHTIGES. Jedes einzelne dieser Attribute würde mich für weitere Auswertungen reizen.
  • Mir ist bewusst, dass der Text nicht perfekt und die Abbildungen teilweise in Größe und Ausschnitt nicht optimal sind – das ist ein Hobbyprojekt 😉
  • Nicht zuletzt freue ich mich natürlich auf die Bundestagswahl 2021 und hoffe, dass die Daten auf der Seite des Bundestages dann zeitnah aktualisiert werden. Es ist für mich eine faszinierende und für meine Meinung von der Regierung auch relevante Frage, ob sich all diese Trends der Homogenisierung bzw. Monokultivierung des Bundestags fortsetzen, oder ob vielleicht aus irgendeiner Richtung (das kan das Alter der Abgeordneten genau so sein wie deren beruflicher Kontext) „frischer Wind“ in die Bude kommt.

Ich danke euch für das Lesen des zugegebenermaßen langen Artikels und freue mich wieder über die Feedbacks, entweder hier als Kommentar oder gerne auch als Mail, über Twitter oder LinkedIn.

1 Kommentar

  1. THO

    Sehr schöne Abendlektüre, vielen Dank dafür!

    Das ist die Mischung, die mein Data Science Herz aufgehen lässt:
    – wie die Analysen immer aufwendiger werden, weil noch kurz Word Embeddings, ein Dashboard oder Regexe eingebaut werden sollen
    – wie der Perfektionismus durchkommt und immer noch erklärt wird, dass ja alles nicht sauber ist und was man alles noch zusätzlich machen könnte
    – wie gleichzeitig aber doch ganz viele verschiedene Themen integriert werden, in diesem Fall gesellschaftlicher Natur (gendergerechte Berufe, Anteil an Single-Haushalten oder oder oder)
    – und am Schluss irgendwie der rote Faden noch da ist und die Handlungsempfehlungen rüberkommen

    Und ja, ich hätte 1000e Ideen, wo man nochmal reinschauen könnte. Beispielsweise nimmt der Anteil der Personen in Erwerbstätigkeit in der Landwirtschaft nun auch in der Gesamtbevölkerung ab (https://de.statista.com/statistik/daten/studie/242856/umfrage/bedeutung-der-landwirtschaft-nach-anzahl-der-erwerbstaetigen/), was aber sicherlich nicht gegen die These spricht, dass keine repräsentative Vertretung vorhanden ist. Und warum dürfen Politiker nach einer Scheidung nicht wieder verheiratet sein? Und wollen wir überhaupt lieber ältere PolitikerInnen, weil sie mehr Erfahrung haben, oder lieber jüngere und ledige NaturwissenschaftlerInnen, die anders denken? Vielleicht checke ich doch lieber nochmal die wahl-o-mat Analyse von David Kriesel, da gibt es zumindest nur endliche Optionen 😉

    Und ja: Warum gibt es eigentlich kein Python-Paket, das gendern kann? Gibt es nicht schon genug Texte, bei denen man die Wortneuschöpfungen rausziehen könnte? Mit *chen, Innen oder sonstwas? Mal auf die endlose Liste guter Ideen setzen, vielleicht kommt ja mal so richtig schlechtes Wetter …

    Aber auch aus technisch-finanziellem Interesse: Warum kostet dein Dashboard nur in ECR und nichts in ECS? Gibt es da keine Run Costs? Das Dashboard ist ja immerhin öffentlich erreichbar und nutzbar und der Container läuft doch bestimmt auch dauerhaft.

    Zum Schluss, completely unrelated, warum fehlt im Seitentitel und Footer das R? Das triggert mich 😉

    Also Danke nochmal, war schön zu lesen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

© 2024 yourcupofdata.com

Theme von Anders NorénHoch ↑