data science to go

BundestagsMining – Teil 2

Soviel zum Thema Alter. Wie sieht es denn aus mit der Diversität des Parlaments hinsichtlich anderer Attribute wie Religion und Geschlecht aus?

Detailfrage 5: Wie ausgeglichen ist das Geschlechterverhältnis im deutschen Bundestag?

Es lässt sich ganz deutlich ein Trend hin zur höheren Geschlechterbalance im Bundestag feststellen:

Lag das Verhältnis in den ersten Wahlperioden noch bei grob 1:10, machen inzwischen die weiblichen Abgeordneten schon ca 1/3 der Gesamtanzahl aus. Wobei man hier erhebliche Unterschiede zwischen den Parteien feststellen kann: Während die SPD tatsächlich der von ihr angestrebten 50% Quote sehr nahe kommt, (links), scheint sich die CDU eher im Bereich von 20% einzupendeln (rechts).

Am höchsten ist der Frauenanteil bei den Linken (links), während die FDP noch eine weitgehend männliche Partei zu sein scheint (rechts).

Hier nochmal der ganz allgemeine Disclaimer: diese ganze Auswertung ist ein Hobbyprojekt und ich habe nicht die Zeit, jedes Detail der Datenbereinigung umzusetzen, das mir vorschwebt. Bezüglich der letzten Grafik zum Beispiel könnte man zu Recht anmerken, dass in den 1990ern ja offiziell die Partei „die Linke“ noch gar nicht begründet war – woher kommen dann die einzelnen Datenpunkte für diese Partei im Säulendiagramm? Das liegt daran, dass auch für Mitglieder, die über mehrere Legislaturperioden hinweg im Parlament sassen, nur ein Eintrag für das Attribut „PARTEI_KURZ“ in der genutzten Quelle der Stammdaten der Abgeordneten angegeben ist. Beispielsweise ist Dietmar Bartsch unter der Partei „die Linke“ aufgeführt, auch wenn der natürlich zunächst Mitglied bei der SED bzw der PDS war. Ebenso verhält es sich mit all den Fällen, bei denen Bundestagsmitglieder im Laufe der Zeit ihre Partei verlassen oder gewechselt haben. Ich zähle die Mitglieder immer so, wie sie in der XML-Datei auf bundestag.de unter „PARTEI_KURZ“ geführt werden – was vermutlich die jeweils aktuelle / letzte Parteizugehörigkeit beschreibt – und hatte bisher leider keine Zeit für Einzelkorrekturen diesbezüglich.

Beobachtung: Es gibt eine deutliche Tendenz hin zu einer ausgeglichenen Geschlechterverteilung, die sich allerdings zwischen den Parteien stark unterscheidet.

Spätestens diesem Punkt der Analyse musste ich vor mir selbst zugeben, dass ich nicht nur „zwei, drei deskriptive Plots“ erstellen will, sondern längst an einem Punkt bin, einen kompletten Bundestags-Report-Generator zu schreiben.

Was meine ich damit? Ich will beispielsweise nicht sagen: „ok, ich schau mir jetzt mal die Anzahl der Frauen für die CDU über die Zeit an – wo muss ich jetzt nach den entsprechenden Daten suchen?“, sondern ich will ein nettes Dashboard, mit Filtern und Auswahlknöpfen, bei dem ich über ein paar Klicks genau die Grafik erzeugen kann, die mich gerade interessiert, ohne nochmal zusätzlichen Code schreiben zu müssen. Zum Glück gibt es hierfür dash, eine wunderbares, auf flask und plotly basierendes Framework, das ich nur allen Data Scientisten ans Herz legen kann, die interaktive Grafiken erstellen und einem breiteren Publikum zur Verfügung stellen wollen.

Hier ist er also: der Bundestags-Report-Generator:

Der Bundestag-Report-Generator

Im linken Bereich kann man zunächst nach Wahlperiode und Partei filtern. Diese Filter werden dann für jedes einzelne Diagramm übernommen. Zusätzlich ist es möglich, durch einen Doppelklick auf ein Element in der Agenda (z.B. „männlich“) nur dieses Attribut für die Darstellung auszuwählen, bzw. durch einen einzelnen Klick genau diese Werte auszublenden.

Probiert es aus und schreibt mir gerne, wenn etwas nicht klappt eine email.

Ihr dürft den Generator und die einzelnen Plots natürlich gerne für eure eigenen Auswertungen nutzen. Aber bitte bedenkt, dass ich aus den genannten Zeitgründen nicht alle Sonderfälle in den Daten richtig bereinigen / mappen / korrigieren konnte und deshalb auch explizit keine Garantie für die Richtigkeit der erzeugten Zahlen und Grafiken übernehme.

Für die technisch versierten unter euch: damit das Dashboard nicht nur lokal läuft, sondern auch öffentlich erreichbar ist, musste ich das Ding natürlich sinnvoll deployen. Ich habe mich für eine AWS Lösung entschieden, mit einem über ECR registrierten Docker-Container, den ich über ECS managen lasse. In all diesen Bereichen bin ich relativer Anfänger. Dennoch hat mich das ganze Setup nur wenige Stunden und keine großen Nervenzusammenbrüche gekostet. Nach den ersten Test-Tagen kann ich sagen: das ganze scheint stabil zu laufen und kostet etwa 30ct am Tag (die Kosten entstehen dabei nur durch ECR, nicht nur ECS) – das ist für ein Hobbyprojekt dieser Größenordnung durchaus vertretbar.

Ich habe im Bundestagsdashboard neben Alter, Geschlecht und Parteizugehörigkeit bereits weitere Attribute wie Religion und Familienstand aufgenommen. Diese werde ich im nächsten Artikel detailliert untersuchen. Auch hier werde ich mich wieder der Frage widmen: in welchem Maße spiegelt die Verteilung dieser Eigenschaften bei den Bundestagsabgeordneten die Realität der Bevölkerung wider, die sie vertreten sollen?

2 Kommentare

  1. Leonard Kern

    Zur Frage, wieviel frischen Wind die Abgeordneten bei Amtsantritt mitbringen: Ist die Auswertung über das Alter bei Amtsantritt auf den *ersten* Amtsantritt eines*einer Abgeordneten bezogen—oder wird hier jeder Amtsantritt (wenn jemand für mehrere Wahlperioden im Amt ist) gezählt?

    • admin

      Danke für Deine Frage! Jeder Abgeordnete, der mehrere Wahlperioden im Amt ist, hat auch mehrere Zeilen im Datensatz. Wenn jemand also mehrfach dabei ist, wird sein Alter auch mehrfach gezählt (z.B. einmal mit 48 und das nächste Mal mit 52 Jahren). So konnte ich die Entwicklung des Durchschnittsalters über die Wahlperioden hinweg am besten nachvollziehen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

© 2024 yourcupofdata.com

Theme von Anders NorénHoch ↑