Tools und Links

Hier eine Liste der von mir entwickelten Tools.

Word Embeddings

In zwei Sprachen (Englisch und Deutsch) können hier sprachliche Analogien berechnet werden. Technologische Grundlage hierfür bilden Word Embeddings. Mithilfe mathematischer Algorithmen wird anhand riesiger Textcorpora (beispielsweise: Wikipedia) eine Einbettung von Worten in einen hochdimensionalen Raum erlernt, bei dem die Vektoren der Abstände sich semantisch interpretieren lassen. Hier lassen sich nicht nur die Klassiker der Semantischen Relationen nachvollziehen („König steht zu Königin wir Prinz zu Prinzessin“), sondern auch selbst mit Analogien rumspielen.

Nette Ergebnisse sind zum Beispiel:

„Rice steht zu China wie Bacon zu Germany“
„Democracy steht zu Deutschland wie Freedom zu America“
„Mann steht zu Sex wie Frau zu Freundin“

Probiert es aus 😉

Genutzte Algorithmen und Technologien: Word Embeddings, Pyton, plotly, dash, flask, HTML, CSS, AWS EC2, AWS Elastic Block Store

Verworfene Ansätze und Technologien: nltk, gensim, heroku, git lfs, AWS S3, AWS CodePipeline, AWS Elastic Beanstalk

Bundestagsmining

Hier geht es zum Bundestag Dashboard:

Was sind das eigentlich für Menschen, die uns im Bundestag vertreten? Wie alt sind sie, was waren sie vorher von Beruf, wie sind Religionszugehörigkeit oder dem Familienstatus unter den Bundestagsabgeordneten verteilt? Wer diese und noch mehr Fragen systematisch auswerten möchte, kann gerne das interaktive Bundestagsdashboard dazu nutzen.

Genutzte Algorithmen und Technologien: Python, re, plotly, dash, flask, XML, Docker, AWS Elastic Container Registry, AWS Elastic Container Service

2 Kommentare

Quentin
September 16, 2021 um 10:46 pm Uhr

Hi, was ist denn die Quelle des Datensatzes fürs Bundestagsdashboard? Würde damit selbst gerne ein wenig herumspielen.

Antworten
- admin (Beitragsautor/in)
  September 16, 2021 um 10:54 pm Uhr
  
  Hi Quentin, die Daten findest Du auf https://www.bundestag.de/services/opendata unter „Stammdaten aller Abgeordneten seit 1949 im XML-Format“. Viel Spaß! 😉
  
  Antworten

Word Embeddings

Bundestagsmining

2 Kommentare

Schreibe einen Kommentar Antworten abbrechen

Neueste Beiträge

Neueste Kommentare

Archive

Kategorien

Meta