Lädt

Die Bundestags-Mine

Natural Language Processing trifft auf den Bundestag.

Sammeln der Daten:

Die Daten der Bundestags-Mine wie Sitzungsprotokolle, Abstimmungen, Reden werden via Webscraper direkt von der Seite des deutschen Bundestags runtergeladen.

NLP-Pipelines:

Diesen Daten werden NLP-Pipelines unterzogen, welche Token, Named-Entities und Sentiments berechnen. Außerdem werden automatische Zusammenfassungen der einzelnen Reden generiert.

Interaktion:

Über die Bundestags-Mine lassen sich sowohl mit den Rohdaten, als auch mit den Auswertungen der KI, eigene Analysen und Recherchen anfertigen. Dazu steht ihnen eine breite Auswahl an Funktionen zur Verfügung.

Open Source:

Das Projekt "Bundestags-Mine" ist zu 100% transparent. Der Quellcode lässt sich auf GitHub einsehen und im Download Center können alle Daten für ihren eigenen Gebrauch heruntergeladen werden. Im Research Center werden die technischen Hintergründe erläutert.

Kostenlos Account

Jetzt auch mit API!

Was ist Natural Language Processing und was genau wird in der Bundestags-Mine verarbeitet?
Mehr dazu im Research Center!

Suchergebnisse für

Rede wird geladen...

Wählen Sie eine Rede aus, um diese zu untersuchen.

Rede vom 00.00.0000

Name:

Geschlecht:

Geburtstag:

Religion:

Familienstand:

Redner(in) Persönlich

Fraktion:

Partei:

Im Bundestag seit:

Beruf:

Akademischer Grad:

Redner(in) Beruflich

Englische Übersetzung der Rede

generiert durch OPUS-MT. Die Übersetzung hat eine Genauigkeit von nach LaBSE.

Person Organisation Ort MISC

Volltext Analyse lädt...

Kategorien

Im Parlaments-Panorama wird die Möglichkeit geboten, die Reden der Abgeordneten via Kategorien zu erforschen. Dies ermöglicht gezielte Einblicke in persönlich relevante Themen.
Woher kommen die Kategorien? Wie ordnet die Bundestags-Mine den Reden diesen Kategorien zu? Mithilfe von VecTop!
Mehr zu VecTop im Research Center oder direkt via Live-Demo.

None

01.01.0000 - 01.01.0000

Token Verteilung

Top Token nach Häufigkeit.
[GRADE NICHT VERFÜGBAR - SIEHE FAQ]

POS Verteilung

Top POS nach Häufigkeit.
[GRADE NICHT VERFÜGBAR - SIEHE FAQ]

Sentiment Verteilung

Es werden alle Sentiment angezeigt.

Named Entity Verteilung

Top 10 Named Entity nach Häufigkeit.

Personen Organisationen Orte

Themen Landkarte

Es werden nur Themen mit min. 125 Erwähnungen angezeigt.

Raus-Zoomen

Redner(innen) Verteilung

Top 20 Redner(innen) nach Redenanzahl

Lädt länger - bitte Geduld haben.

Generiere Karte

Über

Bundestag

Die Themen-Landkarte zeigt die Verteilung der jeweiligen Themen in deren Fraktions-Bubbles.
Über was wird von wem am Meisten geredet?

Gesamt

2017 2018 2019 2020 2021 2022 2023 2024 Gesamt

Filter

NEG NEU POS

CDU SPD FDP

AfD LINKE GRU

Lädt...

Hier können Sie Sitzungsprotokolle samt Reden und deren NLP-Auswertungen herunterladen. Sie können die Daten dann zu eigenen Analysen und Auswertungen nutzen. Benutzen Sie entweder die bereits vorgefertigten Datensätze, welche Sie nur herunterladen müssen, oder nutzen Sie den Filter, um den Datensatz selbst zu bestimmen. Das Selbst-Anfertigen eines Datensatzes durch den Filter muss auf dem Server erst berechnet werden und kann bis zu mehreren Stunden dauern. Sie werden jedoch per Mail benachrichtigt, sobald der Datensatz für Sie zum Herunterladen bereit steht.

Dokumentation

Es werden an NLP-Auswertungen nur Sentiments und NamedEntities, aber keine Tokens zum Download bereitsgestellt. Letzere generieren zu große Datenmengen, um sie on-demand abrufbar zu halten. Sollten Sie auch Tokens benötigen, fragen Sie entweder gerne direkt über das Kontaktfeld im Footer explizit nach, oder besuchen Sie das Datenrepositorium "GerParCor" des Text Technology Lab. Dort finden Sie unteranderem alle mit spaCy annotierten Sitzungsprotokolle (also auch mit Tokens) seit 1949.

Vorgefertigte Datensätze, Stand: 3/28/2023

19. Legislaturperiode

20. Legislaturperiode

19. + 20. Legislaturperiode

Eigenen Datensatz erstellen

Resultierender Datensatz

Die Zeiten sind reine Schätzungen und berücksichtigen zB. keinen schwankenden Traffic oder sonstige Faktoren, welche die Ladezeit von Außen beeinflussen könnten.

0 Protokolle
0 Reden

Geschätzte Berechnungszeit: 0 Minuten
Geschätzte Datensatzgröße: 0 MB

Geschätzte ZIP-Größe: 0 MB

Sie werden per Mail informiert, wenn Ihr Datensatz fertig berechnet wurde. Der Link zum Herunterladen wird Ihnen dann ebenfalls in der Mail mitgeschickt.

Häufig gestellte Fragen

Was ist die "Bundestags-Mine"?

Die Bundestags-Mine ist eine Aufbereitung linguistischer Daten-Auswertungen der Plenarprotokolle des deutschen Bundestags. Die Daten-Auswertung findet dabei mithilfe des "Natural Language Processing" statt, welches das Text Technology Lab der Goethe Universität Frankfurt, zur Verfügung stellt.

Wie entstand die Bundestags-Mine?

Bundestag-Mine.de ist aus einem Uni-Projekt heraus entstanden und wurde ursprünglich von einer Gruppe bestehend aus 4 Studierenden gebaut. Seit Modul-Ende wird das Projekt alleine weitergeführt.

Woher kommen die Daten?

Alle Daten, die hier aufbereitet und in die NLP-Analyse gegeben werden, wurden von der offiziellen Seite des Bundestags abgefragt. Der Bundestag bietet einen "Open Data Service", der viele Protokolle und Unterlagen zum Download bereitstellt. Alle anderen Daten, die dort nicht enthalten sind, wurden per Webcrawler von der Seite "ge-scraped" (abgefragt).

Wie wird die Seite entwickelt?

Die Seite wurde zu Anfang mit Java entwickelt, aber dann nach C# ASP.NET Core portiert. Das Projekt ist Open-Source auf GitHub zu finden.

Warum sind die Token und POS außer Betrieb?

Die Token und POS-Charts in der Dashboard-Ansicht sind grade außer Betrieb, da ich dank fehlender Lizenzen und einem Budget-Mangel, erfinderisch mit meiner Datenbank umgehen muss. Meine Haupt-Datenbank ist voll und mehr Speicher kostet Geld. Also muss ich auf mehrere Datenbanken verteilen, was stark die Performance beeinträchtigt und manche Funktionen nicht wirklich erlaubt. Deshalb fallen leider die beiden Charts aus und die Text Analyse benötigt länger zum Berechnen.

Wieso lädt die Text-Analyse so lange?

Auch dies ist darauf zurückzuführen, dass ich mir keine weitere Lizenzen für Datenbanken leisten kann. Dadurch muss ich auf Tricks umsteigen, was unteranderem die Anbindung 2 verschiedener Datenbanken bedeutet. Das zehrt an der Performance, speziell bei den Token. Unter dem Support-Tab können Sie Entwicklung unterstützen!

Kann ich selbst Daten abfragen (API)?

Es ist eine API in Planung, welche es Besuchern der Seite erlaubt, sowohl Roh-Daten als auch ausgewertete Datensätze dynamisch abzufragen und für eigene Auswertungen zu nutzen. Im Moment gibt es dies nicht explizit - daher verweise ich bis dahin auf das Download Center.

Welche Daten werden hier aufbereitet?

Plenarprotokolle, Tagesordnungspunkte, Reden, Kommentare, Drucksachen, Abstimmungen und Abgeordnete. Wir haben ca. 26.000 Reden bei >300 Protokollen mit über 20.000.000 Token.

Brauche ich einen Account?

Nein.

Muss ich etwas bezahlen?

Nein.

Kann ich das Projekt unterstützen?

Natürlich! Feedback und Weiterempfehlung ist die einfachste Form der Unterstützung. Ansonsten kannst du dir gern den Source-Code auf GitHub anschauen und dort programmatisch mitwirken. Über Geld-Spenden, um die Hostingkosten vielleicht auszugleichen, freuen wir uns genauso. Hierfür verweise ich auf den Support-Tab!

Ich habe einen Fehler gefunden

Über das Kontakt-Feld im Footer kannst du uns gern genau den Fehler beschreiben.

Hi!

Ich bin Kevin, 98er Baujahr und studiere Informatik. Nebenbei bin ich Research Associate für NLP & AI am Text Technology Lab der Goethe-Universität Frankfurt.
Das Geld, was ich nicht an meinen Gas- & Strom-Zulieferer abdrücken muss und die Zeit, die ich mir neben Studium und Arbeit nehmen kann, stecke ich in die Bundestags-Mine.
Leider hat dies sein Limit und das fängt preislich schon bei den Lizenzkosten der Datenbank an, die jetzt ihr Limit erreicht hat - sie ist voll. Nur mit Tricks kann ich gewährleisten, dass auch weiterhin Protokolle in der Mine landen; leider auf Kosten der Performance. Mehr Speicher kostet. Bessere Server kosten.
Ich freue mich daher über jeden Support und über jedes Feedback. Wie geht das?

Zeige anderen Leuten die Bundestags-Mine!
Nutze das Kontakt-Formular im Footer und gebe Feedback!
Zusammenarbeit? Networking? Hit me up!
Geldspende über folgenden Link (Debit/Kredit/Paypal möglich):

Spenden

Detailansicht

Lädt

Die Bundestags-Mine

Natural Language Processing trifft auf den Bundestag.

Sammeln der Daten:

NLP-Pipelines:

Interaktion:

Open Source:

Kostenlos Account

Jetzt auch mit API!

Suchergebnisse für

Protokolle

Wählen Sie eine Rede aus, um diese zu untersuchen.

Englische Übersetzung der Rede

Kategorien

None

01.01.0000 - 01.01.0000

Token Verteilung

POS Verteilung

Sentiment Verteilung

Named Entity Verteilung

Themen Landkarte

Redner(innen) Verteilung

Lädt...

Download Center

Vorgefertigte Datensätze, Stand: 3/28/2023

Eigenen Datensatz erstellen

Zeitraum

Fraktionen

Parteien

Redner(innen)

Filter anwenden

Resultierender Datensatz

0 Protokolle 0 Reden

Geschätzte Berechnungszeit: 0 Minuten Geschätzte Datensatzgröße: 0 MB

Geschätzte ZIP-Größe: 0 MB

Häufig gestellte Fragen

Was ist die "Bundestags-Mine"?

Wie entstand die Bundestags-Mine?

Woher kommen die Daten?

Wie wird die Seite entwickelt?

Warum sind die Token und POS außer Betrieb?

Wieso lädt die Text-Analyse so lange?

Kann ich selbst Daten abfragen (API)?

Welche Daten werden hier aufbereitet?

Brauche ich einen Account?

Muss ich etwas bezahlen?

Kann ich das Projekt unterstützen?

Ich habe einen Fehler gefunden

Hi!

0 Protokolle
0 Reden

Geschätzte Berechnungszeit: 0 Minuten
Geschätzte Datensatzgröße: 0 MB