Rede wird geladen...
Englische Übersetzung der Rede
generiert durch OPUS-MT. Die Übersetzung hat eine Genauigkeit von nach LaBSE.
Die Daten der Bundestags-Mine wie Sitzungsprotokolle, Abstimmungen, Reden werden via Webscraper direkt von der Seite des deutschen Bundestags runtergeladen.
Diesen Daten werden NLP-Pipelines unterzogen, welche Token, Named-Entities und Sentiments berechnen. Außerdem werden automatische Zusammenfassungen der einzelnen Reden generiert.
Über die Bundestags-Mine lassen sich sowohl mit den Rohdaten, als auch mit den Auswertungen der KI, eigene Analysen und Recherchen anfertigen. Dazu steht ihnen eine breite Auswahl an Funktionen zur Verfügung.
Das Projekt "Bundestags-Mine" ist zu 100% transparent. Der Quellcode lässt sich auf GitHub einsehen und im Download Center können alle Daten für ihren eigenen Gebrauch heruntergeladen werden. Im Research Center werden die technischen Hintergründe erläutert.
Rede wird geladen...
generiert durch OPUS-MT. Die Übersetzung hat eine Genauigkeit von nach LaBSE.
Automatische Zusammenfassung
Automatic Text Summarization? Kategorien zu jeder Rede? Mehr dazu im Research Center .
Im Parlaments-Panorama wird die Möglichkeit geboten, die Reden der Abgeordneten via Kategorien zu erforschen.
Dies ermöglicht gezielte Einblicke in persönlich relevante Themen.
Woher kommen die Kategorien? Wie ordnet die Bundestags-Mine den Reden diesen Kategorien zu? Mithilfe von VecTop!
Mehr zu VecTop im
Research Center
oder direkt via Live-Demo.
Top Token nach Häufigkeit.
[GRADE NICHT VERFÜGBAR - SIEHE FAQ]
Top POS nach Häufigkeit.
[GRADE NICHT VERFÜGBAR - SIEHE FAQ]
Es werden alle Sentiment angezeigt.
Top 10 Named Entity nach Häufigkeit.
Top 20 Redner(innen) nach Redenanzahl
Über
Hier können Sie Sitzungsprotokolle samt Reden und deren NLP-Auswertungen herunterladen. Sie können die Daten dann zu eigenen Analysen und Auswertungen nutzen. Benutzen Sie entweder die bereits vorgefertigten Datensätze, welche Sie nur herunterladen müssen, oder nutzen Sie den Filter, um den Datensatz selbst zu bestimmen. Das Selbst-Anfertigen eines Datensatzes durch den Filter muss auf dem Server erst berechnet werden und kann bis zu mehreren Stunden dauern. Sie werden jedoch per Mail benachrichtigt, sobald der Datensatz für Sie zum Herunterladen bereit steht.
Die Zeiten sind reine Schätzungen und berücksichtigen zB. keinen schwankenden Traffic oder sonstige Faktoren, welche die Ladezeit von Außen beeinflussen könnten.
Sie werden per Mail informiert, wenn Ihr Datensatz fertig berechnet wurde. Der Link zum Herunterladen wird Ihnen dann ebenfalls in der Mail mitgeschickt.
Die Bundestags-Mine ist eine Aufbereitung linguistischer Daten-Auswertungen der Plenarprotokolle des deutschen Bundestags. Die Daten-Auswertung findet dabei mithilfe des "Natural Language Processing" statt, welches das Text Technology Lab der Goethe Universität Frankfurt, zur Verfügung stellt.
Bundestag-Mine.de ist aus einem Uni-Projekt heraus entstanden und wurde ursprünglich von einer Gruppe bestehend aus 4 Studierenden gebaut. Seit Modul-Ende wird das Projekt alleine weitergeführt.
Alle Daten, die hier aufbereitet und in die NLP-Analyse gegeben werden, wurden von der offiziellen Seite des Bundestags abgefragt. Der Bundestag bietet einen "Open Data Service", der viele Protokolle und Unterlagen zum Download bereitstellt. Alle anderen Daten, die dort nicht enthalten sind, wurden per Webcrawler von der Seite "ge-scraped" (abgefragt).
Die Seite wurde zu Anfang mit Java entwickelt, aber dann nach C# ASP.NET Core portiert. Das Projekt ist Open-Source auf GitHub zu finden.
Die Token und POS-Charts in der Dashboard-Ansicht sind grade außer Betrieb, da ich dank fehlender Lizenzen und einem Budget-Mangel, erfinderisch mit meiner Datenbank umgehen muss. Meine Haupt-Datenbank ist voll und mehr Speicher kostet Geld. Also muss ich auf mehrere Datenbanken verteilen, was stark die Performance beeinträchtigt und manche Funktionen nicht wirklich erlaubt. Deshalb fallen leider die beiden Charts aus und die Text Analyse benötigt länger zum Berechnen.
Auch dies ist darauf zurückzuführen, dass ich mir keine weitere Lizenzen für Datenbanken leisten kann. Dadurch muss ich auf Tricks umsteigen, was unteranderem die Anbindung 2 verschiedener Datenbanken bedeutet. Das zehrt an der Performance, speziell bei den Token. Unter dem Support-Tab können Sie Entwicklung unterstützen!
Es ist eine API in Planung, welche es Besuchern der Seite erlaubt, sowohl Roh-Daten als auch ausgewertete Datensätze dynamisch abzufragen und für eigene Auswertungen zu nutzen. Im Moment gibt es dies nicht explizit - daher verweise ich bis dahin auf das Download Center.
Plenarprotokolle, Tagesordnungspunkte, Reden, Kommentare, Drucksachen, Abstimmungen und Abgeordnete. Wir haben ca. 26.000 Reden bei >300 Protokollen mit über 20.000.000 Token.
Nein.
Nein.
Natürlich! Feedback und Weiterempfehlung ist die einfachste Form der Unterstützung. Ansonsten kannst du dir gern den Source-Code auf GitHub anschauen und dort programmatisch mitwirken. Über Geld-Spenden, um die Hostingkosten vielleicht auszugleichen, freuen wir uns genauso. Hierfür verweise ich auf den Support-Tab!
Über das Kontakt-Feld im Footer kannst du uns gern genau den Fehler beschreiben.
Ich bin Kevin, 98er Baujahr und studiere Informatik. Nebenbei bin ich Research Associate für NLP & AI am Text Technology
Lab der Goethe-Universität Frankfurt.
Das Geld, was ich nicht an meinen Gas- & Strom-Zulieferer abdrücken muss und die Zeit, die ich mir
neben Studium und Arbeit nehmen kann, stecke ich in die Bundestags-Mine.
Leider hat dies sein Limit und das fängt preislich schon bei den Lizenzkosten der Datenbank an, die jetzt ihr
Limit erreicht hat - sie ist voll. Nur mit Tricks kann ich gewährleisten, dass auch weiterhin
Protokolle in der Mine landen; leider auf Kosten der Performance. Mehr Speicher kostet. Bessere Server kosten.
Ich freue mich daher über jeden Support und über jedes Feedback. Wie geht das?
Detailansicht