Eine Weboberfläche zur Visualisierung von Tickermeldungen aus der Leipziger Volkszeitung samt Crawler, Named Entity Recognition, Elastic Search und LeafletJS.
Umsetzung
- die Server-seitige Anwendung ist in Java Spring Boot geschrieben
- von dieser LVZ-Seite werden vom CronJob die Artikel gescrapt und in einen ElasticSearch Index geladen
- aus dem Text des Artikels werden mittels Named-Entity-Recognition-(NER)-Bibliothek potenziell geolokalisierbare Namen extrahiert
- gegen Nominatim werden diese Namen in Geokoordinaten aufgelöst
- das Frontend ist in AngularJS 1! programmiert und nutzt Leaflet als Plugin für die Kartendarstellung (darüber wird auch die Heatmap unterstützt)
- das Frontend kommuniziert über REST-Aufrufe mit dem Backend, um Suchanfragen, Blättern in den Suchergebnissen darstellen zu können
Wie unterstützen?
- AngularJS 1 auf die letzte Version (z.B. 7) aktualisieren oder gleich ein anderes Frontend-Framework (z.B. Vue.js) benutzen
- Geolokalisierung aus den Texten heraus ist nicht immer richtig, deswegen sollte es die Möglichkeit, über das UI die Geo-Marker nachträglich manuell permanent umzusetzen (vielleicht sogar als Crowd sourcing realisierbar)
- Beidseitig Verlinkung von Text auf Marker und von Marker auf Text, momentan wird nur Popup angezeigt
- Taggen / Kategorisieren von Artikeln (Verbrechen) durch die Nutzer ermöglichen
- Accordion-Widget nutzen, um Platz in Artikel-Leiste zu sparen
- statt die LVZ-Seite direkt den offziellen Ticker der Leipziger Polizei scrapen
Status des Projektes Visualisierung der Polizeiticker Meldungen der Leipziger Volkszeitung: abgeschlossen