Künstliche Intelligenz für den Datenjournalismus

TH KölnTH Köln und Science Media Center Germany entwickeln Lösung für die Informationsextraktion

Datenjournalisten sammeln und analysieren öffentlich zugängliche Daten und bereiten die darin verborgenen Informationen für ihre Medien auf. Dafür müssen sie häufig mit Daten arbeiten, die nur in unstrukturierter Form vorliegen. Dies macht eine automatisierte Auswertung schwierig. Im Forschungsprojekt „Journalistic Information Extraction“ (JoIE) möchten die TH Köln und das Science Media Center Germany daher ein Tool entwickeln, das mit solchen Datenquellen umgehen und diese journalistisch nutzbar machen kann.

„Die Daten, in denen Journalisten nach Informationen suchen, können ungemein vielfältig sein: Es handelt sich um Texte, Tabellen oder Grafiken, Dokumente unterschiedlichen Typs wie Word, PDF oder E-Mail oder um Webseiten, die zudem noch höchst unterschiedlich formatiert sein können. All das macht es sehr schwierig, zuverlässige und konsistente Regeln zu definieren, nach denen eine automatisierte Auswertung erfolgen könnte“, erläutert Prof. Dr. Philipp Schaer vom Institut für Informationswissenschaft der TH Köln die Problemstellung.

Auf Grundlage der beiden Open-Source-Werkzeuge Workbench und Fonduer soll eine Lösung entstehen, die unstrukturierte Daten in eine strukturierte und damit auswertbare Form bringt. Workbench erlaubt unter anderem die Extraktion von Webdaten. Fonduer verwendet künstliche Intelligenz, um automatisch Extraktionsmuster zum Beispiel zur Erkennung von Tabellen zu lernen.

„Kernidee unseres Projektes ist die Synthese der Nutzerfreundlichkeit von Workbench mit der hervorragenden Extraktionsleistung von Fonduer. Dabei geht es auch darum, komplexe Eingabehilfen zu entwickeln, mit denen Regeln für die Datenbearbeitung ohne Programmierkenntnisse erstellt und entwickelt werden können“, sagt Björn Engelmann, der im Rahmen von JoIE seine Doktorarbeit verfassen wird.

Um die spezifischen Anforderungen von Redaktionen und Datenjournalisten zu erfahren, sind Experteninterviews und gegebenenfalls Umfragen geplant. „Mit unserem Tool möchten wir den State of the Art der Datenverarbeitung für Redakteurinnen und Redakteure verfügbar machen, damit sie Informationen aus der Wildnis des Internets schnell und zuverlässig beschaffen können. Da diese oftmals mit begrenzten Ressourcen arbeiten müssen, wird unsere Lösung kostenlos und als Open-Source-Software verfügbar sein“, sagt Dr. Meik Bittkowski, Leiter Forschung und Entwicklung beim Science Media Center Germany.

Das Forschungsprojekt „Journalistic Information Extraction“ (JoIE) wird über drei Jahre von der Klaus Tschira Stiftung gGmbH gefördert. In dieser Zeit soll das Grundgerüst der Anwendung entstehen. Die Überführung in ein für Externe nutzbares System ist für eine optionale Projektverlängerung von zwölf Monaten angedacht.

Quelle: www.th-koeln.de

Diesen Beitrag teilen, das Unterstützt uns, DANKE !

FacebookVZJappyDeliciousMister WongXingTwitterLinkedInPinterestDiggGoogle Plus

weitere Beiträge

Soziales und Leben in Köln

Einweihung des neuen Sportraums mit Box


KJA Köln   Einweihung des neuen Sportraumes mit Torsten May Bild02Zukunft durch Sport im Porzer Jugendwohnen St. Ursula

Köln, 24.04.2024. Die Sportgeräte und die professionelle Anleitung durch Torsten May ermöglichen den jungen Frauen im Jugendwohnen St. Ursula ein abwechslungsreiches und effektives Training. 

D...


weiterlesen...

Kölner Stadtordnung - Verwaltung


stadt Koeln LogoUm ein friedliches und rücksichtsvolles Zusammenleben auf dem engen Raum in der Stadt weiterhin zu ermöglichen und die Bedürfnisse möglichst aller Menschen in Köln zu berücksichtigen, schlägt die Verwaltung dem Rat der Stadt Köln eine Anpassung de...


weiterlesen...

03.05.- 30.06.24 Gruppenausstellung


Gruppenausstellung1Köln-Ehrenfeld. Unter dem Titel „Die Rückkehr der Lebendigkeit“ präsentieren die Künstler Claudia Cewille, Maryom und Christian Verspay mit NoëLLe, und Petra Mazet sowie Regina Nußbaum vom 3. Mai bis 30. Juni 2024 ihre Installation im Bürgerzentru...


weiterlesen...

Noch 3 Wochen bis zur ANGA COM 2024:


  • csm ANGA COM 2024 9f5665d3deKongressmesse für Breitband, Fernsehen & Online vom 14. bis 16. Mai 2024 in Köln
  • Programm mit mehr als 60 Panels und über 240 Sprecherinnen und Sprechern
  • Komplett kostenfreier Messe- und Kongresstag am Donnerstag, 16. Mai 2024 mit den Schwerpunktt...

  • weiterlesen...

    Jetzt online informieren übers


    mystudychoiceJugendliche und ihre Eltern erfahren in acht Live-Online-Veranstaltungen von MyStudyChoice vom 14. bis 18. Mai 2024, warum jetzt schon eine Bewerbung für ein Auslandsjahr 2025/26 in Kanada, Australien und Neuseeland ratsam ist. Denn gerade, wenn e...


    weiterlesen...

    „Studieren probieren“: Schnuppertage an


    Schnuppertage Alanus Hochschule c Nola Bunke„Studieren probieren“: Unter diesem Motto lädt die Alanus Hochschule für Kunst und Gesellschaft vom 21. bis 24. Mai 2024 Studieninteressierte nach Alfter bei Bonn ein. Im Rahmen der Schnuppertage können sie in Seminare, Vorlesungen, Workshops und ...


    weiterlesen...
    @2022 lebeART / MC-proMedia
    toTop

    Wir nutzen Cookies auf unserer Website. Einige von ihnen sind essenziell für den Betrieb der Seite, während andere uns helfen, diese Website und die Nutzererfahrung zu verbessern (Tracking Cookies). Sie können selbst entscheiden, ob Sie die Cookies zulassen möchten. Bitte beachten Sie, dass bei einer Ablehnung womöglich nicht mehr alle Funktionalitäten der Seite zur Verfügung stehen.