Cookies
English English

KGLit4Cat

kglit4cat logo.png

Automatisierte, ontologiebasierte Erstellung von Wissensgraphen aus wissenschaftlicher Literatur mittels Natural Language Processing (NLP).

Alexander Behr

Alexander Behr
kglit4cat logo.png
Alexander Behr

Automatisierte, ontologiebasierte Erstellung von Wissensgraphen aus wissenschaftlicher Literatur mittels Natural Language Processing (NLP).

Alexander Behr

KURZBESCHREIBUNG

Dieses Tool ermöglicht die automatisierte Extraktion und Organisation von Forschungsdaten aus der Katalyse in einem strukturierten, FAIR-konformen Wissensgraphen.

Dabei werden Ontology Learning und Named Entity Recognition (NER) kombiniert, um zentrale Informationen aus wissenschaftlichen Publikationen zu identifizieren. Das System basiert auf dem bestehenden CatalysisIE-Modell, wird jedoch durch ein neues Datenset weiterentwickelt und bietet verbesserte Präzision und Trefferquote.

Der erzeugte Wissensgraph ist sowohl für Menschen als auch für Maschinen lesbar und ermöglicht einen einfachen Zugriff auf relevantes Katalysewissen. Die Anwendbarkeit wird durch die Validierung an zwei Katalyse-Datensätzen sowie Beispielanfragen über SPARQL demonstriert.

PROBLEMSTELLUNG

Die Katalyseforschung erzeugt große Mengen unstrukturierter Daten, die schwer zugänglich, integrierbar und wiederverwendbar sind. Die stetig wachsende Zahl an Publikationen erschwert es zusätzlich, relevantes Wissen effizient zu extrahieren. Die Community benötigt automatisierte, FAIR-orientierte Werkzeuge, um wissenschaftliche Literatur in strukturierte, durchsuchbare Wissensgraphen zu überführen – als Grundlage für datengetriebene Forschung.