KI-gestützte Metadatenerschließung
"KI-Tools zur Metadatenextraktion in Sequenzdatenbanken"
Maschinenlesbare, standardkonforme Metadaten sind die Grundlage für die automatisierte Nachnutzung wissenschaftlicher Daten. In den letzten Jahren wurden weltweit Petabyte an Sequenzdaten erzeugt und in Archiven bereitgestellt. Für die Biodiversitätsforschung bergen sie enormes Potenzial – doch häufig sind nur minimale, nicht interoperable Metadaten vorhanden. Wichtige Kontextinformationen stehen oft lediglich in Freitexten zur Verfügung und sind damit für Maschinen schwer zugänglich. Gleichzeitig eröffnen KI-Modelle neue Möglichkeiten, solche unstrukturierten Texte systematisch auszuwerten und Metadaten zu extrahieren oder anzureichern. Zahlreiche Projekte entwickeln entsprechende Werkzeuge – bislang jedoch meist ohne enge Abstimmung untereinander. Im Rahmen dieses Topic-Table-Projekts möchten wir den Austausch zu diesem Thema fördern, Synergien schaffen, gemeinsame Standards voranbringen und Herausforderungen wie Qualitätssicherung, Interoperabilität und Nachhaltigkeit adressieren.
Das Projekt "KI-Tools zur Metadatenextraktion in Sequenzdatenbanken" wird im Rahmen der 2025 erstmals ausgeschriebenen NFDI4Biodiversity Topic Tables umgesetzt – einem kollaborativen Format, das Akteur:innen der Biodiversitäts-Community vernetzt, um gemeinsam Lösungen im Forschungsdatenmanagement zu entwickeln. Mehr zu den Topic Tables erfahren Sie hier.
Ziele
- Austausch und Vernetzung von Aktivitäten zum Thema KI-gestützte Metadatenextraktion
- Publikation eines White Papers zu aktuellen Entwicklungen und zukünftigen Herausforderungen
- Konzept für die nachhaltige Anreicherung von Metadaten in Sequenzdatenarchiven
Geplante Aktivitäten
- Workshop 1 (hybrid): Übersicht zum derzeitiger Stand und geplanten Entwicklungen (Welche KI Werkzeuge gibt es bereits? Welche Projekte laufen gerade? Was wird in Zukunft benötigt?), Zusammenstellung des Autor:innenteams für das White Paper
- Workshop 2 (online): Wie haben sich die Projekte aus Workshop 1 weiterentwickelt? Was ist neu hinzugekommen? (Vorläufige Themen)
- Workshop 3 (hybrid): Welche Herausforderungen bestehen in der Anwendung und Umsetzung? Wie geht es nach dem Topic Table weiter? (Vorläufige Themen)
- Online-Jour-Fixe des Kernteams zum Schreiben des White Papers
Projektlaufzeit
- Status: aktiv
- Start: 03/2026
- Voraussichtliches Ende: 05/2027
Team
Leitung/Ansprechpartnerinnen
- Dr. Christiane Hassenrück, Leibniz-Institut für Ostseeforschung Warnemünde (christiane.hassenrueck@iow.de)
- Prof. Dr. Birgit Gemeinholzer, Universität Kassel (Birgit.Gemeinholzer@uni-kassel.de)
- Dr. Stephanie Jurburg, Helmholtz-Zentrum für Umweltforschung (stephanie.jurburg@ufz.de)
Weitere Mitwirkende
Das Topic-Table-Team besteht darüber hinaus aus Mitarbeitenden folgender Institutionen:
- European Bioinformatics Institute (EBI) am Europäischen Laboratorium für Molekularbiologie
- Global Biodiversity Information Facility (GBIF)
- Hochschule Wismar
Mitmachen
Die geplanten Workshops und auch die Beteiligung an dem White Paper sind offen für die Community. Einladungsmails zu den Workshops werden über die offene Community-Mailingliste verschickt. Der erste Workshop wird am 25. und 26.06.2026 am Leibniz-Institut für Ostseeforschung Warnemünde stattfinden. Bei Fragen wenden Sie sich gern an die genannten Ansprechpartnerinnen.
Über die Topic Tables
Die NFDI4Biodiversity Topic Tables bieten der Biodiversitätscommunity den Raum, zentrale Themen des Forschungsdatenmanagements gemeinsam voranzubringen. Auf Grundlage einer offenen Ausschreibung wurden für 2026 vier Themen ausgewählt, die in das Arbeitsprogramm des Konsortiums eingebettet sind und organisatorisch begleitet werden. NFDI4Biodiversity schafft dafür die strukturelle Anbindung, unterstützt die fachliche Vernetzung und sorgt dafür, dass Ergebnisse sichtbar gemacht und nachhaltig weitergeführt werden können.
Ziel ist es, Expertise zu bündeln, bestehende Ansätze aufeinander zu beziehen und konkrete Ergebnisse zu erarbeiten – etwa White Paper, Leitlinien oder Roadmaps. Die entstehenden Beiträge unterstützen die Praxis im Umgang mit Biodiversitätsdaten, fördern gemeinsame Standards und stärken eine verlässliche, interoperable Datennutzung innerhalb der Community.
Die Topic-Table-Projekte sind in der Regel auf ein Jahr angelegt. Um über kommende Ausschreibungen auf dem Laufenden zu bleiben, abonnieren Sie gern unsere Community-Mailingliste und folgen Sie uns auf LinkedIn.
Eine Übersicht aller aktuellen Topic Tables finden Sie hier.