MiCoDa
"MiCoDa ist eine Rettungsmission für Metabarcoding-Daten."
Stephanie Jurburg (Department für Angewandte Mikrobielle Ökologie, Helmholtz-Zentrum für Umweltforschung (UFZ))
Über MiCoDa
MiCoDa – die Microbial Community Database – wurde vom Helmholtz-Zentrum für Umweltforschung (UFZ), dem Deutschen Zentrum für integrative Biodiversitätsforschung (iDiv) und der Friedrich-Schiller-Universität Jena (FSU) entwickelt, um die Auffindbarkeit, Interoperabilität und Nachnutzbarkeit von Sequenzdaten zu verbessern. MiCoDa ist eine öffentliche, kuratierte, durchsuchbare, interoperable 16S-rRNA-Gen-Metabarcoding-Datenbank und beherbergt in ihrer ersten Version mehr als 35.000 verarbeitete Mikrobiomproben und ermöglicht es Forschenden, Mikrobiomdaten zu suchen und sie für die eigene Nutzung herunterzuladen. MiCoDa ist damit die weltweit größte Datenbank ihrer Art.
MiCoDa behält die INSDC-Zugangsnummern als Daten-IDs bei und verwendet die Earth Microbiome Project Ontology (EMPO) und MIxS. Die Datenbank verknüpft zudem Sequenzdaten mit den Publikationen (DOIs), in denen sie erstmals präsentiert wurden, und erleichtert so die automatische Integration mit bibliometrischen Daten. Durch sorgfältige Kuratierung und bioinformatische Verarbeitung enthalten alle Sequenzen in MiCoDa das gleiche Segment des 16S-rRNA-Gens als dauerhafte Taxon-/Spezies-Kennung, was studienübergreifende Vergleiche spezifischer bakterieller Taxa sowie Vergleiche mit anderen Datenbanken (z. B. über das Nukleotid-BLAST des NCBI) ermöglicht.
MiCoDa verfügt über zwei Wege zur Datenerfassung: die automatische Datenerfassung mit validierten Textparsing-Algorithmen (Jurburg et al. 2020) und die direkte und gezielte Zusammenarbeit mit Datenerhebenden, vor allem aus Blindspots der Biodiversität – mit dem Ziel, die Datenproduzierende in die Archivierung und Wiederverwendung einzubeziehen.
Bei jährlichen Veranstaltungen in verschiedenen Teilen der Welt – sogenannten Datathons – werden die Teilnehmenden in der Archivierung von Sequenzen in INSDC-Datenbanken unter Verwendung spezieller Leitfäden (hier z.B. auf Spanisch) geschult und dazu ermutigt, Daten zu hinterlegen und dann selbst wiederzuverwenden. Durch diese Bemühungen ist bereits ein breites Netzwerk von disziplinären Nutzenden entstanden.
MiCoDa zielt darauf ab, die Wiederverwendbarkeit von Daten anhand folgender Maßnahmen zu verbessern:
- Einbindung der Datenerhebenden in die Datenarchivierung und Wiederverwendung durch jährliche Datathons
- Verbesserung der Zugänglichkeit und Vergleichbarkeit von bakteriellen Amplikon-Sequenzdaten durch Bereitstellung der Daten in einem gebrauchsfertigen Format, das eine einheitliche und universelle Taxondefinition verwendet
- Anreicherung bestehender, mit der Metabarcodierung verbundener Metadaten aus dazugehöriger Literatur
Der Use Case MiCoDa
Der Use Case MiCoDa zielt darauf ab, das MiCoDa-Datenportal mit den technischen Standards von NFDI4Biodiversity zu harmonisieren, um die Daten künftig nahtlos in die in NFDI4Biodiversity entstehende Dateninfrastruktur, die Research Data Commons, integrieren zu können – mit dem Ergebnis, die Sichtbarkeit, Zugänglichkeit und Nachnutzbarkeit der Daten in MiCoDa zu erhöhen. Durch Schulungen und Trainings zu MiCoDa, zu denen Angehörige des Konsortiums sowie externe Interessierte herzlich eingeladen sind, soll zudem der Austausch zwischen der Forschungsdatenmanagement- und der Mikrobiomdaten-Community gefördert werden.
Sichergestellt werden soll die verbesserte Verfügbarkeit und Nachnutzbarkeit der Daten durch eine verbesserte Standardisierung und Harmonisierung von Datenformaten und Metadaten. Hiervon wird auch die Biodiversitätsforschung profitieren, da Forschenden und anderen Interessengruppen ein einfacher Zugang zu qualitativ hochwertigen Mikrobiomdaten ermöglicht wird. Der Beitritt des iDiv als NFDI4Biodiversity-Partnereinrichtung in der zweiten Förderphase des Konsortiums ab 2025 wird die Verbindung zu einem starken Netzwerk von Biodiversitätsforschenden weiter stärken und das Projekt wird von einer engagierten Gemeinschaft und ihren Ressourcen profitieren können. Darüber hinaus soll das Trainingsprogramm von MiCoDa durch Schulungsangebote mit Schwerpunkt Datenverarbeitung ergänzt werden.
Weitere Informationen
Kontakt
Sie möchten mehr über den Use Case MiCoDa erfahren? Hier finden Sie Ansprechpartnerinnen.
Use-Case-Managerin (NFDI4Biodiversity)
Sarah Fischer (fischer.sarah@fbn-dummerstorf.de)
Use-Case-Partnerin (MiCoDa)
Stephanie Jurburg (stephanie.jurburg@ufz.de)
Andere Use Cases entdecken
Welches Potenzial steckt in NFDI4Biodiversity? Das veranschaulichen unsere Use Cases: reale Anwendungsfälle, in denen wir Lösungen für die bessere Datenhaltung und -bereitstellung entwickeln.
Libellenatlas
Rund zwei Millionen Libellendaten, die auch Forschung und Naturschutz zur Verfügung stehen sollen – daran arbeiten wir mit den Libellenkundler:innen der GdO.
Landnutzungs-Monitor
Visualisierbare Langzeitdaten zur Landnutzung können die Biodiversitätsforschung enorm bereichern. Zusammen mit dem IÖR integrieren wir sie in NFDI4Biodiversity.
Fischatlas
Die Fischkundler:innen der GfI verfügen über mehr als 100.000 Datensätze zu regionalen Fischarten. Gemeinsam machen wir sie besser findbar und damit zugänglich.