MiCoDa

Die Daten der derzeit größten öffentlich zugänglichen Mikrobiom-Datenbank unkompliziert nachnutzbar machen – das ist das Ziel des Use-Case-Projekts Microbial Community Database (MiCoDa).

"MiCoDa ist eine Rettungsmission für Metabarcoding-Daten."

Stephanie Jurburg (Department für Angewandte Mikrobielle Ökologie, Helmholtz-Zentrum für Umweltforschung (UFZ))

Über MiCoDa

MiCoDa – die Microbial Community Database – wurde vom Helmholtz-Zentrum für Umweltforschung (UFZ), dem Deutschen Zentrum für integrative Biodiversitätsforschung (iDiv) und der Friedrich-Schiller-Universität Jena (FSU) entwickelt, um die Auffindbarkeit, Interoperabilität und Nachnutzbarkeit von Sequenzdaten zu verbessern. MiCoDa ist eine öffentliche, kuratierte, durchsuchbare, interoperable 16S-rRNA-Gen-Metabarcoding-Datenbank und beherbergt in ihrer ersten Version mehr als 35.000 verarbeitete Mikrobiomproben und ermöglicht es Forschenden, Mikrobiomdaten zu suchen und sie für die eigene Nutzung herunterzuladen. MiCoDa ist damit die weltweit größte Datenbank ihrer Art.

MiCoDa behält die INSDC-Zugangsnummern als Daten-IDs bei und verwendet die Earth Microbiome Project Ontology (EMPO) und MIxS. Die Datenbank verknüpft zudem Sequenzdaten mit den Publikationen (DOIs), in denen sie erstmals präsentiert wurden, und erleichtert so die automatische Integration mit bibliometrischen Daten. Durch sorgfältige Kuratierung und bioinformatische Verarbeitung enthalten alle Sequenzen in MiCoDa das gleiche Segment des 16S-rRNA-Gens als dauerhafte Taxon-/Spezies-Kennung, was studienübergreifende Vergleiche spezifischer bakterieller Taxa sowie Vergleiche mit anderen Datenbanken (z. B. über das Nukleotid-BLAST des NCBI) ermöglicht.

MiCoDa verfügt über zwei Wege zur Datenerfassung: die automatische Datenerfassung mit validierten Textparsing-Algorithmen (Jurburg et al. 2020) und die direkte und gezielte Zusammenarbeit mit Datenerhebenden, vor allem aus Blindspots der Biodiversität – mit dem Ziel, die Datenproduzierende in die Archivierung und Wiederverwendung einzubeziehen.

Bei jährlichen Veranstaltungen in verschiedenen Teilen der Welt – sogenannten Datathons – werden die Teilnehmenden in der Archivierung von Sequenzen in INSDC-Datenbanken unter Verwendung spezieller Leitfäden (hier z.B. auf Spanisch) geschult und dazu ermutigt, Daten zu hinterlegen und dann selbst wiederzuverwenden. Durch diese Bemühungen ist bereits ein breites Netzwerk von disziplinären Nutzenden entstanden.

MiCoDa zielt darauf ab, die Wiederverwendbarkeit von Daten anhand folgender Maßnahmen zu verbessern:

  • Einbindung der Datenerhebenden in die Datenarchivierung und Wiederverwendung durch jährliche Datathons
  • Verbesserung der Zugänglichkeit und Vergleichbarkeit von bakteriellen Amplikon-Sequenzdaten durch Bereitstellung der Daten in einem gebrauchsfertigen Format, das eine einheitliche und universelle Taxondefinition verwendet
  • Anreicherung bestehender, mit der Metabarcodierung verbundener Metadaten aus dazugehöriger Literatur

Der Use Case MiCoDa

Der Use Case MiCoDa zielt darauf ab, das MiCoDa-Datenportal mit den technischen Standards von NFDI4Biodiversity zu harmonisieren, um die Daten künftig nahtlos in die in NFDI4Biodiversity entstehende Dateninfrastruktur, die Research Data Commons, integrieren zu können – mit dem Ergebnis, die Sichtbarkeit, Zugänglichkeit und Nachnutzbarkeit der Daten in MiCoDa zu erhöhen. Durch Schulungen und Trainings zu MiCoDa, zu denen Angehörige des Konsortiums sowie externe Interessierte herzlich eingeladen sind, soll zudem der Austausch zwischen der Forschungsdatenmanagement- und der Mikrobiomdaten-Community gefördert werden.

Sichergestellt werden soll die verbesserte Verfügbarkeit und Nachnutzbarkeit der Daten durch eine verbesserte Standardisierung und Harmonisierung von Datenformaten und Metadaten. Hiervon wird auch die Biodiversitätsforschung profitieren, da Forschenden und anderen Interessengruppen ein einfacher Zugang zu qualitativ hochwertigen Mikrobiomdaten ermöglicht wird. Der Beitritt des iDiv als NFDI4Biodiversity-Partnereinrichtung in der zweiten Förderphase des Konsortiums ab 2025 wird die Verbindung zu einem starken Netzwerk von Biodiversitätsforschenden weiter stärken und das Projekt wird von einer engagierten Gemeinschaft und ihren Ressourcen profitieren können. Darüber hinaus soll das Trainingsprogramm von MiCoDa durch Schulungsangebote mit Schwerpunkt Datenverarbeitung ergänzt werden.

Weitere Informationen

Kontakt

Sie möchten mehr über den Use Case MiCoDa erfahren? Hier finden Sie Ansprechpartnerinnen.

Use-Case-Managerin (NFDI4Biodiversity)

Sarah Fischer (fischer.sarah@fbn-dummerstorf.de)

Use-Case-Partnerin (MiCoDa)

Stephanie Jurburg (stephanie.jurburg@ufz.de)

Newsartikel zum Thema

Das Konsortium wächst!

Neues Use-Case-Projekt gestartet: "MiCoDa soll nic...

Zuwachs für die NFDI4Biodiversity-Use-Case-Projekte! Im Interview spricht Stephanie Jurburg darüber, wie sie die Metabarcoding-Datenbank MiCoDa ins Le...