Datenzentren
Damit Daten langfristig gefunden und genutzt werden können – nicht nur von ihren Urheber:innen selbst, sondern auch anderen Forschenden und Interessierten –, müssen sie publiziert worden sein. Hierbei spielen Datenzentren eine wesentliche Rolle: Sie halten die Infrastruktur vor, dank der Daten langfristig gespeichert werden können, sorgen durch eine aufwändige Datenkuration dafür, dass Daten standardisiert beschrieben werden, und ermöglichen so, dass Daten durch Schnittstellen zu anderen Datenportalen und -sammlungen gefunden und verwendet werden können.
Innerhalb von NFDI4Biodiversity bildet das Netzwerk der zehn GFBio-Datenzentren einen Grundpfeiler für die Mobilisierung von Biodiversitätsdaten. Neben den drei spezialisierten Datenzentren für Pflanzen-, Nukleotid- sowie ökologische und geologische Daten bieten sieben naturwissenschaftliche Sammlungen die Möglichkeit, digitale sowie physische Daten langfristig zu managen, zu archivieren und zitierbar zu veröffentlichen.
Lernen Sie unsere Datenzentren kennen! Nähere Informationen zu den Aufgaben und Profilen finden Sie auch in unserer Knowledge Base.
ENA
Das European Nucleotide Archive (ENA) archiviert, kuratiert und veröffentlicht Nukleotidsequenzdaten und zugehörige Metadaten.
e!DAL-PGP
Das Plant Genomics and Phenomics Research Data Repository e!DAL-PGP archiviert, kuratiert und veröffentlicht pflanzenbezogene Forschungsdaten.
PANGAEA
PANGAEA archiviert, kuratiert und veröffentlicht multidisziplinäre Daten (z. B. geochemische und biologische Vorkommen) aus der marinen u. terrestrischen Umwelt.
BGBM
Der Botanische Garten und das Botanische Museum (BGBM) Berlin fokussiert sich auf Sammlungs- und Beobachtungsdaten sowie die Verwaltung von Daten auf Taxonebene.
DSMZ
Das DSMZ-Datenzentrum konzentriert sich auf die Bereitstellung organismusbezogener Informationen, die die vielfältigen Aspekte der bakteriellen Biodiversität abdecken.
LIB
Das Biodiversity Data Center des Leibniz-Instituts zur Analyse des Biodiversitätswandels (LIB) verwaltet Daten aus der Forschung und aus zoologischen Sammlungen.
MfN Berlin
Das Museum für Naturkunde (MfN) Berlin fokussiert sich auf Sammlungs- und Beobachtungsdaten sowie taxonomische und Merkmalsdaten.
Senckenberg-Gesellschaft
Die Senckenberg-Gesellschaft für Naturforschung fokussiert sich auf Sammlungs- und molekulare Daten, Beobachtungs- und Umweltdaten, Messreihen und Merkmalsdaten.
SMNS
Die Datenarchivierung des Naturkundemuseums Stuttgart (SMNS) fokussiert sich auf Forschungsprojekte zu botanischen, zoologischen und paläontologischen Daten.
SNSB
Das IT-Zentrum der Staatlichen Naturwissenschaftlichen Sammlungen Bayerns (SNSB) ist deren Repositorium für u.a. wissenschaftliche Bio- und Geodiversitätsdaten der naturkundlichen Sammlungen.
Die Datenzentren als Netzwerk
Die GFBio-Datenzentren arbeiten als Netzwerk zusammen, um die Standardisierung und Interoperabilität von Forschungsdaten zu fördern. Die Datenzentren haben gemeinsame Formate, Standards und Pipelines für das nachhaltige Datenmanagement, die Archivierung sowie den Zugriff und die Publikation von Daten erarbeitet, auf deren Grundlage sie ihre Services kontinuierlich weiterentwickeln. Die in den Datenzentren archivierten und veröffentlichten Daten sind über das GFBio-Datenportal zugänglich. Darüber hinaus liefern die Sammlungsdatenzentren ihre Daten auch an die Global Biodiversity Information Facility (GBIF); ein Großteil der Gruppe bildet zudem den deutschen GBIF-Knoten.
Aufgaben in NFDI4Biodiversity
Innerhalb der Task Area 3 erarbeiten die Vertreter:innen der Datenzentren gemeinsame Datenstandards und Datenpipelines für den langfristigen Datenerhalt und die Sicherung der Datenqualität gemäß der FAIR-Prinzipien. Sie sind maßgeblich an der Bereitstellung verschiedener GFBio-Services für das Management von Datenprodukten beteiligt:
Data Submission
Expert:innen der Datenzentren leiten Nutzende des Data Submission Service dabei an, ihre (heterogenen) biologischen, ökologischen und umweltbezogenen Datensätzen für die Einreichung in ein föderiertes Netzwerk von Datenzentren vorzubereiten. Die Datensätze werden von Fachexpert:innen des jeweiligen GFBio-Datenzentrums geprüft, fachspezifisch kuratiert, langfristig archiviert und publiziert.
Helpdesk und Nachhaltigkeit
Expert:innen der Datenzentren arbeiten im Helpdesk – unserer Anlaufstelle für alle Fragen rund um das Forschungsdatenmanagement – mit und beraten zu Datenpublikation und -archivierung.
Data Management Plan Tool (DMPT)
Das GFBio-DMP-Tool steht Forschenden zur Verfügung, um fachgerechte Datenmanagementpläne (DMPs) für biodiversitätsbezogene Projekte zu erstellen. Datenkurator:innen der Datenzentren unterstützen dabei individuell bei der Planung für bestimmte Datentypen und Archive und beraten Forschende im persönlichen Gespräch, um die Grundlage für eine spätere Übernahme von Datenprodukten in die etablierten Datenpipelines der GFBio-Datenzentren bereits in den DMPs zu verankern.
GFBio-Datenportal und BioCASe Monitor Service
Über das GFBio-Datenportal sind die veröffentlichten Daten der GFBio-Datenzentren für Forschende zugänglich. Dies wird ermöglicht durch die Kuration und Bereitstellung der Daten über die etablierten Pipelines. Im gleichen Zug werden die Daten auf einheitliche Metadata-Standards gemappt und, soweit möglich, in vereinbarte domänenspezifische Datenstandards überführt. Zudem werden Formatvalidierungen und Ontologie-Zuordnungen durchgeführt.