BiodiversiTea

BiodiversiTea – die NFDI4Biodiversity Coffee Lecture #10

Organisation: NFDI4Biodiversity

Austauschen und Tee trinken: Das Onlineformat BiodiversiTea bietet ein Forum zum Vorstellen und Diskutieren von Arbeiten, Projekten, Tools und Themen aus der und um die NFDI4Biodiversity-Community. Einmal im Monat treffen wir uns online für eine Stunde mit euch und Ihnen – für spannende Präsentationen und angeregten Austausch bei einer Tasse Tee (oder Kaffee). Die Runde ist offen für alle, die Lust haben, sich über aktuelle Entwicklungen und Themen rund um Biodiversitätsdaten zu informieren und auszutauschen. Eine Zugehörigkeit zu NFDI4Biodiversity ist nicht notwendig.

Thema im Februar 2025

Forschungsdatenmanagement mit ARCs (Annotated Research Context)

Vortragende
Ursula Eberhardt
(Zentrum für Datenverarbeitung, Eberhard Karls Universität Tübingen)

Darum geht es
In vielen Forschungsfeldern werden innerhalb eines Projekts sehr unterschiedliche und manchmal auch sehr umfangreiche Daten erzeugt. Zusammenarbeit in internationalen Forschungsgruppen verlangt nach einem Weg, Daten zu teilen, ohne sie sofort für die ganze Welt zu veröffentlichen. Es soll nachvollziehbar bleiben, wer wann was getan hat. Am Ende eines Projekts mag der Anspruch bestehen, für eine Nachnutzung die Daten als eigene Veröffentlichung mit einem PID (Persistent Identifier) zu versehen, etwa als elektronischen Anhang zu einer Literaturveröffentlichung.

Für die Pflanzenwissenschaften wurde durch DataPLANT/NFDI4plants der ARC (Annotated Research Context) entwickelt. Eine feste Ordner- und Datei-Struktur stellt die Maschinenlesbarkeit und die Auffindbarkeit von Daten sicher. Metadaten werden in .xlsx-Dateien bereitgestellt. Metadaten-Templates erleichtern das Annotieren unterschiedlicher Arten von Forschungsdaten unter Verwendung von Ontologien. Online werden ARCs in sogenannten DataHUBs (GitLab-Instanzen) gespeichert und bearbeitet. Die Verwendung von Git bzw. GitLab ermöglicht Versionierung und das Teilen von Daten mit ausgewählten Nutzendengruppen. In ihrer Gesamtheit sind ARCs als Datensätze einer auf unterschiedliche DataHUBs verteilte dokumentenorientierte Datenbank zu betrachten.

An einem Beispiel wird gezeigt, wie das ARCmanager-Werkzeug verwendet werden kann, um einen solchen ARC zu erzeugen, zu befüllen zu teilen.

Weiterführende Informationen

  • ARCs greifen zurück auf bestehende Standards: ISA Abstract Model und RO-Crate and CWL.
  • C. Garth, J. Lukasczyk, T. Mühlhaus, B. Venn, J. Krüger, K. Glogowski, C. Martins Rodrigues and Dirk von Suchodoletz: Immutable yet evolving: ARCs for permanent sharing in the research data-time continuum, in proccedings of the E-Science-Tage 2021: Share your Research Data, Heidelberg, 366, heiBOOKS, doi.org/10.11588/heibooks.979.
  • J. Krüger, A. Baleghi, H. Saker, S. Pirkl, S. Thangaraj, H. Gauza, U. Eberhardt, H. Jalali, A. Kirbis, A. J. Svahn, L. Beuter, O. Brandt, S. Hachinger, A. Wellmann, J. Munke, M. Biradar: GitLab in Research Data Management, IWSG 2024, Toulouse, France, doi.org/10.5281/zenodo.13863276.

Fragen & Anregungen
Der BiodiversiTea lebt von euren Ideen! Ihr möchtet Feedback einholen, sucht Mitstreiter, möchtet Arbeitsergebnisse vorstellen oder wollt euch zu einem Thema in größerer Runde austauschen? Schreibt uns an helpdesk@nfdi4biodiversity.org oder über unser Helpdesk-Formular und wir gestalten zusammen eine der kommenden Lectures.

Auch bei Fragen freuen wir uns über eine Nachricht an unseren Helpdesk.

Session verpasst?
In unserer YouTube-Playlist findet ihr Mitschnitte früherer BiodiversiTeas.

Teilnehmen
Wir bitten um eine kurze Registrierung vorab:

Das Meeting wird kurz vor Beginn des Events geöffnet.

BiodiversiTea_Eventbild
18.02.2025
11 a.m. - noon
Online
German
share on