Forschungsdaten

(Digitale) Forschungsdaten (FD) bezeichnen alle digital vorliegenden Daten, die während eines Forschungsprozesses entstehen oder sein Ergebnis sind [1]. Dazu zählen je nach Fachgebiet sehr verschiedene Datentypen und Formate wie Messdaten und Laborwerte, Beobachtungsdaten, Befragungsdaten, Objekte aus Sammlungen, Bilder oder Software-Anwendungen usw.

Arbeiten mit Forschungsdaten

Datenlebenszyklus

Kreisdiagramm

 

Warum ist Forschungsdatenmanagement wichtig?

Ein verantwortungsvolles Forschungsdatenmanagement (FDM) beinhaltet die Erschließung, Verarbeitung, Speicherung und Archivierung der Daten. Das Ziel besteht darin, die Forschungsdaten auffindbar, zugreifbar, inhaltlich nachvollziehbar und langfristig nutzbar zu machen. Die frühzeitige Beschäftigung mit dem Datenmanagement, möglichst schon vor Projektbeginn, bringt Forschenden viele Vorteile:

  • Forschungsförderung: Viele Forschungsförderer fordern FDM etwa zur Validierung der Ergebnisse und zur Vermeidung von Doppelförderung.
  • Nachnutzbarkeit: Sicherung einer langfristigen Nutzbarkeit (mindestens zehn Jahre) durch Dokumentation und Archivierung der Daten
  • Transparenz und Überprüfbarkeit der Daten durch gewissenhafte Dokumentation des Forschungsprozesses
  • Reproduzierbarkeit der Daten
  • Zitierfähigkeit: Publikation der Daten als eigenständige Publikation oder als Datensupplement
  • Sichtbarkeit der Forschung erhöht

 

Datenmanagementplan

Ein Datenmanagementplan (DMP) sollte vor dem eigentlichen Beginn eines Forschungsvorhabens klären, wie mit den im Projekt anfallenden Forschungsdaten und Ergebnissen umgegangen werden soll.

Diese oder ähnliche Fragen stehen im Mittelpunkt:

  • Welche Daten werden im Projekt erhoben und verwendet?
  • Welche Daten müssen nach Projektende archiviert werden?
  • Welche institutionellen oder allgemeinen Vorgaben zum FDM gibt die Fachdisziplin?
  • Wer übernimmt die Vergabe von Metadaten?
  • Wie lange und wo sollen die Daten archiviert werden?
  • Wer darf die Daten nach Projektende nutzen und unter welchen Lizenzbestimmungen?

Mittlerweile ist die Vorlage eines DMPs Voraussetzung für die Mittelvergabe durch viele Forschungsförderer. Folgende kostenfreie Werkzeuge geben Hilfestellung bei der Erstellung eines DMPs.

  • Research Data Management Organiser (RDMO), betrieben vom Leibniz-Institut für Astrophysik Potsdam (AIP), der Fachhochschule Potsdam und dem Karlsruher Institut für Technologie (KIT); stärker bezogen auf deutschsprachigen Raum und damit besser geeignet für Antragstellung bei DFG und BMBF
  • DMPonline des britischen Digital Curation Center
  • DMPTool mit öffentlichen DMP der California Digital Library

Muster und Arbeitshilfen für DMP:

Weitere Informationen zum DMP und zu den Anforderungen der Forschungsförderer finden Sie hier.

 

Metadaten vergeben

Eine Publikation von Forschungsdaten ist nur sinnvoll, wenn diese in einer interpretierbaren Form vorliegen. Forschungsdaten werden durch Metadaten, das sind strukturierte Informationen über Forschungsdaten, beschrieben. Diese standardisierten Metadaten werden gemeinsam mit den Forschungsdaten gespeichert und gewährleisten eine bessere Auffindbarkeit, Durchsuchbarkeit und Nachnutzbarkeit der Daten.

 

Jede wissenschaftliche Community entwickelt eigene Metadatenstandards, die den Bedürfnissen ihres Fachgebietes angepasst sind. Eine Zusammenstellung von Metadatenstandards finden Sie bei forschungsdaten.info.

Speicherung und Archivierung

Im Verlauf eines Forschungsprojektes entstehen zahlreiche Datensätze in verschiedenen Versionen. Um effektiv und kollaborativ damit zu arbeiten, sollten vorab Festlegungen zur Benennung und Versionierung der Forschungsdaten getroffen werden. Im Allgemeinen ist es sinnvoll, schreibgeschützte Versionen der Originaldaten zu erstellen und nur mit Kopien der Master-Datei zu arbeiten. Wir empfehlen die 3-2-1 Backup-Regel:

  • erstellen Sie mindestens 3 Kopien der Datei
  • speichern Sie diese auf mindestens 2 verschiedenen Speichermedien
  • legen Sie eine Kopie dezentral (z. B. in Cloud) ab

Weitere Informationen zur Datenspeicherung und Datensicherheit finden Sie unter forschungsdaten.info.

 

Bevorzugte Dateiformate

Für die langfristige Aufbewahrung, das kollaborative Arbeiten und die Nachnutzung von Forschungsdaten spielt das Datenformat eine entscheidende Bedeutung. Daten sollten in offenen Dateiformaten gespeichert werden. Damit sind diese Daten von verschiedenen Programmen les- und bearbeitbar.

Folgende Dateiformate sind empfehlenswert:

Texdokument.txt .odf .rtf .html PDF/A
Tabelle.csv .tsv .tab .xlsx SPSS portabel
Rastergrafiken und Bilder.tif .jpg .jpeg .png .geotiff (georeferenzierte Grafik) .pdf.
Statistische Daten.por .sas
Multimedia.mp4 .mj2 .avi .wav .flac
Vektorgrafiken.svg
Datenbanken.sql .xml .csv
Computer-iaded Design.dwg .dxf .x3d .x3db .x3dv

 

Wo werden Forschungsdaten gespeichert?

Forschungsdaten sollten regelmäßig gesichert werden. Etablierte Infrastrukturen des Universitätsrechenzentrums sind z. B. Netzwerkspeicher und eine Cloud.

 

Repositorium zur Archivierung

Im Sinne guter wissenschaftlicher Praxis sind Forschungsdaten über einen Zeitraum von mindestens zehn Jahren aufzubewahren. Die Universitätsbibliothek empfiehlt die Archivierung der Daten in fachspezifischen oder fachübergreifenden/institutionellen Repositorien. Beachten Sie bei der Wahl des Datenarchives gegebenenfalls die Vorgaben Ihres Forschungsförderers.

 

Für die Suche nach einem geeigneten Repositorium bietet sich die Registry of Research Data Repositories re3data an. Dies ist ein webbasiertes Verzeichnis von Forschungsdaten-Repositorien, das eine Eingrenzung der Suchergebnisse etwa nach dem Fachgebiet ermöglicht.

 

Die TU Bergakademie Freiberg bietet gemeinsam mit der TU Dresden das institutionelle Repositorium OpARA zur Archivierung digitaler Forschungsdaten an. Optional können die Daten gegebenenfalls nach einer gewissen Embargofrist Dritten unter einer Open-Access-Lizenz zugänglich gemacht werden.

Veröffentlichung von Forschungsdaten

Grundsätzlich kann man Forschungsdaten veröffentlichen als

  • eigenständige Publikation in einem Repositorium
  • klassisches Datensupplement zur Ergänzung einer Textpublikation
  • Data Paper in einem Datenjournal

Im Registry of Research Data Repositories re3data finden Sie verschiedene Repositorien für die Veröffentlichung Ihrer Forschungsdaten. Etliche Verlage ermöglichen zudem, dass Forschungsdaten als Datensupplemente zur Ergänzung der Textpublikation eingereicht werden. Darüber hinaus konzentrieren sich bestimmte Zeitschriften auf die Beschreibung und Begutachtung von Datensätzen. Eine Übersicht über Datenjournale finden Sie hier.

 

Beachten Sie, dass der Upload von Forschungsdaten in ein Repositorium nicht zwangsläufig eine Veröffentlichung der Daten ist. Man kann beispielsweise einen Zeitraum (Embargo) festlegen, in dem ein Datenpaket noch nicht zugänglich, die Metadaten indes bereits sichtbar sind. Im Falle einer Veröffentlichung können Zugriffs- und Bearbeitungsrechte in Verträgen oder durch Lizenzen geregelt werden.

 

Berücksichtigen Sie bitte auch die jeweiligen Vorgaben von Forschungsförderern und Verlagen sowie datenschutzrechtliche Bestimmungen. Die Veröffentlichung von Forschungsdaten ist z. Bsp. aufgrund rechtlicher Beschränkungen, eines Embargos oder wegen Geheimhaltungsvereinbarungen bei Auftragsforschung nicht immer möglich.

 

Durch die Vergabe persistenter Identifikatoren werden Forschungsdaten dauerhaft abrufbar und zitierbar gehalten. Gängige Identifikator- Systeme sind DOI (Digital Object Identifiers) und URN (Uniform Resource Names).

 

Sie können Ihre Forschungsdaten Open Access veröffentlichen und deren Nachnutzung durch die Vergabe von Lizenzen regeln. Die Wahl freier Lizenzen erleichtert die Nachnutzung der Daten und erhöht somit deren Sichtbarkeit und Verbreitung. Am häufigsten werden folgende Lizenzen verwendet:

  • Creative Commons Lizenz (CC)
  • GNU General Public License (GPL) / für Software konzipiert
  • Open Data Commons (ODC) / für Datensammlungen konzipiert

CC-Lizenzen sind ab Version 4.0 für Forschungsdaten geeignet. Wählen Sie eine Lizenz, die zu Ihrem Fachgebiet und der Art der Forschungsdaten passt. Im Sinne der FAIR-Prinzipien bietet sich jedoch die Vergabe einer CC-BY-Lizenz an. Weitere Einzelheiten zu CC-Lizenzen finden Sie hier.

Forschungsdaten in Förderanträgen

Inzwischen haben viele Forschungsförderer Anforderungen für den Umgang mit Forschungsdaten definiert. Forschungsdaten aus Projekten, die mit öffentlichen Mitteln gefördert werden, sollen mit möglichst wenigen Einschränkungen offen zur Verfügung gestellt werden.

Die Deutsche Forschungsgemeinschaft (DFG) macht Angaben zum Umgang mit Forschungsdaten in Anträgen von Einzel- und Verbundvorhaben nunmehr verpflichtend. Die DFG hat eine ausführliche Checkliste zum Umgang mit Forschungsdaten erstellt, die unbedingt beachtet werden sollte. Die in der Checkliste aufgeführten Punkte sind sowohl Bestandteil des Begutachtungsprozesses als auch Teil der Berichtspflicht nach Projektabschluss. Kosten, die für den Umgang mit Forschungsdaten in Projekten anfallen, können bei der DFG beantragt werden.

Bei vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Projekten gibt es bisher keine einheitlichen Vorschriften zum Umgang mit Forschungsdaten. Die Anforderungen hängen von der jeweiligen Ausschreibung ab. Bitte beachten Sie diese genau. Im Allgemeinen erwartet das BMBF einen Verwertungsplan bzw. Angaben zur Verwertung der Ergebnisse und die Veröffentlichung der Forschungsergebnisse nach Projektabschluss. Weitere Anforderungen entnehmen Sie bitte der jeweiligen Ausschreibung.

Horizon Europe ist das neunte Forschungsrahmenprogramm der europäischen Kommission. Es startete 2021 und ist auf einen Zeitraum von sieben Jahren angelegt. Bei Förderung mit Horizon Europe wird u. a. ein Datenmanagementplan und die Veröffentlichung der Forschungsdaten die benötigt werden, um Ergebnisse aus Textpublikationen zu validieren, verlangt. Detaillierte Informationen dazu finden Sie auf dem Funding-und-Tender-Portal der EU-Kommission.

Einen guten Überblick über die Anforderungen verschiedener Forschungsförderer finden Sie auf forschungsdaten.info und im Open-Science-Magazin des Leibnitz-Informationszentrum Wirtschaft.

Nationale Forschungsdateninfrastruktur NFDI

„In der Nationalen Forschungsdateninfrastruktur (NFDI) werden wertvolle Datenbestände von Wissenschaft und Forschung für das gesamte deutsche Wissenschaftssystem systematisch erschlossen, vernetzt und nachhaltig sowie qualitativ nutzbar gemacht. Bislang sind sie zumeist dezentral, projektbezogen oder auf Zeit verfügbar. Mit der NFDI soll ein dauerhafter digitaler Wissensspeicher als unverzichtbare Voraussetzung für neue Forschungsfragen, Erkenntnisse und Innovationen geschaffen werden.“[3] Der 2021 gegründete Verein Nationale Forschungsdateninfrastruktur (NFDI) e.V. koordiniert alle Aktivitäten. Die TU Bergakademie Freiberg ist Mitglied des Vereins NFDI.

 

Eine Vielzahl von Konsortien der unterschiedlichsten Fachgebiete sind aktiv am Aufbau der NFDI beteiligt. Fachlich relevant für die Forschenden der TU Bergakademie Freiberg sind vor allem folgende Konsortien:

  • NFDI4Earth: NFDI Consortium Earth System Science
  • NFDI-MatWerk: National Research Data Infrastructure for Materials Science & Engineering
  • NFDI4Chem: Fachkonsortium Chemie für die Nationale Forschungsdateninfrastruktur
  • NFDI4Ing: Nationale Forschungsdateninfrastruktur für Ingenieurwissenschaften
  • Übersicht über alle von der DFG geförderten NFDI-Konsortien seit Oktober 2020

Landesinitiative SaxFDM

SaxFDM ist eine Initiative sächsischer Hochschulen und Forschungseinrichtungen zur Vernetzung, Kooperation und Koordination der sächsischen Aktivitäten rund um das Forschungsdatenmanagement.


[1] Kindling, M.; Schirmbacher, P. (2013): "Die digitale Forschungswelt" als Gegenstand der Forschung. In: Information : Wissenschaft und Praxis 64 (2/3), S. 127-136., DOI: https://www.degruyter.com/view/journals/iwp/64/2-3/article-p127.xml

[2] Helbig, Kerstin. Hinweise und Checkliste zur Erstellung eines Datenmanagementplans. 2015. DOI:10.5281/zenodo.33485

[3] https://www.nfdi.de/verein/#kurzinfo, zuletzt abgerufen am 9.03.2022, 10:58 Uhr