Viele Herausforderungen rund um FAIRe Forschungsdaten

Beitrag von Jonas Geschke

 

Am 29. Juni 2017 lud der Arbeitskreis Forschungsdaten der Leibniz-Gemeinschaft ein zum Workshop Forschungsdaten in der Leibniz-Gemeinschaft im Kontext von Open Science – derzeitiger Status und Perspektiven. Rund 55 Teilnehmende aus den unterschiedlichsten Wissenschaftsbereichen nutzten diese Gelegenheit, sich zum Datenmanagement und möglichen Weiterentwicklungen auszutauschen.

 

ak_forschungsdaten_theneedtobeopen.jpg

The need to be open: Vorzüge von Open Science
Foto: J. Geschke

 

Vormittags gaben Herr Daniel Spichtinger (Europäische Kommission, DG Research and Innovation), Herr Prof. Dr. Stefan Liebig (Rat für Informationsinfrastrukturen), Herr Prof. Dr. Timo Borst (Leibniz-Informationszentrum Wirtschaft), Herr Dr. Hans Pfeiffenberger (Alfred-Wegener-Institut – Helmholtz-Zentrum für Polar- und Meeresforschung) sowie Frau Dr. Ricarda Opitz (Leibniz-Gemeinschaft) Einblicke in die Prozesse und Entwicklungen ihrer jeweiligen Projekte und Initiativen. Bereits hier kristallisierte sich heraus, dass es im Laufe des Workshops zu kontroversen Diskussionen kommen könnte. Nach einer kurzen Pause wurden drei Arbeitsgruppen zu folgenden Themen gebildet:  1. Auffinden von Datensätzen, 2. Workflows der Datenpublikation und 3. Anreize/Hemmnisse für die Datenpublikation.

Welche Eigenschaften zeichnen nun Forschungsdaten im Kontext von Open Science aus? – Die Antwort darauf schien bereits früh beantwortet zu sein: FAIRe Daten. FAIR steht für Findable, Accessible, Interoperable und Re-usable. Ein Dokument mit Richtlinien zu FAIRen Daten stellt die Europäische Kommission zur Verfügung. Im Kontext mit dem Thema Open Science sind aus der Perspektive der wissenschaftlichen Forschung eine Reihe von Aspekten zu thematisieren – mit Open (Research) Data, Open Access, Open Code und Citizen Science seien nur ein paar wenige der vielfältigen und komplexen Themen genannt (siehe Abbildung 1). Die European Open Science Cloud stellt für diesen Kontext einen Ansatz dar, die Herausforderungen um die FAIRen Forschungsdaten zu föderalisieren.

 

verbindung_forschung-openscience.png

Abb. 1: Forschungskreislauf und damit verbundene Aspekte des Datenmanagements

 

Im weiteren Verlauf der Diskussionen kamen viele Herausforderungen rund um FAIRe Forschungsdaten zutage, unter anderem:

  • Für die Sozialwissenschaften stellt sich im Kontext von Open Science das Problem der persönlichen Daten. Interviews und Umfragen beinhalten häufig persönliche Daten, die für die Auswertung essentiell sind, aber nicht an Dritte weitergegeben werden können. Ohne die persönlichen Daten verlieren die Forschungsdaten ihren Inhalt. Ob und wie dieses effektiv angegangen werden kann, bleibt offen.
  • Wo speichern Wissenschaftler ihre Forschungsdaten? – Hier nannte Herr Prof. Dr. Borst primär den dienstlichen Rechner, sekundär den privaten Rechner und erst tertiär den Rechner oder Server der Arbeitsgemeinschaft oder der Forschungsinstitution. Wo nach Abschluss eines Projektes die Daten mittel- bis langfristig gespeichert werden sowie ob und wie sie zueinander finden, bleibt offen.
  • Weiterhindiskutierten die Teilnehmenden die Frage, was Open Science für die Publikation von Daten grundsätzlich bedeuten würde. Es wurde deutlich, dass eine Publikation nicht gleichzusetzen wäre mit einem Zugänglichmachen. Daten könnten dann als publiziert gelten, wenn sie zitierfähig wären. Im Sinne der FAIRen Forschungsdaten stellten sich zudem Fragen im Zusammenhang mit der Nachnutzung von Forschungsdaten, mit der Langfristigkeit sowohl hinsichtlich der Arbeitssituation der Wissenschaftler als auch hinsichtlich der Datenspeicherung und last but not least mit dem Verarbeitungsgrad von Forschungsdaten, die publiziert werden sollen. Diese Fragen blieben weitestgehend offen.

Fazit: Die Themen Open Science und Open Data werden in der deutschen Forschungscommunity breit diskutiert. Die Bedeutung des Verfügbarmachens und Teilens von Forschungsdaten wird zunehmend größer, in der technischen Entwicklung und in der Wahrnehmeung der Problematik hinken Forschungsinstitutionen und Wissenschaftler jedoch hinterher. Die Herausforderungen rund um FAIRe Forschungsdaten sind divers und hochgradig abhängig von dem jeweiligen Forschungsbereich und der jeweiligen Forschungsdisziplin. Für ein ganzheitliches Forschungsdatenmanagement stellt sich die große Frage, auf welcher Ebene zwischen Wissenschaft und Fachdisziplinen koordiniert werden müsste. Neben der Frage nach einer solchen Koordination (wer wie wo) scheint die Heterogenität der Forschungsdaten dazu aktuell (noch) zu groß.

 

ak_forschungsdaten_wiesoweshalbwarum.jpg

Datenpublikation - Wieso Weshalb Warum?
Foto: J. Geschke

ak_forschungsdaten_hemmnisse.jpg

Datenpublikation - Hemmnisse?
Foto: J. Geschke

ak_forschungsdaten_anreize.jpg

Datenpublikation - Anreize?
Foto: J. Geschke