-
Forschung
Dateninseln vernetzen
Tauschen, vergleichen und wiederverwenden – das ist mit Forschungsdaten oft schwierig. Sie sind häufig verstreut, versteckt oder nicht vergleichbar. Die Nationale Forschungsdateninfrastruktur (NFDI) soll das künftig ändern.
Ohne Daten geht nichts in der Wissenschaft. Sie sind der Rohstoff für Theorien und Erkenntnisse. Allerdings können nicht alle Wissenschaftler:innen gleichermaßen auf den täglich wachsenden Datenberg zugreifen. Denn die Daten liegen verteilt an vielen Orten, zu denen nicht jeder Zugang hat – wie auf abgeschotteten Inseln. Zugriff haben oft nur die Institute oder Arbeitsgruppen, die die wertvollen Rohstoffe gesammelt und auf ihren Inseln eingelagert haben.
Das liegt nicht an der mangelnden Bereitschaft, zu teilen und sich auszutauschen, sondern vor allem an den fehlenden Verbindungen zwischen den Inseln – sozusagen den fehlenden Pipelines für die Rohstoffe. „Für uns Forschende ist das ein großer Nachteil: Dadurch können wir Daten nicht vergleichen und zusammenführen. Das verzögert oder verhindert neue Erkenntnisse“, sagt der Bioinformatiker Prof. Björn Usadel, Direktor am Institut für Bio- und Geowissenschaften (IBG 4). Mitunter wiederholen Wissenschaftler:innen sogar gleiche oder ähnliche Experimente, weil sie nicht an die Daten einer anderen Insel herankommen oder gar nichts davon wissen.
Um dem entgegenzuwirken, reicht ein Netz von Daten-Pipelines jedoch nicht aus. Denn die gesammelten Daten müssen nicht nur auffindbar und zugänglich, sondern auch vergleichbar sein. Genau das ist oft schwierig: „Es beginnt ganz klein“, weiß Torsten Bronger von der Jülicher Zentralbibliothek, der als Forschungsdatenmanager Wissenschaftler:innen beim Umgang mit Daten unterstützt: „Eine Doktorandin möchte ihre Experimente dokumentieren. Soll sie pro Versuch eine Datei oder mehrere anlegen? Welche Daten liefert ihr Messgerät? Welche Informationen speichert sie? Wie benennt sie die Dateien? Welches Dateiformat wählt sie? Speichert sie die Daten auf einem Laufwerk, in einer Datenbank? Solche Dinge können von Institut zu Institut sehr unterschiedlich gehandhabt werden.“ In der Konsequenz können Wissenschaftler:innen von Insel A zu oft nichts mit dem Rohstoff von Insel B anfangen, geschweige denn, ihn überhaupt entdecken.
Torsten Bronger
Die Nationale Forschungsdateninfrastruktur, kurz NFDI, soll das alles ändern. Für den Aufbau dieser Infrastruktur sollen sich Forschende einer jeweiligen Fachdisziplin zu einem Konsortium zusammenschließen. Auf diese Weise sollen die abgeschotteten Inseln innerhalb einer Disziplin vernetzt werden – etwa zu Inselgruppen der Pflanzenforschung oder der Ingenieurwissenschaften. Da es für die Förderung, die Lagerung und das Bereitstellen der Rohstoffe keine pauschalen Lösungen gibt, sollen die Mitglieder der jeweiligen Inselgruppen gemeinsame Standards erarbeiten. Dazu zählen etwa einheitliche Regeln für die Aufbereitung der Daten, ihre Qualität, den Datenschutz oder die Metadaten. „Metadaten beschreiben unter anderem die Bedingungen, bei denen ein Experiment durchgeführt wurde, etwa die Messdauer, die dabei herrschende Temperatur oder der Luftdruck. Ohne diese Informationen lassen sich die eigentlichen Messdaten kaum vergleichen“, sagt Björn Usadel. Er ist Co-Speaker von DataPLANT – dem NFDI-Konsortium, das den Datenaustausch und die Zusammenarbeit in den Pflanzenwissenschaften stärken soll.
Björn Usadel
In einigen Disziplinen gibt es bereits Ansätze für solche Vereinheitlichungen. Diese sollen in die NFDI integriert werden. Am Ende sollen Daten schnell und unkompliziert verfügbar sein, die Pipeline-Netzwerke weltweit zugänglich sein und sogar über Fachdisziplinen hinaus verknüpft werden, so dass zu globalen Herausforderungen wie etwa dem Klimawandel Informationen aus unterschiedlichsten Themenbereichen berücksichtigt werden können. „Im optimalen Fall sind die Daten schließlich so verständlich und vollständig organisiert, auffindbar und zugänglich, dass selbst Nutzungen, an die man nicht im Traum gedacht hat, möglich werden“, wünscht sich Torsten Bronger.
Janosch Deeg
FAIRes Datenmanagement
Für den Umgang mit Daten in der NFDI sollen die „FAIR-Prinzipien“ gelten:
- Auffindbarkeit (Findable),
- Zugänglichkeit (Accessible),
- Austauschbarkeit (Interoperable) sowie die
- Wiederverwendung (Reusable)
Konsortien mit Beteiligung des FZJ:
- NFDI4Ing – Ingenieur- und Materialwissenschaften
https://nfdi4ing.de/ - DataPLANT – Pflanzenwissenschaften
https://nfdi4plants.de/ - DAPHNE4NFDI – Neutronen- und Photonennutzer aus unterschiedlichen Fachrichtungen
https://www.daphne4nfdi.de/ - PUNCH4NFDI – Teilchen-, Kern- und Astrophysik
https://www.punch4nfdi.de/ - NFDI-MatWerk – Materialwissenschaften und Werkstofftechnik
https://nfdi-matwerk.de/ - NFDI4Earth – Erdsystemwissenschaften
https://www.nfdi4earth.de/ - TEXT+ – Text- und sprachbasierte Forschungsdaten
https://www.text-plus.org/ - FAIRmat – Physik der kondensierten Materie und Chemische Physik von Feststoffen
https://fairdi.eu/fairmat/consortium - NFDI4Microbiota – Mikrobiologie
https://nfdi4microbiota.de/
Die NFDI
Auf Empfehlung des Rates für Informationsinfrastrukturen (RfII) hat die Gemeinsame Wissenschaftskonferenz von Bund und Ländern im Jahr 2018 beschlossen, eine Nationale Forschungsdateninfrastruktur (NFDI) aufzubauen. Sie soll aus bis zu 30 Fachkonsortien bestehen, deren Auswahl und Begutachtung die Deutsche Forschungsgemeinschaft (DFG) koordiniert. Für den Aufbau der NFDI stellen Bund und Länder bis ins Jahr 2028 jährlich bis zu 90 Millionen Euro zur Verfügung. Nach zwei von insgesamt drei Ausschreibungsrunden sind 19 Konsortien ausgewählt, davon insgesamt neun mit Jülicher Beteiligung. Um die Aktivitäten innerhalb der NFDI zu koordinieren, gründeten Bund und Länder im Oktober 2020 den NFDI-Verein.
© 2022 Forschungszentrum Jülich