News

Forschungsdaten: Der Wissensspeicher wächst

13.07.2021

Bund und Länder fördern den Aufbau einer Nationalen Forschungsdaten-Infrastruktur. An vier der zehn neuen Projekte sind LMU-Wissenschaftler maßgeblich beteiligt.

© Jan Greune

Big Data wird immer größer. Die Datenmengen wachsen und wachsen. Und auch die Wissenschaft in aller Welt erzeugt riesige digitalisierte Bestände. Doch sie sind verstreut auf einer Vielzahl von Plattformen, nach unterschiedlichen Standards und Methoden gesammelt. Damit sie aber wissenschaftlich breit nutzbar sind und über die Grenzen einzelner Datenbanken, Fachdisziplinen und Länder hinweg analysiert und verknüpft werden können, müssen sie fachlich gebündelt und aufbereitet werden.

In Deutschland fördern Bund und Länder darum seit 2020 eine Reihe von Großprojekten zum Aufbau einer Nationalen Forschungsdateninfrastruktur (NFDI). Sie sollen die Datenbestände öffentlich finanzierter Forschung für die verschiedensten Fachrichtungen auf höchstem wissenschaftlichem Niveau systematisch erschließen, nachhaltig sichern und damit für andere Nutzer leicht auffindbar und zugänglich machen. Jetzt gehen zehn weitere solcher Konsortien an den Start. An vier dieser Großprojekte sind Wissenschaftlerinnen und Wissenschaftler der LMU maßgeblich beteiligt:

BERD@NFDI

Das Konsortium will in den kommenden fünf Jahren eine nationale Plattform zur Analyse von Big Data in den Wirtschafts- und Sozialwissenschaften aufbauen. Es soll ein cloudbasiertes System entstehen, über das Daten und Algorithmen gesammelt, verfügbar gemacht, zusammengeführt, analysiert und geteilt werden können. Dabei wollen die Forscherinnen und Forscher einen deutlichen Fokus auf das Management unstrukturierter Daten setzen, wie sie beispielsweise aus den Sozialen Medien, der Unternehmensberichterstattung und der Kommunikation von Wirtschafts- und Regierungsinstitutionen stammen und zu einer immer wichtiger werdenden Quelle in den Sozial- und Wirtschaftswissenschaften werden. Um solche Daten aufzubereiten, setzen die Wissenschaftler auf Algorithmen der künstlichen Intelligenz. Verpflichtet sehen sie sich zudem den Grundsätzen von Open Access und Open Science. Über den gesamten Projektverlauf sollen deshalb Nutzer eingebunden sein, die Fachcommunity soll von den entwickelten Werkzeugen zum Datenmanagement umfassend profitieren.

Als Münchner Sprecher des BERD@NFDI-Konsortiums fungieren die Statistikprofessorin Frauke Kreuter und die Statistikprofessoren Bernd Bischl und Göran Kauermann von der LMU. Die Führung des Konsortiums liegt bei der Universität Mannheim, neben der LMU gehören zu den Ko-Antragsstellern die Universitäten Hamburg und Köln sowie das Institut für Arbeitsmarkt- und Berufsforschung in Nürnberg, das ZBW – Leibniz Informationszentrum Wirtschaft (Kiel), die Universitätsbibliothek Mannheim und das gesis – Leibniz-Institut für Sozialwissenschaften, Mannheim.

DAPHNE4NFDI

In dem neuen Großprojekt geht es um den digitalen Umbruch im Bereich der Photonen- und Neutronenforschung – für eine große Anzahl von Disziplinen von Biologie und Pharmazie, Ingenieurswissenschaften, Physik und Chemie bis hin zu Geologie und Archäologie. Alle stehen vor der Herausforderung, den steigenden Bedarf einer schnellen Analyse von großen Datenmengen und Datenübertragungsraten so zu bewältigen, dass diese auffindbar, zugänglich, interoperabel und wiederverwendbar sind. Im Bereich der Photonen- und Neutronenforschung werden derzeit mehr als 28 Petabytes Daten pro Jahr allein durch Forscherinnen und Forscher an Großforschungseinrichtungen produziert, einzelne Experimente erzeugen dabei bis zu einer Millionen Dateien. Diese müssen schnell, effizient und vollständig zu analysieren, aber auch nachhaltig nutzbar sein. Dafür will das Konsortium eine entsprechende Forschungsdateninfrastruktur aufbauen.

Im DAPHNE4NFDI-Konsortium haben sich Universitäten, Forschungsinstitute und Großforschungszentren zusammengeschlossen, an denen Wissenschaftlerinnen und Wissenschaftler sich unter Führung der Komitees für Synchrotron- beziehungsweise Neutronenforschung organisiert haben. Sprecherin der LMU in dem Konsortium ist Paola Coan, Professorin für Medizinische Physik.

MaRDI

Mathematische Forschungsdaten reichen von Datenbanken für spezielle Funktionen und mathematische Objekte bis zu Aspekten des Wissenschaftlichen Rechnens wie Modellen und Algorithmen. Spezialisierte Suchmaschinen ermöglichen zwar das Auffinden von mathematischen Dokumenten und Software, sind aber nur eingeschränkt mit Daten verknüpft. Zudem nehmen das Datenvolumen und dessen Entstehungsgeschwindigkeit mit der raschen Entfaltung der Mathematik in den Datenwissenschaften und der ständig steigenden Rechenleistung dynamisch zu. In verschiedenen Disziplinen (wie Physik, Chemie, Ingenieur-, Geistes- und Biowissenschaften) führt dies zu immer komplexeren mathematischen Modellen und mathematischen Forschungsdaten. MaRDI will zusammen mit der mathematischen Community Methoden und Werkzeuge entwickeln, um eine Infrastruktur zu schaffen, die die systematische Sicherung, Erschließung und Nutzbarmachung von mathematischen Forschungsdaten über dezentrale und vernetzte Wissens- und Datenspeicher ermöglicht. MaRDI soll in der mathematischen Community eine Doppelfunktion einnehmen – als qualitätsgesicherte mathematische Datenbibliothek und als digitales Service-Portal gleichermaßen.

Das Konsortium wird koordiniert vom Berliner Weierstraß-Institut für Angewandte Analysis und Stochastik (WIAS). Ihm gehören außerdem neben der LMU derzeit weitere 13 Co-Antragssteller (Universitäten, Forschungsinstitute und die Deutsche Mathematiker-Vereinigung) an. Sprecher der LMU in dem Konsortium ist Bernd Bischl, Professor für Statistical Learning und Data Science.

PUNCH4NFDI

Das Konsortium hat sich zum Ziel gesetzt, Forschungsdaten aus der Teilchen-, Astroteilchen-, Hadron-, Kernphysik und der Astronomie transparent und dauerhaft verfügbar zu machen. Schwerpunkte der Arbeit sind neuartige Methoden für die Verwaltung von großen Datenmengen und ihre Nachnutzbarkeit in der Wissenschaft. Im Zentrum steht dabei der Aufbau einer Plattform, mit deren Hilfe es möglich sein wird, beliebige wissenschaftliche Daten in Form von digitalen Forschungsprodukten über ihren gesamten Lebenszyklus hinweg zu erhalten, zugänglich zu machen und intelligent zu verknüpfen. Neben den primären Physikbereichen werden die Arbeiten von PUNCH4NFDI auch weiteren Forschungsfeldern inner- und außerhalb der Physik, wie zum Beispiel der statistischen Physik, der Physik der weichen Materie, der biologischen Physik, der nicht-linearen Dynamik, der Atmosphären-, Meeres- und Klimaforschung, der Geophysik und Geodäsie, der Mathematik und der Informatik, von direktem Nutzen sein.

PUNCH4NFDI ist unter Führung des Deutschen Elektronen-Synchrotrons (DESY). Der Bereich Data Transformations wird von Thomas Kuhr, Professor für Physik an der LMU, geleitet. Neben DESY zählen die LMU sowie 22 weitere Universitäten und außeruniversitäre Forschungsinstitute zu den Antragstellern. Von der LMU sind Wissenschaftlerinnen und Wissenschaftler aus Hochenergiephysik sowie Astronomie/Kosmologie beteiligt. Sprecher der LMU im Konsortium ist Joseph Mohr, Professor für Physik und Leiter der Abteilung Kosmologie und Strukturbildung an der Universitätssternwarte der LMU.

Wonach suchen Sie?