Beim Zugang zu Forschungsdaten für die empirische Wirtschafts- und Sozialforschung hinkt Deutschland im internationalen Vergleich seit Jahren hinterher. Dadurch fehlt wissenschaftliche Evidenz als Grundlage für politische Entscheidungen und der Forschungsstandort Deutschland ist erheblich geschwächt. Wie problematisch die Situation eingeschätzt wird, zeigt eine Befragung unter den Mitgliedern des Vereins für Socialpolitik (VfS) im Jahr 2023: 73 % der Teilnehmenden geben an, dass ihr wissenschaftlicher Forschungserfolg unter den Restriktionen beim Datenzugang leidet und nach Ansicht von 79 % der Teilnehmenden ist der Datenzugang in Deutschland schlechter als in vergleichbaren Ländern. Das angekündigte Forschungsdatengesetz (FDG) ist daher eine Chance, zu anderen europäischen Ländern aufzuschließen. Das Gesetzesvorhaben ist zwar ambitioniert, es nicht abzuschließen, wäre jedoch mit hohen gesellschaftlichen Kosten verbunden.
Der bestehende gesetzliche Rahmen schränkt den Forschungsdatenzugang in Deutschland erheblich ein. Die Daten liegen vor, aber sie dürfen nicht verknüpft werden, und so liegen Forschungspotenziale brach. Um an internationale Standards anzuschließen, muss es auch in Deutschland möglich werden, Daten – etwa über einen Datentreuhänder – zu verknüpfen. Doch dazu fehlen noch einige Voraussetzungen. So muss es zulässig sein, hochwertige, granulare und aktuelle Daten für breit gefasste Forschungszwecke auszuwerten und mit Hilfe von sogenannten Identifikatoren Daten zusammenzuspielen. Dies muss unterstützend und konform zur Datenschutz-Grundverordnung (DSGVO) ermöglicht werden.
Das FDG soll den Zugang zu Forschungsdaten verbessern und so die Grundlage für die Weiterentwicklung der Forschungsdateninfrastruktur in Deutschland bilden. Gelingt dies nicht, ist es auch weiter schwierig oder unmöglich, Politik und Öffentlichkeit bei Gesetzesvorhaben basierend auf empirischer Evidenz zu beraten. Gesetze können dann nicht wirksam, treffsicher und kostengünstig ausgestaltet werden. Politikmaßnahmen können ohne gute Datenbasis nicht überzeugend ex post evaluiert werden. Zudem wäre Deutschland, wie schon in vergangenen Krisen, auf Informationen aus besser organisierten Nachbarländern angewiesen, auch wenn sich wissenschaftliche Evidenz aus anderen Ländern nur bedingt übertragen lässt. Schließlich werden in Deutschland ausgebildete und finanzierte Wissenschaftler:innen auch weiterhin Länder mit besseren Daten beforschen oder ganz dorthin abwandern.
Die Situation ist der Politik bekannt. Der Koalitionsvertrag von 2021 hat ein FDG angekündigt, was von der Wissenschaft sehr begrüßt wurde. Im Frühjahr 2023 führte das federführende Bundesministerium für Bildung und Forschung (BMBF) einen umfangreichen Konsultationsprozess durch, in den sich unter anderem der Rat für Sozial- und Wirtschaftsdaten (RatSWD) und der VfS einbrachten. Im Februar 2024 veröffentlichte das BMBF Eckpunkte zum geplanten FDG. Darauf haben der VfS, der RatSWD und die nationale Akademie der Wissenschaften Leopoldina mit Positionspapieren reagiert. Es folgten zahlreiche Gespräche mit Vertretenden von Bundesministerien, Bundeskanzleramt und den Fraktionen des deutschen Bundestags, um die Wichtigkeit des Vorhabens zu betonen. Seit dem Sommer 2024 werden erste Inhalte sowie ein Zeitplan zur Finalisierung des Gesetzgebungsvorhabens noch in der laufenden Legislaturperiode mit den Stakeholdern geteilt. Ein Referentenentwurf des BMBF liegt Anfang Oktober noch nicht vor.
Um nun durch das geplante Gesetz die Lücken beim Forschungsdatenzugang im Vergleich zu unseren Nachbarländern zu schließen, müssen rechtliche Vorkehrungen dafür getroffen werden, dass sensible Daten aus verschiedenen Quellen (z. B. Prozess- und Registerdaten der öffentlichen Hand, wissenschaftliche Erhebungen, Daten von Unternehmen) verknüpfbar werden. Dies erfordert gesetzliche Anpassungen beim vorgesehenen Zweck der Datenerhebung und -verarbeitung, eine Ausweitung der gesetzlich zulässigen Nutzbarkeit von Identifikatoren (Kenn-Nummern) für Personen oder Unternehmen, die Erlaubnis der Übertragung von Daten und schließlich und ganz zentral die Einrichtung einer Treuhandstelle. Diese Treuhandstelle muss im Einklang mit den Regeln des Datenschutzes Datenverknüpfungen vornehmen dürfen und anschließend pseudonymisierte Daten per remote Zugang für Forschende bereitstellen. Dafür muss die Treuhandstelle mit den erforderlichen finanziellen und personellen Ressourcen ausgestattet werden. Die Kosten für Datennutzende dürfen am Ende nicht prohibitiv hoch sein.
Zudem muss die Zugangsberechtigung zu den Datenprodukten der Treuhandstelle geregelt werden; international ist es üblich, Forschungseinrichtungen zu akkreditieren. Die für die Forschungsvorhaben von Forschenden aus akkreditierten Einrichtungen erforderlichen Daten werden dann durch die Treuhandstelle zusammengestellt. Je nach Forschungsfrage werden dafür Daten zwischen verschiedenen Regelungsbereichen (z. B. amtliche Statistik, Sozialversicherungen, Bankenaufsicht, Kraftfahrtbundesamt, Einwohnermeldewesen und Gesundheitsdaten) verknüpft.
Ebenfalls muss eine Abstimmung mit den bestehenden Forschungsdatenzentren (FDZ) und weiteren Datenanbietern herbeigeführt werden. Die FDZ sind wichtige Akteure im dezentralen deutschen Datenökosystem. Ihr Datenangebot umfasst unter anderem Registerdaten, Daten aus Sozialversicherungen, wissenschaftlichen Befragungen (quantitativ und qualitativ) und von Unternehmen. In den FDZ liegen die fachlichen Kompetenzen zur Organisation von Datenverknüpfung und im Bereich des Vertragswesens, der Beratung, Dokumentation und Outputkontrolle.
Wie die Ausführungen zeigen, ist das FDG ein komplexes und ambitioniertes Vorhaben. Es kann nur gelingen, wenn die Expert:innen in vielen verschiedenen Einrichtungen und Bundesressorts über Parteigrenzen hinweg mit dem Ziel kooperieren, der Forschung endlich die erforderliche Datenbasis verfügbar zu machen. Einzelinteressen dürfen nicht dazu führen, dass das Projekt scheitert. Deutschland muss hier keine neuen Wege gehen, sondern kann sich an den international üblichen Ansätzen der Datennutzung orientieren.
Der Wert der Modernisierung des Forschungsdatenzugangs mag nicht unmittelbar sichtbar und messbar sein, gleichwohl ist er für das Gemeinwesen immens. Es geht darum, im nationalen Interesse transparente und informierte Entscheidungen zu ermöglichen und durch datenbasiertes Handeln für Resilienz in Krisensituationen zu sorgen. Die Kosten fehlender Daten und ungenutzter wissenschaftlicher Potenziale sind beträchtlich. Eine kleine Effizienzsteigerung in der Wirksamkeit von Förderprogrammen spart ein Vielfaches der im Rahmen des FDG benötigten Ressourcen. Und schließlich ist das FDG unverzichtbar für den Wissenschaftsstandort Deutschland, denn sehr gute Forschungsdaten sind die Voraussetzung für Forschung mit deutschen Daten auf internationalem Niveau.