Der Ruf aus der deutschen Wirtschaftswissenschaft ist eindeutig: Deutschland braucht ein Forschungsdatengesetz, das einen Zugang zu Mikrodaten, Registerdaten und verknüpften Verwaltungsdaten erlaubt, der in anderen europäischen Ländern längst üblich ist (Riphahn, 2023). Diese Forderung ist richtig und überfällig. Darüber hinaus ist eine bessere Datenverfügbarkeit eine notwendige, aber keine hinreichende Bedingung für bessere Politikberatung und letztendlich bessere Entscheidungen. Was in der Debatte fehlt, ist die Frage nach den Methoden.
Neue Datensätze stellen die empirische Wirtschaftsforschung vor fundamentale methodische Herausforderungen. Diese Datensätze – etwa aus digitalen Transaktionsregistern oder Steuererhebungen – sind hochdimensional und komplex und erfordern andere Schätz- und Inferenzverfahren, häufig basierend auf künstlicher Intelligenz und maschinellem Lernen, als die Datensätze, mit denen Wirtschaftsforscher:innen bisher arbeiten. Die Datenwelt hat sich fundamental verändert – die Methodenwelt muss mithalten. Elektronische Krankenakten, verknüpfte Arbeitsmarktdaten, Transaktionsdaten und weitere Datensätze eröffnen neue Forschungsmöglichkeiten, benötigen aber auch neue statistische und ökonometrische Methoden, um die richtigen Schlüsse aus den Daten zu ziehen. Da die meisten Fragen im Bereich der Politikberatung kausaler Natur sind, ist hier vor allem das neue Gebiet „Causal Machine Learning“ (Chernozhukov et al., 2019) von zentraler Bedeutung. Für eine fortgeschrittene Einführung in das Thema sei auf Chernozhukov et al. (2024) verwiesen.
Genau hier liegt ein strukturelles Problem in Deutschland. Während andere Länder, allen voran die USA, auch stark in die Entwicklung von methodischer Forschung investiert haben, fristet dieses Fach hierzulande ein Schattendasein. Lehrstühle, die sich der Entwicklung neuer ökonometrischer Methoden widmen, sind selten geworden. In Berufungsverfahren werden Stellen für (theoretische) Ökonometrie und neu geschaffene Positionen für Data Science systematisch durch angewandte Stellen besetzt. Diese Entwicklung ist nachvollziehbar: Angewandte Forschung erzeugt unmittelbar sichtbare Ergebnisse und für sie lassen sich leichter Gelder einwerben. Dennoch ist das kurzsichtig.
Ohne methodische Grundlagenforschung fehlt der angewandten Wirtschaftsforschung das Fundament. Es ist naiv zu glauben, dass allein durch mehr Daten bessere Empfehlungen abgeleitet und bessere Entscheidungen getroffen werden können. Methodische Defizite in der empirischen Forschung können gravierende Folgen haben – nicht nur für die Wissenschaft, sondern für die Politik, die auf diese Forschung vertraut. Falsch identifizierte Kausaleffekte und falsch angewandte Methoden führen zu falschen politischen Schlussfolgerungen.
Neue Datenzugangsmöglichkeiten, wie sie das geplante Forschungsdatengesetz schaffen soll, werden dieses Problem nicht lösen – sie werden es verschärfen. Komplexere Daten erfordern Methoden, die diese Komplexität beherrschbar machen. Wenn die Forschungsgemeinschaft nicht in die Lage versetzt wird, diese Methoden zu entwickeln und kritisch zu hinterfragen, verpufft die Investition in bessere Dateninfrastruktur.
Was ist zu tun? Hochschulen und Förderinstitutionen sollten bei Berufungen und Förderprogrammen wieder stärker auf Methodenentwicklung in Ökonometrie, Statistik und Data Science statt auf reine Anwendung setzen. Das geplante Forschungsdatengesetz sollte durch ein flankierendes Programm zur Methodenförderung ergänzt werden – analog zu dem, was in anderen Ländern unter dem Label „statistical methodology“ oder „causal inference“ gezielt finanziert wird. Auch dem Verein für Socialpolitik kommt hier eine besondere Bedeutung zu, Methoden mehr in den Mittelpunkt zu rücken. Ein weiterer Punkt: Methodische Ausbildungsinhalte müssen auch in den wirtschaftswissenschaftlichen Studiengängen gestärkt werden, damit die nächste Generation empirischer Forscher:innen komplexe Datensätze kompetent analysieren kann.
Der politische Wille zur Verbesserung der Datenlage in Deutschland ist erkennbar, was eine große Chance darstellt. Es wäre ein Fehler, nicht darauf zu dringen, dass gleichzeitig die methodischen Voraussetzungen für deren sinnvolle Nutzung gesichert werden. Daten ohne Methoden sind wie ein Labor ohne Wissenschaftler. Deutschland braucht beides.
Literatur
Riphahn, R. T. (2023). Datenzugang für Forschung – eine Einleitung. Wirtschaftsdienst, 103(11), 728.
Chernozhukov, V., Luo, Y. & Spindler, M. (2019, 17. Juni). Korrelationen müssen auch kausal sein. Frankfurter Allgemeine Zeitung, S. 16.
Chernozhukov, V., Hansen, C., Kallus, N., Spindler, M. & Syrgkanis, V. (2024). Applied Causal Inference Powered by ML and AI. CausalML-book.org.