Forschungsdatenzentrum
Ein Forschungsdatenzentrum (Abk. FDZ) archiviert Daten und macht diese über verschiedene Zugangswege unter Einhaltung des Datenschutzes für wissenschaftliche Zwecke zugänglich.[1] Es ist Teil der Forschungsdateninfrastruktur.
Datenzentren werden von vielen Disziplinen als ideale Lösung angesehen, um Zugang zu Forschungsdaten zu gewährleisten[2]. Die Qualitätssicherung bei der Akkreditierung von Forschungsdatenzentren gewährleistet einen Mindeststandard und begleitet die Arbeit der Forschungsdatenzentren fortwährend durch ein Monitoring. Sie stellt eine "freiwillige, wissenschaftsintern organisierte Zertifizierung" dar[2]. 2020 gab es in Deutschland 39 akkreditierte Forschungsdatenzentren[1]. Diese sind sowohl an staatlichen Stellen als auch bei wissenschaftlichen Institutionen angesiedelt. Forschungsdatenzentren werden von ihren jeweiligen Trägereinrichtungen getragen.
Qualitätssicherung
Um die Verlässlichkeit von Forschungsdatenzentren als Teil der Forschungsinfrastruktur sicherzustellen, hat der Rat für Sozial- und Wirtschaftsdaten (RatSWD) ein Akkreditierungssystem entwickelt. Damit soll sichergestellt werden, dass Datenproduzierende, die ihre Daten bisher gar nicht oder nur wenigen privilegierten Partnern in der Wissenschaft zur Verfügung stellen, in Zukunft allen wissenschaftlich Forschenden in gleicher Weise einen Datenzugang zu gewähren. Die Forschungsdatenzentren nehmen dabei die Rolle eines Datentreuhänders ein. Das Verfahren hat den Anspruch, den Bedürfnissen der Wissenschaft und des Datenschutzes gleichermaßen gerecht zu werden[3]. Wichtige Voraussetzung für eine Akkreditierung ist die nachweisliche Existenz eines operativen Geschäfts des Forschungsdatenzentrums. Darüber hinaus müssen mindestens drei Kriterien erfüllt sein:
- mindestens ein Datenzugangsweg
- Bereitstellung ausreichender Dokumentationen zu den Daten
- Konzept zur langfristigen Verfügbarmachung der Daten
Für das Monitoring beteiligen sich alle akkreditierten Forschungsdatenzentren über die Beantwortung eines Fragebogens an einem jährlichen Berichtswesen. Dieses basiert auf denselben Kriterien wie die Akkreditierung.[3] Darüber hinaus ist im Zuge der Qualitätssicherung auch ein Beschwerdemanagement etabliert. Bei Bedarf wird durch den RatSWD eine Evaluationskommission eingesetzt. Als Beispiel wird das Vorliegen eines ernsthaften Mangels im Datenangebot eines FDZ genannt.[3]
Entwicklung
Im März 2001 legte die zwei Jahre zuvor gegründete „Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik“ (KVI) ein umfassendes Gutachten vor. Sie konstatierte dabei "ein außerordentlich umfangreiches und vielfältiges Informationsangebot. Es ist aber einerseits so unübersichtlich, dass sogar ausgewiesene Expertinnen und Experten Schwierigkeiten haben, in ihren eigenen Bereichen den Überblick zu behalten"[4]. Eine der zentralen Empfehlungen war die Einrichtung von Forschungsdatenzentren bei den Statistischen Ämtern des Bundes und der Länder, der Deutschen Rentenversicherung Bund und der Bundesagentur für Arbeit. Die Wurzeln der Forschungsdatenzentren gehen allerdings weiter zurück: Bereits 1987 war auf Empfehlung des Wissenschaftsrates ein erstes Servicezentrum für amtliche Mikrodaten eingerichtet worden.[5] Die Empfehlung der KVI führt aus: "Forschungsdatenzentren bieten im Grundsatz Daten unterschiedlicher Datenbesitzer und Datenproduzenten an. Insbesondere sind sie auch nicht ausschließlich auf Daten der amtlichen Statistik begrenzt. Sie sollten auch besonders zu schützende und nicht hinreichend anonymisierbare Daten aus der wissenschaftlichen Forschung zugänglich machen."[4] Mit der Gründung des RatSWD und der Schaffung des Akkreditierungssystems wuchs die Zahl der FDZ beständig.
Eine Übersicht über die FDZ gibt ein jährlicher Tätigkeitsbericht des RatSWD[1]. Die ersten sechs Forschungsdatenzentren waren die FDZ der Statistischen Ämter des Bundes und der Länder, das German Microdata Lab bei GESIS – Leibniz-Institut für Sozialwissenschaften, das International Data Service Center am Forschungsinstitut zur Zukunft der Arbeit, das FDZ der Bundesagentur für Arbeit sowie jenes der Deutschen Rentenversicherung Bund.
Zugangs- und Bereitstellungsformen
Hauptgrund für die Einrichtung der Forschungsdatenzentren ist, dass sie für wissenschaftliche Zwecke den Zugang zu sensiblen Daten ermöglichen. Solche Daten können nicht als Open Data bereitgestellt werden, sondern unterliegen Beschränkungen rechtlicher (Urheberrecht, Datenschutz …) oder ethischer Natur. Damit ergibt sich oft die Notwendigkeit der Anonymisierung und Pseudonymisierung. Entsprechend ergeben sich verschiedene Zugangs- bzw. Bereitstellungsformen für die Daten: Public-Use-File, Scientific-Use-File, Datenfernverarbeitung, Remote Access, Gastwissenschaftlerarbeitsplatz.
Je nach Forschungsfrage können im Einzelfall unterschiedliche Zugangsformen zu denselben Daten nötig sein. So steht beispielsweise ein Scientific-Use-File des ALLBUS allen Wissenschaftlern zum Download zur Verfügung. Möchte man die Befragungsdaten aber beispielsweise regional mit Kontextinformationen zusammen analysieren (z. B. Einstellungen zu Migration mit Anzahl der Migranten in einer Region), so ist der Zugang über einen Gastwissenschaftlerarbeitsplatz nötig, da hierzu sensible Daten zum Region des Wohnortes der Befragten nötig sind.
Nutzung
Die Nutzung der Forschungsdaten aus den Forschungsdatenzentren wird in einem jährlichen Tätigkeitsbericht dokumentiert.[1] Für 2019 wurden demnach von 34 Forschungsdatenzentren 4.371 Datensätze bereitgestellt, die von 55.270 externen Datennutzenden nachgefragt worden waren. Es resultierten 2.359 Publikationen, die auf den angebotenen Datensätzen basieren.[1] Darüber hinaus werden auf Grundlage der Daten aus den Forschungsdatenzentren auch politische Entscheidungen informiert.[7]
International
Ähnliche Strukturen wie die Forschungsdatenzentren existieren auch in anderen Ländern, z. B. die Federal Statistical Research Data Centers. Sie gewähren Zugang zu den Mikrodaten der U.S. Bundesregierung und bestehen an 30 Standorten. Ebenso unterhalten die Centers for Disease Control and Prevention ein Forschungsdatenzentrum, das "für die Wahrung der Privatsphäre von Befragten, Studienteilnehmern oder Institutionen verantwortlich ist und gleichzeitig Zugang zu den Daten mit eingeschränkter Nutzungsmöglichkeit für statistische Zwecke gewährt."[8]
Das Canadian Research Data Centre Network (CRDCN) basiert auf einer Partnerschaft zwischen kanadischen Universitäten mit Statistics Canada und stellt vertrauliche Mikrodaten aus den Bereichen Soziales, Wirtschaft und Gesundheit in sicheren Computereinrichtungen an Universitätsstandorten im ganzen Land zur Verfügung.[9]
Im Vergleich europäischer Ländern habe sich Deutschland durch den Aufbau der Forschungsdatenzentren von einem "Schlusslicht" zu einem "innovativen Ideengeber" entwickelt.[7]
Weitere Entwicklungen
Bereits von der KVI war empfohlen worden, in den Forschungsdatenzentren verstärkt Fernzugriffe zu ermöglichen.[4] Dies ist, ebenso wie die Unterstützung der rechtlich eigenständigen Forschungsdatenzentren bei der Harmonisierung ihrer Prozesse (z. B. Verträge für den Datenzugang) seit Herbst 2020 Schwerpunkte der Arbeit von KonsortSWD im Rahmen der Nationalen Forschungsdateninfrastruktur (NFDI).[10] Darüber hinaus soll, wie der Wissenschaftsrat bereits 2012 empfohlen hat, "das Netzwerk der der Forschungsdatenzentren weiter ausgebaut werden, "zur Verbesserung der Speichermöglichkeiten und des Zugangs zu Forschungsdaten […] das Netz der Forschungsdaten- und Datenservicezentren ausgebaut werden" [11].
Weblinks
Einzelnachweise
- Rat für Sozial- und Wirtschaftsdaten (RatSWD): Tätigkeitsbericht 2019 der vom RatSWD akkreditierten Forschungsdatenzentren (FDZ). Berlin 2020, doi:10.17620/02671.56 (PDF).
- Rat für Informationsinfrastrukturen: Leistung aus Vielfalt. Empfehlungen zu Strukturen, Prozessen und Finanzierung des Forschungsdatenmanagements in Deutschland. Göttingen 3. Mai 2016 (rfii.de).
- Rat für Sozial- und Wirtschaftsdaten (RatSWD): Handreichung zu den Richtlinien zur Akkreditierung von Forschungsdatenzentren, zum Monitoring- und Evaluationsprozess und zum Beschwerdeverfahren. Berlin 2017, doi:10.17620/02671.4.
- Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik: Wege zu einer besseren informationellen Infrastruktur. Nomos Verlagsgesellschaft, Baden-Baden 2001, ISBN 3-7890-7388-1 (ratswd.de [PDF]).
- Hilmar Schneider, Christof Wolf: Die Datenservicezentren als Teil der informationellen Infrastruktur. In: Gabriele Rolf, Markus Zwick, Gert G. Wagner (Hrsg.): Fortschritte bei der informationellen Infrastruktur in Deutschland. Festschrift für Johann Hahlen zum 65. Geburtstag und Hans-Jürgen Krupp zum 75. Geburtstag. Nomos Verlagsgesellschaft, Baden-Baden 2008, ISBN 978-3-8329-3540-5, S. 236–249.
- Alle Datenzentren. Abgerufen am 16. März 2021.
- Stefan Bender, Ralf Himmelreicher, Sylvia Zühlke, Markus Zwick: ForschungsDatenZentren – Eine informationelle Infrastruktur mit erFreulichem Daten Zugang. In: Gabriele Rolf, Markus Zwick, Gert G. Wagner (Hrsg.): Fortschritte bei der informationellen Infrastruktur in Deutschland. Festschrift für Johann Hahlen zum 65. Geburtstag und Hans-Jürgen Krupp zum 75. Geburtstag. Nomos Verlagsgesellschaft, Baden-Baden 2008, ISBN 978-3-8329-3540-5, S. 147–158.
- CDC - National Center for Health Statistics: About the CRDCN. 2020, abgerufen am 10. Dezember 2020.
- Canadian Research Data Centre Network: Research Data Center (RDC). 2020, abgerufen am 9. Dezember 2020.
- KonsortSWD, auf forschungsdaten.info, abgerufen am 10. Januar 2021
- Wissenschaftsrat: Empfehlungen zur Weiterentwicklung der wissenschaftlichen Informationsinfrastrukturen in Deutschland bis 2020. Berlin 13. Juli 2012 (wissenschaftsrat.de [PDF]).