Direkt zum Inhalt

Rat für Sozial- und Wirtschaftsdaten (RatSWD). (2019). Big Data in den Sozial-, Verhaltens- und Wirtschaftswissenschaften Datenzugang und Forschungsdatenmanagement Mit Gutachten „Web Scraping in der unabhängigen wissenschaftlichen Forschung“ (Output Series, 4 (6), p. 52). Rat für Sozial- und Wirtschaftsdaten (RatSWD). https://doi.org/10.17620/02671.39

Zusammenfassung

Die global gespeicherte Menge an Daten wächst exponentiell. Nach der im November 2018 veröffentlichten Studie „Data Age 2025 – The Digitization of the World“ (Reinsel/Gantz/Rydning 2018) wird ein Wachstum des globalen Datenvolumens von 33 Zettabytes (ZB) in 2018 auf 175 ZB in 2025 erwartet. In den Sozial-, Verhaltens- und Wirtschaftswissenschaften besteht ein zunehmendes Interesse an der Nutzung dieser im Rahmen der zunehmenden Digitalisierung produzierten Daten, die häufig auch als ‚Big Data‘ bezeichnet werden. Dieses Interesse begründet sich u.a. darin, dass sich diese Daten durch große Fallzahlen, die Möglichkeit der Echtzeitanalyse, nicht-reaktiven Erhebungsverfahren und die Möglichkeit der Beobachtung der Interaktion zwischen Menschen auszeichnen. Vor diesem Hintergrund sieht der Rat für Sozial- und Wirtschaftsdaten (RatSWD) die unabweisbare Notwendigkeit, das Potenzial dieser verfügbaren Daten für die wissenschaftliche Forschung systematisch zu erschließen. Es gilt Restriktionen zu überwinden, mit welchen sich die heutige Praxis der Forschung mit Big Data-Quellen in Deutschland sowohl de jure als auch de facto konfrontiert sieht. Forschenden, denen Zugang zu Big Data-Quellen von Unternehmen gewährt wurde, wird häufig der Zugang zu unternehmensstrategisch bedeutenden Variablen oder Beobachtungen verwehrt. Sie können die verwendeten Daten oftmals nicht an andere Forschende weitergeben und unterliegen dem Risiko, dass der Datenzugang vor Abschluss eines Forschungsprojekts einseitig aufgekündigt wird. Darüber hinaus können potenzielle Interessenkonflikte oder Einschränkungen der Publikation von Forschungsergebnissen resultieren. Des Weiteren ergeben sich erhebliche neue Anforderungen bei der Aufbereitung der Daten, die bei Befragungsdaten oder administrativen Daten in dieser Form nicht auftreten. Daher sollten sich Forschende bei der Verwendung von Big Data genauestens mit dem datengenerierenden Prozess und den zur Datengewinnung verwendeten Algorithmen auseinandersetzen. ►►Darüber hinaus sollten sich Nutzende von Big Data-Quellen umfassend mit den rechtlichen Bedingungen der Verwendung dieser Daten befassen. Werden derartige Daten bspw. unter Verwendung eines Application Programming Interface (API) gesammelt, müssen sich die Wissenschaftlerinnen und Wissenschaftler vor der Nutzung der Daten mit den Terms of Service für die Nutzung der API auseinandersetzen. ► ►Viele Forschende nutzen Web Scraping, um an Daten aus dem Internet zu gelangen. In der Erkenntnis, dass mit der Verwendung dieser Methode häufig rechtliche Unklarheiten einhergehen, hat der RatSWD ein Rechtsgutachten eingeholt. Mit diesem werden insbesondere mit Web Scraping zusammenhängende Rechtsfragen des Datenzugangs, der Datennutzung und Datenarchivierung aufgearbeitet. Der RatSWD will damit einen Beitrag leisten, die wissenschaftliche Forschung mit Big Data-Quellen für die Forschenden rechtssicherer zu machen. ►►Der RatSWD empfiehlt zudem, zur Stärkung der deutschen Forschungsinfrastruktur für die Sozial-, Verhaltens- und Wirtschaftswissenschaften eine unabhängige Forschungseinrichtung zu etablieren oder eine bestehende mit dem Auftrag zu betrauen, treuhänderisch einen standardisierten Zugang zu anonymisierten (Mikro-)Daten aus öffentlichen und privaten Big Data-Quellen bereitzustellen. Die dazu erforderlichen Infrastrukturen könnten ein zentrales Thema für die sich derzeit dynamisch entwickelnde Nationale Forschungsdateninfrastruktur (NFDI) sein. Schließlich sollte Open Data insbesondere von öffentlichen Einrichtungen mit Blick auf ihre potenzielle Nutzung grundsätzlich in maschinenlesbarer Form zur Verfügung gestellt werden.

https://doi.org/10.17620/02671.39