Direkt zum Inhalt

Recker, J., & Brislinger, E. (2019). Dateiorganisation in empirischen Forschungsprojekten. In U. Jensen, S. Netscher, & K. Weller (Eds.), Forschungsdatenmanagement sozialwissenschaftlicher Umfragedaten (pp. 81–96). Verlag Barbara Budrich. https://doi.org/10.3224/84742233

Zusammenfassung

Forschungsdaten bilden die Grundlage empirischer Forschungsprojekte in den Sozialwissenschaften und stehen damit im Fokus der Aufmerksamkeit der Wissenschaftlerinnen und Wissenschaftler. Jedoch entstehen in Projekten neben erhobenen Forschungsdaten typischerweise große Mengen an weiteren Dokumenten, die im Rahmen des Forschungsdatenmanagements Beachtung finden sollten. Hierzu gehören einerseits Dokumente wie Besprechungsprotokolle oder E-Mail-Kommunikationen, die den Projektverlauf und die Projektorganisation dokumentieren und so z.B. getroffene Entscheidungen oder die Aufgabenverteilungen und Verantwortlichkeiten nachvollziehbar machen. Andererseits fallen aber auch Materialien an, die dazu geeignet sind, Auskunft über Entstehung, Aufbereitung, Inhalt und Qualität der erhobenen oder genutzten Daten zu geben – z.B. Informationen zur Entstehung des Erhebungsinstruments, Paradaten über die Erhebungssituation, Syntaxdateien und Reports über die Datenaufbereitung. Diese Informationen tragen wesentlich dazu bei, den Forschungsprozess insgesamt nachvollziehbar zu machen. Es entsteht also im Projektverlauf eine Informationssammlung, die nicht nur im aktuellen Projektkontext, sondern auch darüber hinaus von Bedeutung ist. Zum Beispiel kann sie für die Primärforschenden eine wichtige Informationsquelle für nachfolgende Erhebungswellen darstellen. Aber auch für eine Nutzung der Daten durch Dritte zu Replikationszwecken oder zur Beantwortung neuer Forschungsfragen sind Teile dieser Informationssammlung unabdingbar, da sie Transparenz über den Forschungsprozess und insbesondere die Entstehung und Aufbereitung der Daten herstellen. Der Großteil dieser bis zum Projektende entstehenden Informationen durchläuft eine Vielzahl von Bearbeitungsschritten, die z.T. durch unterschiedliche Personen vorgenommen werden. So liegen Daten und Dokumente am Ende eines Projekts oft in mehreren Aufbereitungsstufen und Versionen vor. Ein Projektteam steht damit vor der Herausforderung, diese heterogenen Informationen so zu organisieren und bereitzustellen, dass sie für ihre jeweiligen Adressatinnen und Adressaten leicht auffindbar und zugreifbar sind. Gerade in kollaborativen Forschungsprojekten kann es schwierig sein, sicherzustellen, dass Informationen einfach identifizierbar und auffindbar sind, dass sie nachfolgende Arbeitsschritte zeitnah erreichen, dass sie nicht irrtümlich gelöscht oder überschrieben werden, aus Back-up-Routinen herausfallen oder aus technischen Gründen verloren gehen. Damit steigen mit der Komplexität des Projektworkflows und der Anzahl der interagierenden Beteiligten auch die Anforderungen an die Strukturierung der Informationen und die Organisation des Informationsflusses (vgl. Macías/Petrakos 2006: 4). Folgen diese nicht verbindlichen, im Projekt abgestimmten Leitlinien, führt dies häufig dazu, dass im Laufe der Arbeit immer wieder ad hoc Entscheidungen über die Organisation von Dateien getroffen werden, die nicht für alle Beteiligten transparent und nachvollziehbar sind und daher nicht selten zu Informationsverlusten führen. Dies zu vermeiden, ist Ziel eines systematischen Vorgehens bei der Organisation von Informationen (in Form von Dateien) und von Informationsflüssen in einem empirischen Forschungsprojekt. Ein solches Vorgehen trägt dazu bei, die Auffindbarkeit von Informationen zu verbessern und die Gefahr eines Verlustes von Daten oder relevanten Kontextinformationen zu minimieren. Darüber hinaus leisten transparente und gut strukturierte Arbeitsund Kommunikationsprozesse einen wichtigen Beitrag zur Erhöhung der Datenqualität: Sie verbessern die Zusammenarbeit der Beteiligten und helfen sicherzustellen, dass die erforderlichen Informationen zur richtigen Zeit und an der richtigen Stelle auffindbar und zugreifbar sind. Am ehesten kann dies erreicht werden, wenn sich die Organisation von Dateien unmittelbar an den im Projekt definierten Arbeitsprozessen und Informationsflüssen orientiert und diese abbildet. Die Grenzen zwischen genuinen Forschungsaktivitäten, Maßnahmen des Projektmanagements und des Datenmanagements verlaufen demzufolge teilweise fließend und eine eindeutige Zuordnung von Aktivitäten zu einem der drei Bereiche ist nicht immer möglich. Im Folgenden soll das Thema Dateiorganisation und Strukturierung von Informationen daher aus zwei Blickwinkeln betrachtet werden: • Auf der Prozessebene stellt sich die Frage, wie Informationsflüsse über den gesamten Projektverlauf so ausgestaltet werden können, dass Informationen (z.B. Daten, Dokumentationen, Prozessinformationen) sicher dort verfügbar sind, wo sie benötigt werden. Dies erfordert zum einen das Wissen darüber, welche Daten, Dokumentationen sowie Prozessinformationen im Projektverlauf entstehen und von wem sie wann und in welcher Form genutzt bzw. weiter bearbeitet werden. Sollen die Projektergebnisse Dritten zur Nachnutzung zur Verfügung gestellt werden, erfordert es zum anderen die Verknüpfung der Forschungsdaten mit allen Kontextinformationen, die für das Verständnis und die Nutzbarkeit der Daten über die Projektlaufzeit hinaus von Bedeutung sind. • Auf der Dateiebene gilt es im Rahmen des Forschungsdatenmanagements Organisationsprinzipien zu finden, mit Hilfe derer die im Projekt anfallenden Informationen sinnvoll geordnet werden können – sei es in einer lokalen oder webbasierten Verzeichnisstruktur oder auch in einer kollaborativen Arbeitsumgebung. Vor allem in Forschungsprojekten mit regional verteilten Partnern werden zunehmend Onlineportale genutzt, die einen geschützten virtuellen Arbeitsraum für das Daten- und Projektmanagement sowie die Kommunikation und den Informationstransfer zwischen den beteiligten Forscherinnen und Forschern bieten. Die im Folgenden vorgestellten Empfehlungen zur Organisation von Dateien und Informationsflüssen lassen sich sowohl in verzeichnisbasierten Strukturen als auch in Online-Portalen umsetzen. Im Abschnitt 5.1 soll zunächst aufgezeigt werden, wie Modelle, die den Lebenszyklus von Forschungsdaten beschreiben, genutzt werden können, um die im Projekt anfallenden Informationen auf der Datei- und der Prozessebene zu strukturieren. Diese theoretischen Überlegungen werden anschließend mit Hilfe eines Beispielszenarios konkretisiert (5.2). Erläuterungen und Hinweise zu allgemeinen Maßnahmen der Dateiorganisation – von der Dateibenennung über die Versionskontrolle bis hin zu Zugangsrechten und Back-up-Strategien – schließen das Kapitel ab (5.3).

https://doi.org/10.3224/84742233