Forschungsdaten
Management, Infrastructures and Moduls
In Zusammenarbeit mit dem ZIMT und der Universitätsbibliothek stellt das Teilprojekt INF eine nachhaltige Forschungsdateninfrastruktur für Forschende am SFB 1187 bereit und arbeitet an geeigneten Lösungen für das Forschungsdatenmanagement. Der Begriff Forschungsdatenmanagement bezieht sich auf alle im Zusammenhang mit Forschungsdaten durchzuführenden Aktivitäten, die sich entlang des folgenden Datenlebenszyklus ergeben:
(source: https://www.forschungsdaten.info/themen/planen-und-strukturieren/datenlebenszyklus/)
Das ZIMT setzt sich für die Bereitstellung nachhaltiger und qualitätsgesicherter Forschungsdaten ein und arbeitet an Leitlinien für das Forschungsdatenmanagement sowie an der Bereitstellung von Dienstleistungen und Beratungsstrukturen. Das ZIMT arbeitet eng mit Partner*innen zusammen, die bereits Infrastrukturen für Nutzerbedürfnisse in den digitalen Geistes- und Sozialwissenschaften anbieten (z.B. DARIAH, RADAR, RDA, nestor).
Research Tech Lab
Das Research Tech Lab, koordiniert von INF und A05, ist ein offenes Forum für den Austausch aller Mitglieder des SFB 1187. Im Research Tech Lab erforschen, diskutieren und gestalten wir digitale Forschungsansätze, Werkzeuge und Instrumente. Die Grundannahme des Research Tech Labs ist, dass IT-Design im alltäglichen Gebrauch stattfindet und die kontinuierliche Aneignung von (digitalen) Methoden, Werkzeugen, Instrumenten und Infrastrukturen beinhaltet. Design ist ein wichtiger Bestandteil der täglichen Forschungspraxis. Das Research Tech Lab ruft daher zur Beteiligung aller Teilprojekte auf. Basierend auf einem „Living Lab“-Ansatz erhalten die Teilprojekte die Möglichkeit, ihre Erfahrungen mit Forschungswerkzeugen und -infrastrukturen zu diskutieren, zu analysieren und zu reflektieren. Zusätzlicher Raum für weiteren Austausch und Diskussion wird online im SFB-Intranet geboten.
Beobachtungsstellen für soziale Medien
Die Social Media Observatories bieten eine Plattform für Studierende und Forschende aller Fachrichtungen, die an der Forschung mit oder über soziale Medien interessiert sind. Die vom INF entwickelten und betreuten Social Media Observatories unterstützen die Datenerhebung und -analyse auf und innerhalb von Social Media Plattformen, darunter Facebook, X (ehemals Twitter), Instagram, YouTube und Google+. Besonderes Augenmerk bei der Erweiterung der Social Media Observatories liegt auf der Unterstützung der Sammlung nicht nur von öffentlichen Daten, sondern auch von halb- und nicht-öffentlichen Social Media Daten. Im Rahmen dieser Bemühungen berät das INF einzelne Projekte bei der Bewertung, Auswahl, Anwendung und Erweiterung bestehender Tools und Dienste zur Überwachung und Analyse von Social-Media-Daten.
Mobile Datenerhebung, Mobile Ethnographie
Zur Unterstützung von Studien zum mobilen Nutzungsverhalten in natürlichen Kontexten entwickelt und bietet das INF verschiedene technische Tools auf Basis moderner mobiler Endgeräte (z.B. Smartphones, Tablets) an. Die Tools zur mobilen Datenerhebung ermöglichen die Erhebung von verlässlichen Daten über Nutzungskontexte (z.B. durch Screenshots/Screencasts, Audioaufnahmen, GPS-Informationen, Touch-Events, Bewegungs- und Lagesensoren, Informationen über genutzte Apps und Nutzungsdauer). Die Weiterentwicklung der Tools zielt vor allem darauf ab, Nutzungskontexte geräteübergreifend erfassen zu können, was z.B. die Erfassung von Kollokationsbeziehungen oder die Verknüpfung von mobilen Nutzungsdaten mit weiterem ethnographischem Material ermöglicht.
Module und Plattformen
Um die gemeinsame Nutzung und Wiederverwendung von Daten zu gewährleisten und zu erleichtern, arbeitet das INF-Projekt an der Bereitstellung einer Infrastruktur zur langfristigen Datenspeicherung, um den gesamten Forschungsprozess zu verbessern und die Daten besser zu organisieren und zugänglich zu machen. Dementsprechend wird ein D-Space-basiertes Forschungsdaten-Repositorium namens FoDaSi (Forschungsdaten-Repositorium der Universität Siegen) zur Verfügung gestellt. Dieses Repositorium ist im E-Science-Service zugänglich und steht allen Forschenden der Universität Siegen kostenlos zur Verfügung. Darüber hinaus bietet das INF-Forschungsdatenmanagement in Zusammenarbeit mit dem E-Science-Service Unterstützung und Beratung bei der Nutzung neuer technologischer Möglichkeiten für die gesamte Publikations- und Forschungsprozessphase.
Wie im obigen Diagramm dargestellt, zielen die entwickelten Module darauf ab, eine integrierte Plattform zu schaffen, auf der verschiedene Plattformen und Tools mit unterschiedlichen Funktionen mit dem Ziel der Teamkommunikation, der gemeinsamen Datennutzung, der kollaborativen Arbeit und der Datenarchivierung zusammenkommen. Die Cloud-Speicherplattform Sciebo wird nur für die kollaborative Arbeit und die gemeinsame Nutzung von Daten verwendet, ist aber nicht für die langfristige Speicherung geeignet. Auch unterstützt sie nicht die Möglichkeit, Forschungsdaten zu beschreiben. Durch die Nutzung der Social-Media-ähnlichen Kommunikationsplattform HumHub [genannt Research Hub], die die Möglichkeit bietet, neue Module zu entwickeln und zu integrieren, können Forschende sehen, was in Sciebo geteilt wurde – mittels das OnlineDrives-Modul – und die in Sciebo gespeicherten Daten beschreiben – mittels das Metadaten-Modul. Das Metadaten-Modul wurde durch die Erweiterung des OnlineDrives-Moduls entwickelt, in dem Forschende eine Beschreibung zu ihren Daten hinzufügen können. Die Datenbeschreibung hilft dabei, die Forschungsdaten für die Wiederverwendung auffindbar zu machen. Das Endziel der Integration ist es, den Prozess der Archivierung von Forschungsdaten in einem Repository zu erleichtern, da die Verwaltung von Forschungsdaten an sich eine zusätzliche Arbeitsbelastung für Forschende darstellt.
In FoDaSi können Forschende ihre wertvollen Forschungsdaten jeglicher Art (Datensätze, Aufzeichnungen, Artikel, Arbeitspapiere, Preprints, technische Berichte, Konferenzbeiträge usw.) in verschiedenen digitalen Formaten archivieren. Es unterstützt verschiedene fachspezifische Metadaten zur Indizierung der Forschungsdaten, und die eindeutige Identifizierung der Forschungsdaten erfolgt über persistente Identifikatoren (DOI).
Data Story
Testfälle
Um die Bedürfnisse der verschiedenen Disziplinen zu verstehen und ein Modul zu entwickeln, das den Anforderungen aller Projekte entspricht, wurden mit mehreren Teilprojekten intensive, bedarfsorientierte Gespräche geführt, gemeinsame Datensitzungen durchgeführt und ein Pilottest im INF-Projekt durchgeführt, um die Benutzbarkeit der Module zu prüfen, weitere Anforderungen zu sammeln und mögliche Fehler zu beheben.
Veröffentlichungen
Curdt, C., V. Hess, A. López, B. Magrean, D. Rudolph und J. Vompras. 2017. „Herausforderung Forschungsdatenmanagement – Unterstützung der Hochschulen durch eine einrichtungsübergreifende Kooperation in NRW“. E-Science-Tage 2017: Forschungsdaten managen. Heidelberg.
Fries, M. und T. Ludwig. 2022. „‚Why Are the Sales Forecasts so Low?‘ Socio-Technical Challenges of Using Machine Learning for Forecasting Sales in a Bakery“. Computer Supported Cooperative Work (CSCW). DOI: 10.1007/s10606-022-09458-z.
Jasche, F., S. Hoffmann, T. Ludwig und V. Wulf. 2021. „Comparison of Different Types of Augmented Reality Visualizations for Instructions“. Proceedings of the 2021 CHI Conference on Human Factors in Computing Systems. CHI ’21, 1-13. New York, NY, USA: Association for Computing Machinery. DOI: 10.1145/3411764.3445724.
Ludwig, T., V. Pipek und Peter Tolmie. 2018. „Designing for Collaborative Infrastructuring: Supporting Resonance Activities“. Proceedings of the ACM on Human-Computer Interaction 2 (CSCW), Artikel 113. DOI: 10.1145/3274382.
Misganaw, A. T. und S. Roller. 2020. „PlattForm: Parallel Spoken Corpus of Middle West German Dialects with Web-Based Interface“. Machine Learning, Optimization, and Data Science: 6th International Conference, LOD 2020, Siena, Italy, July 19–23, 2020, Revised Selected Papers, Part II, 494–503. Berlin, Heidelberg: Springer-Verlag. DOI: 10.1007/978-3-030-64580-9_41.
Mosconi, G., A. F. Pinatti de Carvalho, H. A. Syed, D. Randall, H. Karasti und V. Pipek. 2023. „Fostering Research Data Management in Collaborative Research Contexts: Lessons learnt from an ‚Embedded‘ Evaluation of ‚Data Story‘“. Journal of Computer Supported Cooperative Work (CSCW). DOI: 10.21203/rs.3.rs-2255943/
Mosconi, G., D. Randall, H. Karasti, S. Aljuneidi, T. Yu, P. Tolmie und V. Pipek. 2022. „Designing a Data Story: A Storytelling Approach to Curation, Sharing and Data Reuse in Support of Ethnographically-Driven Research“. Proceedings ACM Human Computer Interaction, 6, CSCW2, Article 289. DOI: 10.1145/3555180.
Mosconi, G., H. Karasti, D. Randall und V. Pipek. 2022. „Designing a Data Story: An Innovative Approach for the Selective Care of Qualitative and Ethnographic Data“. In Interrogating Datafication: Towards a Praxeology of Data, herausgegeben von M. Burkhardt, D. van Geenen, C. Gerlitz, S. Hind, T. Kaerlein, D. Lämmerhirt und A. Volmar, 207-230. Bielefeld: transcript.
Mosconi, G., Q. Li, D. Randall, H. Karasti, P. Tolmie, J. Barutzky, M. Korn und V. Pipek. 2019. „Three Gaps in Opening Science“. Computer Supported Cooperative Work 28(3–4): 749–789. DOI: 10.1007/S10606-019-09354-Z.
Strauch, A. und V. Hess. 2019. „Von der Produktion bis zur Langzeitarchivierung qualitativer Forschungsdaten Im SFB 1187“. Bibliothek Forschung und Praxis 43(1): 105–109. DOI: 10.1515/bfp-2019-2005.